Ini Bukan Sekadar Masalah Media Sosial - Bagaimana Mesin Pencari Menyebarkan Kesalahan MaklumatEnjin carian sering menghasilkan gabungan maklumat dan maklumat yang salah. Crispin la valiente / Moment melalui Getty Images, CC BY-ND

Enjin carian adalah salah satu pintu masuk utama masyarakat untuk maklumat dan orang, tetapi juga merupakan jalan untuk maklumat yang salah. Sama seperti algoritma media sosial yang bermasalah, enjin carian belajar untuk melayani anda apa yang anda dan orang lain telah klik sebelumnya. Kerana orang tertarik dengan sensasi, tarian antara algoritma dan sifat manusia ini dapat mendorong penyebaran maklumat yang salah.

Syarikat mesin pencari, seperti kebanyakan perkhidmatan dalam talian, menghasilkan wang bukan hanya dengan menjual iklan, tetapi juga dengan mengesan pengguna dan menjual data mereka melalui pembidaan masa nyata di atasnya. Orang sering kali tersalah maklumat kerana keinginan mereka untuk berita sensasi dan menghiburkan serta maklumat yang kontroversial atau mengesahkan pandangan mereka. Satu kajian mendapati bahawa video YouTube yang lebih popular mengenai diabetes adalah kurang mempunyai maklumat yang sah dari segi perubatan daripada video yang kurang popular, misalnya.

Enjin carian berdasarkan iklan, seperti platform media sosial, dirancang untuk memberi ganjaran apabila mengklik pautan yang menarik kerana ia membantu syarikat carian meningkatkan metrik perniagaan mereka. Sebagai penyelidik yang mengkaji sistem carian dan cadangan, Saya dan rakan-rakan saya menunjukkan bahawa kombinasi berbahaya dari motif keuntungan korporat dan kerentanan individu menjadikan masalah sukar untuk diselesaikan.

Bagaimana hasil carian salah

Apabila anda mengklik hasil carian, algoritma carian mengetahui bahawa pautan yang anda klik relevan untuk pertanyaan carian anda. Ini dipanggil maklum balas perkaitan. Maklum balas ini membantu mesin pencari memberikan penekanan yang lebih tinggi kepada pautan tersebut untuk pertanyaan tersebut pada masa akan datang. Sekiranya cukup banyak orang yang mengklik pada pautan itu, sehingga memberikan maklum balas yang relevan, laman web itu akan muncul lebih tinggi dalam hasil carian untuk itu dan pertanyaan yang berkaitan.


grafik langganan dalaman


Manusia adalah lebih cenderung untuk mengklik pada pautan yang dipaparkan lebih tinggi pada senarai hasil carian. Ini mewujudkan gelung maklum balas positif - semakin tinggi laman web muncul, semakin banyak klik, dan seterusnya menjadikan laman web itu bergerak lebih tinggi atau menjadikannya lebih tinggi. Teknik pengoptimuman mesin pencari menggunakan pengetahuan ini untuk meningkatkan keterlihatan laman web.

Terdapat dua aspek untuk masalah salah maklumat ini: bagaimana algoritma carian dinilai dan bagaimana manusia bertindak balas terhadap tajuk utama, tajuk dan coretan. Enjin carian, seperti kebanyakan perkhidmatan dalam talian, dinilai menggunakan pelbagai metrik, salah satunya adalah keterlibatan pengguna. Kepentingan syarikat enjin carian adalah untuk memberi anda perkara yang anda mahu baca, tonton atau klik. Oleh itu, sebagai mesin pencari atau sistem cadangan mana pun membuat senarai item untuk dikemukakan, ia mengira kemungkinan anda akan mengklik item tersebut.

Secara tradisional, ini bertujuan untuk mengeluarkan maklumat yang paling relevan. Namun, tanggapan relevan menjadi kabur kerana orang telah menggunakan carian untuk mencari hasil carian yang menghiburkan serta maklumat yang benar-benar relevan.

Bayangkan anda sedang mencari penala piano. Sekiranya seseorang menunjukkan kepada anda video kucing bermain piano, adakah anda akan mengkliknya? Banyak yang akan melakukannya, walaupun itu tidak ada kaitan dengan penalaan piano. Perkhidmatan carian merasa disahkan dengan maklum balas relevan positif dan mengetahui bahawa tidak apa-apa menunjukkan kucing bermain piano ketika orang mencari penala piano.

Sebenarnya, ia lebih baik daripada menunjukkan hasil yang relevan dalam banyak kes. Orang suka menonton video kucing lucu, dan sistem carian mendapat lebih banyak klik dan keterlibatan pengguna.

Ini mungkin kelihatan tidak berbahaya. Jadi bagaimana jika orang terganggu dari semasa ke semasa dan mengklik hasil yang tidak berkaitan dengan pertanyaan carian? Masalahnya ialah orang tertarik dengan gambar dan tajuk utama yang mengasyikkan. Mereka cenderung mengklik teori konspirasi dan berita sensasi, bukan hanya kucing yang bermain piano, dan melakukannya lebih daripada mengklik berita sebenar atau maklumat yang berkaitan.

Labah-labah yang terkenal tetapi palsu

Pada tahun 2018, pencarian "labah-labah baru yang mematikan" melonjak di Google berikutan catatan Facebook yang mendakwa labah-labah mematikan baru membunuh beberapa orang di beberapa negeri. Saya dan rakan sekerja menganalisis 100 keputusan teratas dari carian Google untuk "labah-labah baru yang mematikan" pada minggu pertama pertanyaan yang sedang tren ini.

Ini Bukan Sekadar Masalah Media Sosial - Bagaimana Mesin Pencari Menyebarkan Kesalahan MaklumatDua halaman pertama hasil carian Google untuk 'labah-labah baru yang mematikan' pada bulan Ogos 2018 (kawasan berlorek) berkaitan dengan siaran berita palsu asal mengenai perkara itu, bukan menyingkirkan atau maklumat fakta. Chirag Shah, CC BY-ND

Ternyata kisah ini palsu, tetapi orang yang mencarinya sebahagian besarnya terdedah kepada maklumat yang salah berkaitan dengan siaran palsu yang asal. Ketika orang terus mengklik dan berkongsi maklumat yang salah, Google terus melayan halaman tersebut di bahagian atas hasil carian.

Corak kisah mendebarkan dan tidak dapat disahkan ini muncul dan orang yang mengkliknya terus berlanjutan, dengan orang-orang nampaknya tidak peduli dengan kebenaran atau percaya bahawa jika perkhidmatan yang dipercayai seperti Carian Google menunjukkan kisah-kisah ini kepada mereka, maka kisah-kisah itu mesti benar. Baru-baru ini, a laporan yang tidak dibuktikan mendakwa China membiarkan coronavirus bocor dari makmal mendapat tarikan pada mesin pencari kerana kitaran jahat ini.

Lihat maklumat yang salah

Untuk menguji seberapa baik orang membezakan antara maklumat yang tepat dan maklumat yang salah, kami merancang permainan sederhana yang disebut "Google Atau Tidak. " Permainan dalam talian ini menunjukkan dua set hasil untuk pertanyaan yang sama. Objektifnya mudah - pilih set yang boleh dipercayai, boleh dipercayai atau paling relevan.

Ini Bukan Sekadar Masalah Media Sosial - Bagaimana Mesin Pencari Menyebarkan Kesalahan MaklumatDalam ujian, kira-kira separuh masa orang tidak dapat membezakan antara hasil carian Google yang mengandungi maklumat yang salah dan hasil yang hanya boleh dipercayai. Chirag Shah, CC BY-ND

Salah satu daripada dua set ini mempunyai satu atau dua hasil yang disahkan dan dilabel sebagai maklumat yang salah atau cerita yang dibongkar. Kami menjadikan permainan ini tersedia untuk umum dan diiklankan melalui pelbagai saluran media sosial. Secara keseluruhan, kami mengumpulkan 2,100 respons dari lebih 30 negara.

Semasa kami menganalisis hasilnya, kami mendapati bahawa kira-kira separuh masa orang salah memilih set yang boleh dipercayai dengan satu atau dua hasil maklumat yang salah. Eksperimen kami dengan beratus-ratus pengguna lain melalui banyak lelaran telah menghasilkan penemuan yang serupa. Dengan kata lain, kira-kira separuh masa orang memilih hasil yang mengandungi teori konspirasi dan berita palsu. Oleh kerana semakin banyak orang memilih hasil yang tidak tepat dan mengelirukan ini, enjin carian mengetahui bahawa itulah yang diinginkan orang.

Mengenai persoalan mengenai peraturan Big Tech dan peraturan diri, penting bagi orang untuk memahami bagaimana sistem ini berfungsi dan bagaimana mereka menghasilkan wang. Jika tidak, ekonomi pasaran dan kecenderungan semula jadi masyarakat untuk tertarik pada hubungan yang menarik akan menjadikan kitaran ganas itu berterusan.

Tentang Pengarang

Chirag Shah, Profesor Madya Sains Maklumat, Universiti Washington

Artikel ini diterbitkan semula daripada Perbualan di bawah lesen Creative Commons. Membaca artikel asal.