talian berbaring 6 29

Terdapat tiga perkara yang anda boleh pasti dalam hidup: kematian, cukai - dan berbohong. Yang terakhir ini nampaknya telah diterbitkan oleh referendum Brexit baru-baru ini di UK, dengan a nombor daripada Tinggalkan kempen janji mencari lebih banyak seperti porkie pies daripada kebenaran yang kukuh.

Tetapi dari pengiklanan internet, aplikasi visa dan artikel akademik ke blog politik, tuntutan insurans dan profil kencan, terdapat banyak tempat yang boleh kita katakan palsu. Jadi, bagaimanakah seseorang boleh merenung ini secara online? Well, Stephan Ludwig dari University of Westminster, Ko de Ruyter dari Cass Business School City University London, Mike Friedman dari Universiti Katolik Louvain, dan anda benar-benar telah membangunkan pengesan berbohong digital - dan ia dapat mengungkap sejumlah besar ketidaktahuan internet .

Dalam penyelidikan baru kami, kami menggunakan isyarat linguistik untuk membandingkan puluhan ribu e-mel yang telah dikenal pasti sebagai kebohongan dengan mereka yang dikenali sebagai benar. Dan dari perbandingan ini, kami mengembangkan algoritma analisis teks yang dapat mengesan penipuan. Ia berfungsi pada tiga peringkat.

1. Penggunaan perkataan

Carian kata kunci boleh menjadi pendekatan yang munasabah ketika berurusan dengan sejumlah besar data digital. Oleh itu, kita mula-mula menemui perbezaan penggunaan kata antara kedua-dua set dokumen. Perbezaan ini mengenalpasti teks yang mungkin mengandungi dusta. Kami mendapati bahawa individu yang berbohong pada umumnya menggunakan kata ganti peribadi yang lebih sedikit, seperti saya, anda, dan dia, dan lebih banyak kata sifat, seperti cemerlang, tidak berani, dan luhur. Mereka juga menggunakan kata ganti tunggal yang pertama, seperti saya, saya, saya, dengan kata-kata percanggahan, seperti yang boleh, boleh, dan juga lebih banyak kata ganti orang kedua (anda, anda) dengan kata-kata pencapaian (memperoleh, wira , menang).

Kata ganti diri yang lebih sedikit menunjukkan percubaan pengarang untuk memisahkan diri mereka dari kata-kata mereka, sementara menggunakan lebih banyak kata sifat adalah percubaan untuk mengalihkan perhatian dari kebohongan melalui keterangan yang berlebihan. Lebih kurang kata ganti perkauman tunggal yang digabungkan dengan kata-kata percanggahan menunjukkan kekurangan kehalusan dan imej diri yang positif, manakala kata ganti kedua yang digabungkan dengan kata-kata pencapaian menandakan percubaan untuk memuji penerima. Oleh itu, kami merangkumi kombinasi istilah carian dalam algoritma kami.


grafik langganan dalaman


2. Pemerhatian struktur

Satu lagi bahagian penyelesaian terletak dalam menganalisis varians kata-kata proses kognitif, seperti sebab, kerana, tahu dan sepatutnya - dan kami mengenal pasti hubungan antara kata-kata struktur dan kebohongan.

Pembohong tidak boleh menjana e-mel yang menipu dari ingatan sebenar supaya mereka mengelakkan spontan untuk mengelakkan pengesanan. Itu tidak bermakna bahawa pembohong menggunakan lebih banyak kata-kata proses kognitif secara keseluruhan daripada orang yang mengatakan kebenaran, tetapi mereka memasukkan kata-kata ini lebih konsisten. Sebagai contoh, mereka cenderung menyambung setiap ayat ke depan - "kita tahu ini berlaku kerana ini, kerana ini sepatutnya berlaku". Algoritma kami mengesan penggunaan perkataan proses dalam komunikasi.

3. Pendekatan silang e-mel

Kami juga mengkaji cara pengirim e-mel mengubah gaya linguistik mereka semasa bertukar-tukar beberapa e-mel dengan orang lain. Bahagian kajian ini mendedahkan bahawa apabila pertukaran berterusan, lebih banyak penghantar cenderung menggunakan fungsi perkataan yang digunakan oleh penerima.

Fungsi perkataan adalah kata-kata yang menyumbang kepada sintaks, atau struktur, dan sebaliknya makna ayat - misalnya, am, kepada. Dan pengirim menyemak semula gaya linguistik mesej mereka untuk dipadankan dengan penerima. Akibatnya, algoritma kami mengenal pasti dan mengumpul padanan sedemikian.

Aplikasi yang menarik

Pengawas pengguna boleh menggunakan teknologi ini untuk menetapkan skor "mungkin berbohong" kepada iklan yang bersifat meragukan. Syarikat keselamatan dan pasukan sempadan negara boleh menggunakan algoritma untuk menilai dokumen, seperti permohonan visa dan kad pendaratan, untuk memantau pematuhan dengan lebih baik peraturan akses dan kemasukan. Setiausaha jawatankuasa peperiksaan pendidikan tinggi dan editor jurnal akademik boleh meningkatkan alat pemeriksaan mereka untuk memeriksa secara automatik tesis pelajar dan artikel akademik untuk plagiarisme.

Malah, aplikasi yang berpotensi terus berjalan. Blog politik berjaya mengawasi interaksi media sosial mereka untuk anomali tekstual, sementara laman temu janji dan kajian boleh mengklasifikasikan mesej yang diserahkan oleh pengguna berdasarkan skor "mungkin berbohong" mereka. Syarikat insurans boleh memanfaatkan masa dan sumber mereka yang lebih baik untuk pengauditan tuntutan. Akauntan, penasihat cukai dan pakar forensik boleh menyiasat penyata kewangan dan tuntutan cukai dan mencari senjata menipu melalui algoritma kami.

Manusia adalah tidak baik kerana secara sedar mengesan penipuan. Malah, ketepatan manusia ketika datang untuk bercakap dusta hanya 54%, tidak lebih baik daripada peluang. Sementara itu, pengesan pembohongan digital kami adalah tepat 70%. Ia boleh digunakan untuk memerangi penipuan di mana sahaja ia berlaku dalam kandungan berkomputer dan apabila teknologi berkembang, amaran Pinocchio boleh diautomatik sepenuhnya dan ketepatannya akan meningkat lebih jauh lagi. Sama seperti hidung Pinocchio refleksif menandakan kepalsuan, begitu juga pengesan bohong digital kami. Fibbers berhati-hati.

Tentang Pengarang

PerbualanTom van Laer, Pensyarah Kanan dalam Pemasaran, City University London

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.

Buku-buku yang berkaitan

at InnerSelf Market dan Amazon