gembira atau sedih 5 28

Fikirkan tentang apa yang anda kongsi dengan rakan anda di Facebook hari ini. Adakah perasaan "tekanan" atau "kegagalan", atau mungkin "kegembiraan", "cinta" atau "keseronokan"? Setiap kali kami menyiarkannya di media sosial, kami meninggalkan kesan perasaan kami. Perbualan

Emosi kita adalah komoditi yang berharga, dan banyak syarikat sedang membangunkan alat automatik untuk mengenali mereka dalam proses yang dikenali sebagai analisis sentimen.

Baru-baru ini, laporan bocor mendedahkan bahawa Facebook boleh mengenal pasti apabila orang muda merasa lemah, walaupun syarikat itu menegaskan ia tidak menggunakan analisis untuk menyasarkan pengguna dengan pengiklanan. Facebook juga memohon maaf dalam 2014 untuk a eksperimen pada "penularan emosi" di mana jawatan dengan sentimen "positif" atau "negatif" ditapis daripada suapan pengguna.

Jelas sekali, keupayaan untuk mengesan emosi daripada teks adalah sangat menarik bagi syarikat media sosial, serta pengiklan. Tetapi bagaimana analisis sentimen berfungsi, mengapa ia berguna dan apakah bahaya?

Bagaimanakah analisa sentimen berfungsi?

Walaupun butiran algoritma Facebook sendiri tidak diketahui secara umum, teknik analisis sentimen paling banyak terdapat dalam dua kategori: diselia atau tidak diselia.


grafik langganan dalaman


Kaedah yang diselia bergantung pada data berlabel. Dalam erti kata lain, ini adalah jawatan yang dikelaskan secara manual sebagai mengandungi sentimen positif atau negatif.

Kaedah statistik kemudian digunakan untuk melatih model untuk mengklasifikasikan jawatan baru secara automatik berdasarkan kehadiran kata-kata atau frasa yang telah dikenalpasti, misalnya "tertekan" atau "santai".

Kaedah yang tidak diselia, sebaliknya, sering bergantung pada membina kamus markah untuk perkataan yang berbeza. Satu kamus semacam itu yang dibangunkan oleh kolaborator saya meminta orang ramai memberikan skor kebahagiaan 1 kepada kebahagiaan 9 dengan kata-kata yang berbeza, dan kemudian mengadar hasilnya: "pelangi", misalnya, mencetak 8.06, sementara "tidak berguna" mendapat 2.52.

 

Sentimen keseluruhan frasa boleh dijaringkan dengan melihat semua perkataan dalam jawatan tersebut. Sebagai contoh, markah purata bagi jawatan "Momma saya selalu berkata 'hidup seperti kotak coklat'" adalah 6.02 di atas purata mengikut kamus ini, mencadangkan ia menyatakan perasaan positif.

Apakah analisa sentimen yang digunakan?

Analisis sentimen semakin digunakan oleh pemasar trend pengajian dan membuat cadangan produk.

Bayangkan telefon bimbit baru dibebaskan; analisis sentimen jawatan media sosial mengenai telefon boleh memberikan syarikat yang berharga, wawasan masa nyata tentang bagaimana ia berfungsi.

Terdapat aplikasi analisis sentimen yang lebih luas. Penyelidik baru-baru ini menjejaki sentimen Twitter Donald Trump sejak hari pertama kepresidenan 100 and bot yang dibina untuk meletakkan dagangan pasaran apabila dia tweet secara positif atau negatif mengenai syarikat tertentu.

Para saintis boleh mengesan trend emosi dalam teks lain juga. Sebagai contoh, kami menggunakan analisis sentimen untuk mengkaji arka emosi lebih daripada filem-filem 1,000 melalui paparan skrin mereka. Arka filem Frozen 2013 Disney ditunjukkan di bawah.

Arka emosi untuk filem Frozen.

Banyak filem menunjukkan corak yang sama: puncak biasa dan palung ketegangan dan pelepasan, diikuti dengan palung besar 80% dari jalan melalui filem (semua harapan hilang!), Sebelum resolusi akhir dan akhir yang bahagia. Menerapkan analisa yang sama dengan novel, kami menunjukkannya kebanyakan cerita mengikuti salah satu daripada enam bus cerita asas.

Kami masih tidak begitu baik dalam analisis sentimen

Memandangkan analisis sentimen sering bergantung kepada jawatan media sosial perlombongan, ia menimbulkan kebimbangan etika utama, dan perdebatan ini hanya bermula. Namun sifat bahasa dan makna yang kompleks menjadikannya mudah untuk dijumpai kesalahan.

Ambil frasa, "Semoga pasukan itu bersamamu", yang memberi markah 5.35 menggunakan analisis kamus kami. Untuk mana-mana peminat Star Wars, ia sudah tentu merupakan frasa yang sangat positif, tetapi ia menjaringkan sederhana dalam ujian kami kerana perkataan "force" dinilai 4.0 di bawah purata.

Ini difahami apabila menilai perkataan ini secara berasingan, tetapi dalam konteksnya ia kurang masuk akal.

Oleh itu, sesetengah skeptisisme keabsahan keupayaan analisis sentimen Facebook adalah wajar. Secara keseluruhannya, yang menggambarkan sesuatu sebagai "sakit sepenuhnya" di Facebook, frasa sokongan kolokal, boleh membawa kepada keadaan emosi individu yang salah dikelaskan.

Untuk memahami apabila analisis sentimen tidak berfungsi dan tidak berfungsi, adalah penting untuk memeriksa kata-kata yang mendorong keputusan tertentu.

Untuk melakukan ini, kita menggunakan "peralihan perkataan"Rajah, seperti yang di bawah untuk Frozen. Ini menunjukkan kata-kata yang menjadikan klimaks dari layar senja daripada akhir yang bahagia: lebih banyak rujukan kepada "kesedihan" dan "ketakutan", tetapi pelik, lebih "cantik".

Plot membandingkan klimaks Frozen kepada akhir yang bahagia. Bar biru ke arah bahagian atas carta menunjukkan perkataan yang menyumbang kepada perbezaan skor.

Janji dan amaran

Analisis sentimen adalah alat yang berkuasa, tetapi ia hanya sains muda dan mesti digunakan dengan berhati-hati.

Para saintis mesti mengembangkan alat yang membolehkan kita untuk mengamati "di bawah kapak" dan memahami mengapa algoritma tertentu menghasilkan hasil yang mereka lakukan. Ini adalah satu-satunya cara untuk mendiagnosis isu-isu dengan kaedah yang berbeza, dan lebih penting lagi, untuk mendidik orang ramai mengenai kemungkinan dan batasan lapangan.

Penyelidikan analisis sentimen sebahagian besarnya dibina pada set data awam yang besar, terutamanya dari media sosial. Adalah penting bahawa kita secara tidak sengaja menyediakan data memahami apa yang boleh dan tidak boleh digunakan, dan bagaimana.

Tentang Pengarang

Lewis Mitchell, Pensyarah di Matematik Gunaan, Universiti Adelaide. Michelle Edwards menyumbang kepada artikel ini.

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.

Buku berkaitan:

at InnerSelf Market dan Amazon