Bercakap kepada Saya Komputer: Kawalan Suara Mematikan

Jika bungkusan yang tidak dijangka mula muncul di pintu anda, anda mungkin mahu mempunyai perkataan dengan salah satu peranti pintar anda.

Awal bulan ini, enam tahun di Dallas meminta keluarganya Amazon Echo penceramah pintar untuk rumah boneka. Dan Alexa, pembantu tiruan Siri seperti Amazon, dengan serta-merta mengarahkan satu ke rumah mereka.

Satu berita berita TV San Diego mengambil cerita itu, dan secara tidak sengaja mengulanginya apabila salah satu penerbit berita itu mengulas: "Saya suka gadis kecil itu, mengatakan 'Alexa memerintahkan saya sebuah rumah boneka'." Melihat ini, beberapa peranti Amazon lain di rumah merentas San Diego cuba membeli lebih banyak rumah boneka.

Laporan berita CW6 San Diego mengenai membeli rumah boneka yang tidak disengajakan oleh Alexa.

{youtube}oI2KLIULjXc{/youtube}

Cerita ini mungkin terdengar aneh kepada sesiapa yang telah cuba mengadakan perbualan dengan Apple Siri atau Microsoft Cortana. Peranti kami telah menjadi agak baik ketika mendengar kami, tetapi itu tidak selalu bermakna mereka faham.

Penyelidik di Microsoft baru-baru ini menunjuk ini sebagai masalah yang berpotensi dengan antaramuka bercakap hari ini: mereka dipasarkan sebagai pembantu "pintar", dengan lelucon pintar dan pengetahuan duniawi, namun mereka sering menggagalkan kita dengan kekurangan akal mereka.


grafik langganan dalaman


Dalam pakej kajian kecil, penyelidik mendapati bahawa orang yang terus bercakap dengan pembantu digital mereka dari masa ke masa adalah mereka yang telah memulakan dengan jangkaan yang paling rendah.

Apakah antara muka suara sebenarnya?

Apabila anda bercakap dengan antara muka suara, ia perlu:

  • "Mendengar" suara suara anda, dan membezakannya dari bunyi latar belakang
  • perhatikan di mana setiap perkataan bermula dan berakhir, mengabaikan "umms" dan "ahhs"
  • sepadan dengan bunyi setiap perkataan kepada perkataan dalam kamus, memilih yang betul dari konteks jika ada homophones
  • betul mentafsirkan makna seluruh kalimat
  • menghasilkan tindak balas yang bermakna dan berguna yang sepadan dengan permintaan anda.

Setiap satu daripada ini adalah cabaran teknikal yang rumit, dan syarikat teknologi yang berbeza telah membuat kemajuan dalam pelbagai bidang.

Google Now adalah baik untuk memberikan maklum balas yang relevan kepada pelbagai permintaan kerana ia mendapat manfaat daripada trofi data Google mengenai web, dan aktiviti peribadi anda, jika anda menggunakan perkhidmatan Google.

Amazon Echo sangat baik untuk mendengar permintaan anda dari seluruh bilik bising, terima kasih kepada array mikrofon jauh-membatalkan bunyi jauh. Sudah tentu, ia juga baik untuk membuat pembelian melalui Amazon.

Sejak beberapa tahun kebelakangan ini, antara muka suara menjadi lebih baik pada perbualan sehari-hari atau "semulajadi" berbanding dengan hanya perintah yang bersandar dan teliti. Mereka masih lebih baik menangani pertanyaan mudah, seperti "siapa yang bermain di Terbuka Australia?", Dan cenderung berjuang dengan permintaan yang lebih rumit, seperti "siapa yang bermain di Terbuka Australia buat kali pertama tahun ini?", Dan tindak lanjut soalan, seperti "adakah ia hujan semasa final?".

Keadaan ini lebih bercampur-curah untuk bahasa selain bahasa Inggeris: sementara Siri menyokong lebih daripada bahasa dan dialek 40, sejauh ini Alexa hanya tersedia dalam bahasa Inggeris dan Jerman. Tetapi semua ciri-ciri ini terus bertambah baik.

Di mana suara antara muka gagap

Begitu juga suara antaramuka akan mengambil alih semua teknologi kami, seperti yang diramalkan dalam filem itu Her? Gartner, firma penyelidikan teknologi, telah ramalan bahawa pada tahun depan, 30% interaksi kami dengan teknologi akan menjadi perbualan dengan antara muka yang membolehkan suara.

Tetapi antara muka suara mempunyai batasan, dan tidak semuanya dapat diselesaikan dengan teknologi yang lebih baik.

Suara adalah cara utama untuk mengganggu teknologi dalam filem Spike Jonze Her.

{youtube}ne6p6MfLBxc{/youtube}

Pencemaran bunyi adalah salah satu halangan utama. Bolehkah peranti anda membezakan apa yang anda katakan dari bunyi latar belakang di sekeliling anda? Teknologi boleh membantu dengan itu, termasuk pengurangan bunyi, pengecaman suara peribadi dan bacaan bibir.

Tetapi bagaimana dengan bunyi latar belakang yang anda buat untuk orang lain dengan bercakap dengan peranti pintar anda? Bayangkan seseorang yang duduk di sebelah anda di pejabat - atau di dalam kapal terbang - berbual dengan Siri semasa anda cuba membaca, dan anda dapat melihat mengapa antara muka suara mungkin tidak boleh diterima secara sosial.

Satu lagi isu yang timbul dari permintaan mental antara muka suara. Belajar menggunakan sistem berasaskan suara boleh menjadi sukar, terutamanya jika tiada skrin, seperti Amazon Echo.

Sekiranya anda pernah memanggil bank atau syarikat telefon, anda tahu kombinasi kepekatan dan kebosanan yang menyedihkan yang datang dari mendengar senarai suara yang disintesis daripada semua pilihan anda semasa anda menunggu yang anda perlukan dan cuba untuk tidak mencampurkannya up. Antara muka grafik tradisional mengelakkan masalah ini dengan menunjukkan kepada anda pilihan yang tersedia dan membiarkan anda mengetuk pilihan anda dengan cepat.

Selepas anda mempelajari arahan suara, menggunakannya boleh mengganggu. Penyelidik telah menemui arahan suara itu derail pemikiran anda lebih daripada tetikus dan papan kekunci.

Ini amat berbahaya untuk antaramuka suara dalam kereta: sepasang kajian dari University of Utah mendapati pemandu itu terganggu sehingga sehingga 27 saat selepas menggunakan arahan suara.

Universiti Utah / Yayasan AAA untuk penyelidikan Keselamatan Lalu Lintas mengenai gangguan pemanduan.

{vimeo}108281698{/vimeo}

Mencari suaranya?

Oleh itu, antara muka suara tidak dapat diambil alih sepenuhnya, tetapi mereka akan mencari tempat yang berguna dalam kehidupan kita. Mereka sudah biasa dalam kereta, di mana mereka diharapkan akan menjadi kurang mengganggu apabila teknologi bertambah baik.

Di dapur, anda boleh meminta Alexa untuk bercakap anda melalui resipi atau mengemaskini senarai membeli-belah anda semasa tangan sibuk memasak. Dalam realiti maya dan peningkatan, antara muka suara boleh membiarkan anda mengawal sistem apabila anda tidak dapat melihat tangan anda sama sekali.

Dalam pembelajaran bahasa, mereka boleh digunakan untuk mengamalkan sebutan. Yang paling penting, antara muka suara membantu pengguna dengan gangguan motor, RSI atau disleksia untuk mengatasi masalah kecacatan mereka.

Antara muka suara adalah teknologi yang lama ditunggu-tunggu, dan ada sebab yang baik untuk memikirkan masa mereka akhirnya datang. Ingatlah bahawa mereka mungkin tidak pandai seperti mereka. Dan anda mungkin mahu meletakkan kod PIN pada pembelian suara jika kanak-kanak berada di sekeliling.

Perbualan

Tentang Pengarang

Fraser Allison, Calon PhD dalam Interaksi Manusia-Komputer, University of Melbourne

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.

Related items

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market dan Amazon