ujian turing dan ai 10 17

Pexels/Google Deepmind, CC BY-SA

Pada tahun 1950, saintis komputer British Alan Turing mencadangkan kaedah eksperimen untuk menjawab soalan: bolehkah mesin berfikir? Beliau mencadangkan jika manusia tidak dapat mengetahui sama ada mereka bercakap dengan mesin pintar buatan (AI) atau manusia lain selepas lima minit menyoal, ini akan menunjukkan AI mempunyai kecerdasan seperti manusia.

Walaupun sistem AI masih jauh daripada lulus ujian Turing semasa hayatnya, dia membuat spekulasi bahawa

“[…] dalam masa kira-kira lima puluh tahun adalah mungkin untuk memprogramkan komputer […] untuk membuatkan mereka bermain permainan tiruan dengan baik sehingga seorang penyiasat purata tidak akan mempunyai lebih daripada 70% peluang untuk membuat pengenalan yang betul selepas lima minit menyoal.

Hari ini, lebih daripada 70 tahun selepas cadangan Turing, tiada AI yang berjaya melepasi ujian dengan memenuhi syarat khusus yang digariskannya. Namun begitu, sebagai beberapa tajuk berita mencerminkan, beberapa sistem telah datang agak hampir.

Satu percubaan baru-baru ini menguji tiga model bahasa besar, termasuk GPT-4 (teknologi AI di belakang ChatGPT). Para peserta menghabiskan dua minit berbual dengan sama ada orang lain atau sistem AI. AI telah digesa untuk membuat kesilapan ejaan kecil – dan berhenti jika penguji menjadi terlalu agresif.


grafik langganan dalaman


Dengan dorongan ini, AI melakukan kerja yang baik untuk memperdayakan penguji. Apabila dipasangkan dengan bot AI, penguji hanya boleh meneka dengan betul sama ada mereka bercakap dengan sistem AI 60% pada setiap masa.

Memandangkan kemajuan pesat yang dicapai dalam reka bentuk sistem pemprosesan bahasa semula jadi, kita mungkin melihat AI lulus ujian asal Turing dalam beberapa tahun akan datang.

Tetapi adakah meniru manusia benar-benar ujian yang berkesan untuk kecerdasan? Dan jika tidak, apakah beberapa penanda aras alternatif yang mungkin kami gunakan untuk mengukur keupayaan AI?

Had ujian Turing

Walaupun sistem yang lulus ujian Turing memberi kita beberapa bukti ia pintar, ujian ini bukanlah ujian kecerdasan yang menentukan. Satu masalah ialah ia boleh menghasilkan "negatif palsu".

Model bahasa besar hari ini sering direka untuk segera mengisytiharkan mereka bukan manusia. Sebagai contoh, apabila anda bertanya soalan ChatGPT, ia sering mendahului jawapannya dengan frasa "sebagai model bahasa AI". Walaupun sistem AI mempunyai keupayaan asas untuk lulus ujian Turing, pengaturcaraan jenis ini akan mengatasi keupayaan itu.

Ujian itu juga berisiko beberapa jenis "positif palsu". Sebagai ahli falsafah Ned Block menunjukkan dalam artikel 1981, sistem boleh dibayangkan lulus ujian Turing hanya dengan dikod keras dengan tindak balas seperti manusia kepada sebarang input yang mungkin.

Di luar itu, ujian Turing memberi tumpuan kepada kognisi manusia khususnya. Jika kognisi AI berbeza daripada kognisi manusia, penyiasat pakar akan dapat mencari beberapa tugas di mana AI dan manusia berbeza dalam prestasi.

Mengenai masalah ini, Turing menulis:

Bantahan ini adalah sangat kuat, tetapi sekurang-kurangnya kita boleh mengatakan bahawa jika, bagaimanapun, mesin boleh dibina untuk bermain permainan tiruan dengan memuaskan, kita tidak perlu risau dengan bantahan ini.

Dalam erti kata lain, semasa lulus ujian Turing adalah bukti yang baik sistem adalah pintar, gagal itu bukan bukti yang baik sistem adalah tidak pintar.

Selain itu, ujian bukanlah ukuran yang baik sama ada AI sedar, sama ada mereka boleh merasakan kesakitan dan keseronokan, atau sama ada mereka mempunyai kepentingan moral. Menurut banyak saintis kognitif, kesedaran melibatkan kelompok tertentu kebolehan mental, termasuk mempunyai ingatan yang berfungsi, pemikiran peringkat tinggi, dan keupayaan untuk melihat persekitaran seseorang dan memodelkan bagaimana tubuh seseorang bergerak di sekelilingnya.

Ujian Turing tidak menjawab soalan sama ada sistem AI atau tidak mempunyai kebolehan ini.

Keupayaan AI yang semakin meningkat

Ujian Turing adalah berdasarkan logik tertentu. Iaitu: manusia adalah bijak, jadi apa sahaja yang boleh meniru manusia dengan berkesan berkemungkinan pintar.

Tetapi idea ini tidak memberitahu kita apa-apa tentang sifat kecerdasan. Cara berbeza untuk mengukur kecerdasan AI melibatkan pemikiran yang lebih kritis tentang kecerdasan itu.

Pada masa ini tiada ujian tunggal yang boleh mengukur kecerdasan buatan atau manusia secara berwibawa.

Pada tahap yang paling luas, kita boleh menganggap kecerdasan sebagai keupayaan untuk mencapai pelbagai matlamat dalam persekitaran yang berbeza. Sistem yang lebih pintar ialah sistem yang boleh mencapai julat matlamat yang lebih luas dalam julat persekitaran yang lebih luas.

Oleh itu, cara terbaik untuk menjejaki kemajuan dalam reka bentuk sistem AI tujuan umum adalah dengan menilai prestasi mereka merentas pelbagai tugas. Penyelidik pembelajaran mesin telah membangunkan pelbagai penanda aras yang melakukan perkara ini.

Sebagai contoh, GPT-4 ialah dapat menjawab dengan betul 86% soalan dalam pemahaman bahasa berbilang tugas besar-besaran – penanda aras mengukur prestasi pada ujian aneka pilihan merentas pelbagai mata pelajaran akademik peringkat kolej.

Ia juga mendapat markah yang baik dalam AgenBench, alat yang boleh mengukur keupayaan model bahasa yang besar untuk berkelakuan sebagai ejen dengan, contohnya, melayari web, membeli produk dalam talian dan bersaing dalam permainan.

Adakah ujian Turing masih relevan?

Ujian Turing ialah ukuran peniruan – keupayaan AI untuk mensimulasikan tingkah laku manusia. Model bahasa yang besar adalah peniru pakar, yang kini ditunjukkan dalam potensi mereka untuk lulus ujian Turing. Tetapi kecerdasan tidak sama dengan peniruan.

Terdapat banyak jenis kecerdasan kerana terdapat matlamat yang perlu dicapai. Cara terbaik untuk memahami kecerdasan AI ialah memantau kemajuannya dalam membangunkan pelbagai keupayaan penting.

Pada masa yang sama, adalah penting kita tidak terus "menukar tiang gol" apabila mempersoalkan sama ada AI pintar. Memandangkan keupayaan AI bertambah baik dengan pantas, pengkritik idea perisikan AI sentiasa mencari tugas baharu yang mungkin sukar disiapkan oleh sistem AI – hanya untuk mendapati ia telah melompat ke atas. satu lagi halangan.

Dalam tetapan ini, persoalan yang berkaitan bukanlah sama ada sistem AI adalah pintar — tetapi lebih tepat lagi, apakah jenis kecerdasan yang mungkin mereka miliki.Perbualan

Simon Goldstein, Profesor Madya, Institut Falsafah Dianoia, Universiti Katolik Australia, Universiti Katolik Australia and Cameron Domenico Kirk-Giannini, Penolong Profesor Falsafah, Universiti Rutgers

Artikel ini diterbitkan semula daripada Perbualan di bawah lesen Creative Commons. Membaca artikel asal.