Bagaimana Komputer Membantu Ahli Biologi Crack Life Rahsia

Sebaik sahaja genom manusia tiga belas-huruf-panjang disusun, kami bergegas ke "Omics"Era penyelidikan biologi. Para saintis kini berlumba mengikut urutan genom (semua gen) atau proteom (semua protein) dari pelbagai organisma - dan dalam proses itu menyusun sejumlah besar data.

Sebagai contoh, saintis boleh menggunakan alat-alat "omics" seperti penjujukan DNA untuk mengusik mana gen manusia terjejas dalam jangkitan selesema virus. Tetapi kerana genom manusia mempunyai sekurang-kurangnya gen 25,000, jumlah gen yang diubah walaupun di bawah senario mudah itu berpotensi menjadi ribuan.

Walaupun penjujukan dan mengenal pasti gen dan protein memberi mereka nama dan tempat, ia tidak memberitahu kami apa yang mereka lakukan. Kita perlu memahami bagaimana gen ini, protein dan semua barangan di antara berinteraksi dalam proses biologi yang berlainan.

Hari ini, walaupun eksperimen asas menghasilkan data besar, dan salah satu cabaran terbesar adalah membuang hasil yang relevan dari bunyi latar belakang. Komputer membantu kami mengatasi gunung data ini; tetapi mereka juga boleh melangkah lebih jauh daripada itu, membantu kita menghasilkan hipotesis saintifik dan menerangkan proses biologi yang baru. Sains data, pada asasnya, membolehkan penyelidikan biologi canggih.

Komputer Untuk Penyelamat

Komputer adalah unik untuk mengendalikan set data secara besar-besaran kerana mereka boleh menjejaki semua syarat-syarat penting yang diperlukan untuk analisis secara serentak.


grafik langganan dalaman


Walaupun mereka boleh mencerminkan kesilapan manusia mereka diprogramkan, komputer boleh menangani sejumlah besar data dengan cekap dan mereka tidak bias ke arah yang biasa, seperti penyelidik manusia.

Komputer juga boleh diajar untuk mencari corak tertentu dalam set data eksperimen - sebuah konsep yang disebut pembelajaran mesin, yang pertama dicadangkan dalam 1950s, terutamanya oleh ahli matematik Alan Turing. Algoritma yang telah mempelajari pola dari set data kemudiannya boleh diminta membuat ramalan berdasarkan data baru yang tidak pernah ditemui sebelumnya.

Pembelajaran mesin telah merevolusikan penyelidikan biologi kerana kita kini boleh menggunakan set data besar dan meminta komputer untuk membantu memahami biologi yang mendasari.

Latihan Komputer Untuk Fikir Dengan Simulasi Proses Otak

Kami telah menggunakan satu jenis pembelajaran mesin yang menarik, yang dikenali sebagai rangkaian neural buatan (ANN), di makmal kita sendiri. Otak adalah rangkaian saraf yang saling berkaitan, yang berkomunikasi dengan menghantar denyutan elektrik melalui pendawaian saraf. Begitu juga, ANN menyimulasikan dalam komputer rangkaian neuron apabila mereka menghidupkan dan mematikan sebagai tindak balas kepada isyarat neuron lain.

Dengan menggunakan algoritma yang meniru proses neuron sebenar, kita boleh membuat rangkaian belajar untuk menyelesaikan pelbagai jenis masalah. Google menggunakan ANN yang kuat untuk terkenal sekarang Projek Deep Dream di mana komputer boleh mengklasifikasikan dan juga membuat imej.

Kumpulan kami mengkaji sistem imun, dengan matlamat memikirkan terapi baru untuk kanser. Kami telah menggunakan model pengiraan ANN untuk mengkaji kod protein permukaan pendek yang digunakan oleh sel-sel imun kita untuk menentukan sama ada sesuatu yang asing di dalam badan kita dan dengan itu harus diserang. Sekiranya kita memahami lebih lanjut mengenai bagaimana sel-sel imun kita (seperti sel-sel T) membezakan sel-sel normal / diri dan tidak normal / asing, kita boleh merekabentuk vaksin dan terapi yang lebih baik.

Kami menjelajahi katalog tersedia secara beribu-ribu kod protein yang dikenal pasti oleh penyelidik selama ini. Kami membahagikan data besar ini kepada dua: kod protein diri normal yang diperoleh dari sel-sel manusia yang sihat, dan kod-protein protein abnormal yang berasal dari virus, tumor dan bakteria. Kemudian kami beralih ke rangkaian neural tiruan yang dibangunkan di makmal kami.

Sebaik sahaja kita makan kod protein ke ANN, algoritma dapat mengenal pasti perbezaan asas antara kod protein dan normal yang tidak normal. Ia akan menjadi sukar bagi orang untuk menjejaki fenomena-fenomena biologi seperti ini - terdapat beribu-ribu kod protein untuk menganalisis dalam set data besar. Ia memerlukan mesin untuk menimbulkan masalah kompleks dan menentukan biologi baru.

Ramalan Melalui Pembelajaran Mesin

Aplikasi pengajaran mesin yang paling penting dalam biologi adalah utiliti dalam membuat ramalan berdasarkan data besar. Ramalan berasaskan komputer boleh memahami data besar, menguji hipotesis dan menjimatkan masa dan sumber yang berharga.

Sebagai contoh, dalam bidang biologi sel T kami, mengetahui kod protein protein mana yang perlu disasarkan adalah penting dalam membangunkan vaksin dan rawatan. Tetapi terdapat banyak kod protein individu dari mana-mana virus tertentu yang sangat mahal dan sukar untuk menguji setiap ujian.

Sebaliknya, kami melatih rangkaian neural buatan untuk membantu mesin mempelajari semua ciri biokimia penting kedua-dua jenis kod protein - normal berbanding tidak normal. Kemudian kami meminta model untuk "meramalkan" kod protein virus yang baru menyerupai kategori "tidak normal" dan boleh dilihat oleh sel T dan dengan itu, sistem imun. Kami menguji model ANN pada protein virus yang berbeza yang tidak pernah dikaji sebelum ini.

Sudah tentu, seperti pelajar yang rajin bersungguh-sungguh untuk menggembirakan guru tersebut, rangkaian neural dapat mengenal pasti majoriti protein-kod protein T-sel yang mengaktifkan dalam virus ini. Kami juga menguji kod protein yang dibezakan untuk mengesahkan ketepatan ramalan ANN. Dengan menggunakan model rangkaian neural ini, seorang saintis dapat melakukannya cepat meramalkan semua kod protein penting yang penting dari virus berbahaya dan menguji mereka untuk membangunkan rawatan atau vaksin, bukan meneka dan menguji mereka secara individu.

Melaksanakan Pembelajaran Mesin dengan bijak

Terima kasih kepada penapisan yang berterusan, sains data dan pembelajaran mesin yang besar semakin menjadi sangat diperlukan untuk apa-apa jenis penyelidikan saintifik. Kemungkinan untuk menggunakan komputer untuk melatih dan meramalkan dalam biologi hampir tidak berkesudahan. Dari memikirkan gabungan kombinasi biomarker yang terbaik untuk mengesan penyakit untuk memahami mengapa hanya sesetengah pesakit mendapat manfaat daripada rawatan kanser tertentu, perlombongan data besar menggunakan komputer telah menjadi laluan yang berharga untuk penyelidikan.

Sudah tentu ada batasan. Masalah terbesar dengan sains data besar ialah data itu sendiri. Sekiranya data yang diperolehi oleh kajian-kajian roma adalah rosak, atau berdasarkan sains yang tidak baik, mesin akan dilatih dengan data buruk - yang membawa kepada ramalan miskin. Pelajar hanya sebagai guru sahaja.

Kerana komputer tidak bersifatlagi), mereka boleh mencari corak mereka walaupun tidak wujud, membangkitkan semula, kepada data buruk dan sains yang tidak boleh diperbaharui.

Dan sesetengah penyelidik telah menimbulkan kebimbangan mengenai komputer menjadi kotak hitam data bagi saintis yang tidak memahami dengan jelas manipulasi dan komplin yang mereka lakukan bagi pihak mereka.

Walaupun masalah ini, faedah data dan mesin besar akan terus menjadikan mereka rakan kongsi berharga dalam penyelidikan saintifik. Dengan peringatan di dalam fikiran, kami bersedia untuk memahami biologi melalui mata mesin.

Tentang PengarangPerbualan

Sri Krishna, Calon PhD, Rekaan Biologi, Sekolah Kejuruteraan Sistem Biologi dan Kesihatan, Universiti Arizona State dan Diego Chowell, Pelajar PhD dalam Matematik Gunaan, Arizona State University

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.


Tempah berkaitan:

at InnerSelf Market dan Amazon