Apa yang Boleh Kita Berikan Netflix Mengenai Mengobati Kanser

Dua tahun lalu, bekas Presiden Barack Obama mengumumkan Inisiatif Perubatan Ketepatan di dalam Negerinya Alamat Kesatuan. Inisiatif ini bercita-cita untuk "era baru ubat" di mana rawatan penyakit dapat disesuaikan secara khusus kepada kod genetik setiap pesakit. Perbualan

Ini bergema dengan kuat dalam perubatan kanser. Pesakit sudah boleh menguruskan kanser mereka dengan terapi yang mensasarkan gen tertentu yang diubah dalam tumor tertentu mereka. Sebagai contoh, wanita dengan jenis kanser payudara yang disebabkan oleh penguatan gen HER2 sering dirawat dengan terapeutik yang dipanggil herceptin. Kerana terapeutik yang disasarkan ini khusus untuk sel-sel kanser, mereka cenderung mempunyai kesan sampingan yang lebih sedikit daripada rawatan kanser tradisional dengan kemoterapi atau radiasi.

Walau bagaimanapun, rawatan sedemikian tidak tersedia untuk kebanyakan pesakit kanser. Dalam banyak kanser, perubahan genetik tertentu yang bertanggungjawab untuk kanser masih tidak diketahui. Untuk membuat rawatan kanser individu, kita mesti tahu lebih lanjut mengenai perubahan genetik berfungsi.

Dengan data mengenai genetik kanser yang berkembang pesat, matematik dan statistik kini boleh membantu membuka kunci corak tersembunyi dalam data ini untuk mencari gen yang bertanggungjawab untuk kanser individu. Dengan pengetahuan ini, doktor boleh memilih rawatan yang sesuai yang menyekat tindakan gen ini untuk memperibadikan terapi untuk pesakit individu. Kajian saya bertujuan untuk meningkatkan perubatan ketepatan dalam kanser - dengan membina kaedah yang sama yang digunakan untuk mencari corak dalam penarafan Netflix.

Menyaring data

Hari ini, terdapat akses awam yang tidak pernah berlaku kepada data genetik kanser. Data-data ini datang dari pesakit-pesakit yang murah hati yang menderma sampel tumor mereka untuk penyelidikan. Para saintis kemudian menggunakan teknologi penjujukan untuk mengukur mutasi dan aktiviti dalam setiap gen 20,000 dalam genom manusia.


grafik langganan dalaman


Semua data ini adalah hasil langsung dari Projek Genom Manusia dalam 2003. Projek itu menentukan urutan untuk semua gen yang membentuk DNA manusia yang sihat. Sejak selesai projek itu, kos penjujukan genom manusia telah lebih daripada separuh setiap tahun, melebihi pertumbuhan kuasa pengkomputer yang diterangkan di dalam Hukum Moore. Pengurangan kos ini membolehkan penyelidikan mengumpul data genetik yang tidak pernah berlaku sebelum ini daripada pesakit kanser.

Kajian saintifik mengenai genetik kanser yang dilakukan di seluruh dunia membebaskan data mereka ke pangkalan data awam yang terpusat yang disediakan oleh Perpustakaan Perubatan Negara National Institutes of Health (NIH). Institut Kanser Kebangsaan NIH dan Institut Penyelidikan Genom Manusia Kebangsaan juga telah mengeluarkan data genetik secara bebas daripada tumor 11,000 dalam jenis kanser 33 melalui projek yang dipanggil Atlas Genom Kanser.

Setiap fungsi biologi - dari mengekstrak tenaga dari makanan ke penyembuhan luka - hasil dari aktiviti dalam kombinasi gen yang berlainan. Kanser merampas gen yang membolehkan orang dewasa bertambah dan yang melindungi tubuh daripada sistem imun. Penyelidik menamakannya "Tanda-tanda kanser." Disyulasi gen yang dipanggil membolehkan tumor tumbuh tanpa kawalan dan membentuk metastasis pada organ jauh dari tapak tumor asal.

Penyelidik secara aktif menggunakan data awam untuk mencari set gen pengubahan yang bertanggungjawab untuk setiap jenis tumor. Tetapi masalah ini tidak seperti mudah mengenal pasti satu gen disimpulasi dalam setiap tumor. Beratus-ratus, jika tidak ribuan, gen 20,000 dalam genom manusia diselulas dalam kanser. Kumpulan gen yang tidak diselaraskan bervariasi dalam setiap tumor pesakit, dengan set gen biasa yang digunakan semula yang membolehkan setiap ciri kanser.

Ubat ketepatan bergantung kepada mencari kumpulan yang lebih kecil daripada gen yang diselia yang bertanggungjawab untuk fungsi biologi dalam tumor setiap pesakit. Tetapi, gen mungkin mempunyai beberapa fungsi biologi dalam konteks yang berbeza. Oleh itu, penyelidik mesti menemui satu set gen "tumpang tindih" yang mempunyai fungsi umum dalam satu set pesakit kanser.

Menghubungkan status gen untuk berfungsi memerlukan matematik yang kompleks dan kuasa pengkomputeran yang besar. Pengetahuan ini penting untuk meramalkan hasil terapi yang akan menyekat fungsi gen ini. Jadi, bagaimana kita boleh mendedahkan ciri-ciri yang bertindih ini untuk meramalkan hasil individu untuk pesakit?

Apa yang boleh mengajar kita Netflix

Nasib baik untuk kami, masalah ini telah diselesaikan dalam sains komputer. Jawapannya adalah kelas teknik yang dipanggil "pemfaktoran matriks" - dan anda mungkin sudah berinteraksi dengan teknik ini dalam kehidupan seharian anda.

Dalam 2009, Netflix mengadakan cabaran untuk memperibadikan rating filem untuk setiap pengguna Netflix. Pada Netflix, setiap pengguna mempunyai set penarafan yang berbeza daripada filem yang berbeza. Walaupun dua pengguna mungkin mempunyai rasa yang sama dalam filem, mereka mungkin berbeza secara liar dalam genre tertentu. Oleh itu, anda tidak boleh bergantung pada membandingkan penilaian dari pengguna yang serupa.

Sebaliknya, algoritma penatalisan matriks mendapati filem dengan penilaian yang sama di kalangan kumpulan pengguna yang lebih kecil. Kumpulan pengguna akan berbeza untuk setiap filem. Komputer mengaitkan setiap pengguna dengan sekumpulan filem ke tahap yang berbeza, berdasarkan kepada selera masing-masing. Hubungan antara pengguna disebut sebagai "corak." Corak ini dipelajari dari data, dan mungkin mendapati kedudukan biasa yang tidak dijangka oleh genre filem sahaja - sebagai contoh, pengguna boleh berkongsi keutamaan bagi pengarah atau pelakon tertentu.

kanser 4 21Genevieve Stein-O'Brien, CC BY

Proses yang sama boleh berfungsi dengan kanser. Dalam kes ini, ukuran pengasingan gen adalah serupa dengan penarafan filem, genre wayang kepada fungsi biologi dan pengguna kepada tumor pesakit. Komputer mencari di tumor pesakit untuk mencari corak dalam disistulasi gen yang menyebabkan fungsi biologi malignan pada setiap tumor.

Dari filem ke tumor

Analogi antara penarafan filem dan genetik kanser merosot dalam butirannya. Kecuali mereka adalah kanak-kanak di bawah umur, pengguna Netflix tidak dikekang dalam filem yang mereka tonton. Tetapi, badan kita sebaliknya lebih memilih untuk meminimumkan bilangan gen yang digunakan untuk sebarang fungsi tunggal. Terdapat juga redundansi besar antara gen. Untuk melindungi sel, satu gen mudah menggantikan satu lagi untuk berfungsi dengan fungsi yang sama. Fungsi gen dalam kanser lebih kompleks. Tumor juga sangat rumit dan berkembang pesat, bergantung kepada interaksi rawak antara sel-sel kanser dan organ sihat yang bersebelahan.

Untuk mengambil kira kerumitan ini, kami telah membangunkan pendekatan penaksiran matriks yang dipanggil Aktiviti Gerakan Teratur dalam Corak Set - atau CoGAPS untuk jangka pendek. Algoritma kami menyumbang minimalisme biologi dengan menggabungkan beberapa gen yang mungkin ke dalam corak untuk setiap tumor.

Gen yang berbeza juga boleh menggantikan satu sama lain, masing-masing mempunyai fungsi yang sama dalam konteks yang berbeza. Untuk mengambil kira ini, CoGAPS secara serentak menganggarkan statistik untuk apa yang dipanggil "pola" fungsi gen. Ini membolehkan kita untuk mengira kebarangkalian setiap gen yang digunakan dalam setiap fungsi biologi dalam tumor.

Sebagai contoh, ramai pesakit mengambil terapeutik yang disasarkan cetuximab untuk memanjangkan kelangsungan hidup dalam kanser kolorektal, pankreas, paru-paru dan lisan. Kerja-kerja baru-baru ini kami mendapati bahawa corak ini dapat membezakan fungsi gen dalam sel-sel kanser yang bertindak balas terhadap agen cetuximab terapeutik yang disasarkan daripada yang tidak.

Masa depan

Malangnya, terapi kanser yang menargetkan gen biasanya tidak dapat menyembuhkan penyakit pesakit. Mereka hanya boleh melambatkan perkembangan selama beberapa tahun. Kebanyakan pesakit kemudian berulang, dengan tumor yang tidak lagi responsif terhadap rawatan.

Kerja baru-baru ini mendapati bahawa corak yang membezakan fungsi gen dalam sel yang responsif terhadap cetuximab termasuk gen yang sangat menimbulkan ketahanan. Immunotherapies yang muncul menjanjikan dan kelihatan menyembuhkan beberapa jenis kanser. Namun, terlalu kerap, pesakit dengan rawatan ini juga berulang. Data baru yang mengesan genetik kanser selepas rawatan adalah penting untuk menentukan mengapa pesakit tidak lagi bertindak balas.

Bersama dengan data ini, biologi kanser juga memerlukan generasi saintis baru yang dapat menjembatani matematik dan statistik untuk menentukan perubahan genetik yang berlaku dari masa ke masa dalam rintangan dadah. Dalam bidang matematik lain, program komputer dapat meramalkan hasil jangka panjang. Model-model ini biasanya digunakan dalam ramalan cuaca dan strategi pelaburan.

Dalam bidang ini dan penyelidikan saya sebelum ini, kami telah mendapati bahawa kemas kini kepada model dari dataset besar - seperti data satelit dalam cuaca - meningkatkan ramalan jangka panjang. Kita semua telah melihat kesan kemas kini ini, dengan ramalan cuaca semakin mendekati kita untuk ribut.

Sama seperti alat-alat dari sains komputer yang digunakan boleh disesuaikan dengan kedua-dua cadangan filem dan kanser, generasi saintis pengkomputeran masa depan akan mengamalkan alat ramalan dari pelbagai bidang untuk perubatan ketepatan. Akhirnya, dengan alat pengiraan ini, kami berharap untuk meramalkan tindak balas tumor terhadap terapi seperti yang kita ramalkan cuaca, dan mungkin lebih dipercayai.

Tentang Pengarang

Elana Fertig, Penolong Profesor Biostatistik Onkologi dan Bioinformatik, Johns Hopkins University

Artikel ini pada asalnya diterbitkan pada Perbualan. Membaca artikel asal.

Buku-buku yang berkaitan

at InnerSelf Market dan Amazon