Alat Pencari Menekankan Yang Negatif, Menghilangkan yang Positif

Merasa negatif tentang pencarian PubMed Anda? Kamu tidak sendiri. Karena cara mesin pencari diatur, mencari korelasi antara, katakanlah, "gen X" dan "kanker, " akan menghasilkan banyak hasil positif. Di sisi lain, penelitian yang tidak menemukan korelasi - hasil negatif atau nol - sulit ditemukan (jika semuanya diterbitkan). Mengetikkan kata "tidak" ke dalam pencarian Anda hanya memperburuk keadaan: "gen X BUKAN kanker" hanya mengembalikan makalah di mana kanker tidak disebutkan sama sekali.

Untungnya, sekarang ada aplikasi untuk menemukan hasil nol itu: BioNOT, mesin pencari baru yang dikembangkan oleh informatika biomedis Hong Yu dan mahasiswa pascasarjana Shashank Agarwal di University of Wisconsin, Milwaukee. Kecerdasan buatan program menjelajahi PubMed untuk istilah yang dimasukkan, seperti "vaksin" dan "autisme, " dan mengembalikan makalah dengan teks yang menunjukkan keduanya tidak berhubungan.

Tujuannya saat ini, kata Yu, adalah untuk membantu upaya anotasi gen dan memungkinkan mesin pencari untuk lebih menentukan apakah penelitian saat ini menghubungkan suatu kondisi dengan gen. Kanker kompleks, misalnya, dapat melibatkan ratusan varian genetik; melihat semua makalah tentang mereka bersama-sama, katanya, dapat menutupi temuan aktual dan melemahkan kekuatan statistik korelasi. Dan, mungkin yang lebih penting, laboratorium berbeda yang mempelajari gen mendapatkan hasil yang berbeda. Pencarian PubMed dan BioNOT secara paralel dapat memberi peneliti dua daftar makalah yang menemukan hasil positif dan negatif, yang memungkinkan mereka untuk dengan mudah membandingkan kekuatan data di setiap daftar.

Dalam sebuah makalah tim yang diterbitkan dalam BMC Bioinformatics minggu lalu, para peneliti menggunakan BioNOT untuk mencari gen yang diduga terlibat dalam tiga penyakit: autisme, Alzheimer, dan Parkinson. Alat ini menggali hasil negatif yang mungkin terlewatkan, kata penulis. Saat ini, BioNOT terbatas pada teks lengkap dari mega-penerbit Elsevier (yang Yu katakan tertarik untuk berinvestasi dalam pengembangan lebih lanjut dari BioNOT), publikasi akses terbuka, dan abstrak PubMed. Ini memberi alat sekitar 32 juta kalimat yang dinegasikan untuk bekerja, dan Yu berharap bahwa lebih banyak jurnal akan memungkinkan BioNOT mengakses teks lengkap mereka di masa depan.

Kurator literatur yang membubuhi keterangan genom atau literatur ilmiah "tambang teks" tertarik pada aplikasi. "Ada banyak aplikasi penambangan teks di luar sana, tetapi yang ini cukup unik, " kata Emily Dimmer, direktur program penjelasan protein UniProt GO di European Bioinformatics Institute (EBI) di Inggris. EBI, katanya, baru saja mulai menggunakan BioNOT untuk lebih memfokuskan upaya pengumpulan data dan penjelasan protein mereka.

Program ini masih memiliki beberapa kesalahan: mencari korelasi antara kanker dan ponsel, misalnya, menarik sejumlah makalah yang mengandung kalimat yang dinegasikan tetapi tidak ada hubungannya dengan korelasi antara keduanya. Tapi Yu mengatakan bahwa mereka berencana untuk meningkatkan aspek program ini. Dan para peneliti didorong oleh minat dari penerbit dan ahli bioinformatika seperti EBI. "Ini tidak hanya menyenangkan, tetapi juga pekerjaan yang bermanfaat, " katanya, karena dapat meningkatkan penemuan biomedis. "Kami berada di masa ketika AI [kecerdasan buatan] sangat kuat."