“Vegetative Electron Microscopy” Kesalahan Scan Tahun 1959 yang Hidup Abadi di AI

Sebuah istilah aneh dan terdengar canggih, vegetative electron microscopy, ternyata bukanlah istilah ilmiah sungguhan. Tapi anehnya, frasa ini muncul di berbagai jurnal ilmiah, artikel, bahkan jawaban dari AI, padahal itu cuma hasil kesalahan scan dari makalah biologi tahun 1959.

Jadi ceritanya begini. Di tahun 1959, ada makalah ilmiah soal dinding sel bakteri yang di-scan secara digital. Sayangnya, software pemindai salah membaca dua kolom teks dan menggabungkan kata vegetative dari satu kolom dengan electron dari kolom sebelah. Jadilah istilah kacau vegetative electron microscopy, yang sebenarnya gak punya makna sama sekali.

Masalahnya nggak berhenti di situ. Karena AI dilatih menggunakan data dari internet, kesalahan ini ikut tersedot masuk ke dalam otak digital mereka. Hasilnya? Istilah palsu ini mulai muncul di berbagai tulisan ilmiah, bahkan di jurnal internasional! Ada yang bilang ini mirip “fosil digital”, kesalahan kecil yang membatu di data AI dan susah banget dihapus.

Yang bikin tambah kacau, istilah ini sempat nyasar ke terjemahan Farsi (Persia), di mana kata untuk vegetative dan scanning hanya beda satu titik dalam hurufnya. Dari situlah, “vegetative electron microscopy” masuk lagi ke dokumen-dokumen sains dan makin dianggap bener.

Peneliti dari berbagai institusi, termasuk yang nulis di The Conversation, membuktikan kalau AI modern seperti GPT-4o dan Claude 3.5 masih menyisipkan istilah palsu ini saat disodori konteks ilmiah dari makalah lama. Model-model lama seperti GPT-2 dan BERT justru bebas dari kesalahan ini, jadi bisa diprediksi kapan kira-kira “kontaminasi” datanya terjadi.

Kesalahan ini diduga besar berasal dari dataset bernama CommonCrawl, yang isinya adalah hasil scrap internet dalam jumlah super besar. Sayangnya, karena datanya sangat masif (petabyte!), ngoreksi satu frasa salah aja bisa susahnya minta ampun. Ditambah lagi, perusahaan AI juga ogah-ogahan membagikan detail data pelatihannya.

Bukan cuma AI yang salah, penerbit jurnal ilmiah juga ikut-ikutan. Penerbit besar seperti Elsevier awalnya sempat membela frasa itu seolah valid, sebelum akhirnya menyerah dan menerbitkan koreksi. Jurnal Frontiers juga sempat kena malu tahun lalu karena menerbitkan artikel dengan gambar AI ngawur soal organ tikus.

Kasus ini jadi pengingat penting bahwa meskipun AI bisa bantu banyak di dunia sains, tapi kita tetap perlu hati-hati dengan apa yang dia “ketahui”. Karena kalau sampah yang masuk, ya sampah juga yang keluar.

Kesimpulannya? Kalau kamu baca istilah aneh yang terdengar pintar, coba dicek lagi… bisa jadi itu cuma “fosil digital” dari masa lalu yang dibangkitkan AI!