Para peneliti dari MIT dan beberapa institusi lainnya berhasil mengembangkan metode baru agar AI, khususnya Large Language Model (LLM), bisa menghasilkan teks atau kode pemrograman yang lebih akurat dan bebas dari kesalahan. Pendekatan ini membantu AI untuk fokus pada hasil yang menjanjikan dan membuang hasil yang tidak relevan sejak awal proses, sehingga lebih efisien dalam penggunaan komputasi.
Penelitian ini telah diuji dalam berbagai skenario, seperti pembuatan kode Python, kueri SQL, struktur molekul, dan rencana kerja robot. Hasilnya, metode ini mampu mengalahkan pendekatan lain yang lebih lama, bahkan memungkinkan model AI yang lebih kecil mengungguli model yang lebih besar.
João Loula, mahasiswa pascasarjana MIT yang juga penulis utama studi ini, menjelaskan bahwa pendekatan baru ini bisa dimanfaatkan untuk meningkatkan asisten pemrograman, alat analisis data berbasis AI, dan sistem penemuan ilmiah. “Penelitian ini tak hanya penting bagi kalangan akademik, tapi juga bisa sangat membantu orang awam dalam mengontrol output AI,” ujarnya.
Biasanya, untuk memastikan kode yang dihasilkan AI berjalan dengan benar, diperlukan pemeriksaan penuh setelah kode selesai. Tapi jika hasilnya salah, maka proses harus diulang dari awal dan ini memakan waktu serta sumber daya. Pendekatan baru ini menggunakan metode bernama sequential Monte Carlo, yang membagi proses jadi beberapa cabang dan hanya mempertahankan cabang yang memiliki potensi terbaik untuk menghasilkan output yang benar.
Dalam uji coba, pendekatan ini bahkan membuat model open-source berukuran kecil mampu mengalahkan model komersial tertutup yang ukurannya dua kali lebih besar, dalam menghasilkan kode Python yang benar.
Ke depan, tim peneliti berharap bisa mengembangkan pendekatan ini untuk menangani teks yang lebih panjang dan menggabungkannya dengan metode pembelajaran mesin, sehingga AI bisa semakin akurat seiring waktu.
Penelitian ini juga memiliki potensi besar untuk digunakan dalam sistem analisis data otomatis, pembuatan model data, dan bahkan percakapan dengan AI yang bisa memahami konteks pertanyaan secara mendalam. Riset ini mendapat dukungan dari Canada CIFAR AI Chairs Program, MIT Quest for Intelligence, dan Convergent Research.