Kemajuan kecerdasan buatan (AI) makin cepat. Peneliti baru saja menemukan cara baru untuk mengukur kemampuan AI, yaitu dengan membandingkan berapa lama waktu yang dibutuhkan AI untuk menyelesaikan tugas dibandingkan manusia. Hasilnya cukup menarik. AI mampu menyelesaikan tugas-tugas sederhana yang butuh waktu kurang dari empat menit dengan tingkat keberhasilan hampir 100%. Namun, untuk tugas yang lebih kompleks dan memakan waktu lebih dari empat jam, tingkat keberhasilannya turun drastis menjadi hanya 10%.
Penelitian ini dilakukan oleh tim dari Model Evaluation & Threat Research (METR) dan dipublikasikan di platform arXiv pada 30 Maret 2025. Mereka menggunakan berbagai model AI, seperti Sonnet 3.7, GPT-4, Claude 3 Opus, dan model GPT yang lebih lama. Mereka menguji AI dengan tugas-tugas mulai dari mencari informasi sederhana di Wikipedia hingga mengerjakan pemrograman rumit seperti memperbaiki bug di PyTorch.
Hasil studi menunjukkan bahwa “rentang perhatian” AI, atau kemampuannya mengerjakan tugas jangka panjang — terus berkembang pesat. Dalam enam tahun terakhir, kemampuan AI untuk menyelesaikan tugas kompleks dengan tingkat keberhasilan 50% mengalami peningkatan dua kali lipat setiap tujuh bulan.
Bahkan, para peneliti memperkirakan, jika tren ini berlanjut, pada tahun 2032 AI bisa mengotomatisasi pekerjaan pengembangan perangkat lunak yang biasanya dikerjakan manusia dalam waktu satu bulan.
Para ahli menyebut pengukuran berdasarkan lamanya waktu menyelesaikan tugas ini bisa menjadi tolok ukur baru dalam menilai kecerdasan dan kemampuan nyata AI. Ini lebih mencerminkan kondisi dunia nyata dibandingkan tes AI sebelumnya yang hanya menilai tugas-tugas pendek dan sederhana. Menurut Eleanor Watson, seorang ahli etika AI dari Singularity University, metode ini sangat berguna untuk memahami bagaimana AI mempertahankan tujuan jangka panjang dalam penyelesaian tugas.
Watson juga memprediksi, pada tahun 2026, AI akan menjadi semakin “umum”, mampu menangani berbagai tugas beragam dalam satu hari atau bahkan seminggu penuh. Bagi dunia bisnis, ini berarti AI bisa mengambil alih banyak beban kerja profesional, sementara konsumen bisa menggunakan AI sebagai manajer pribadi untuk mengatur rencana perjalanan, memantau kesehatan, hingga mengelola keuangan. Singkatnya, kemampuan AI yang terus berkembang dalam menyelesaikan berbagai tugas panjang akan mengubah cara kita bekerja dan hidup dalam waktu dekat.