Startup kecerdasan buatan (AI) bernama Inception berhasil meraih pendanaan awal sebesar 50 juta dolar AS untuk mengembangkan model AI berbasis diffusion yang difokuskan pada pembuatan kode dan teks. Pendanaan ini dipimpin oleh Menlo Ventures, dengan dukungan dari Mayfield, Innovation Endeavors, Microsoft M12, Snowflake Ventures, Databricks Investment, dan NVentures milik Nvidia. Tokoh AI ternama seperti Andrew Ng dan Andrej Karpathy juga turut berinvestasi sebagai angel investor.
Profesor Stanford Stefano Ermon memimpin proyek ini. Ia dikenal sebagai peneliti yang fokus pada model diffusion, yakni jenis model AI yang menghasilkan keluaran dengan proses penyempurnaan bertahap, bukan kata demi kata. Teknologi serupa sebelumnya digunakan untuk membuat sistem AI berbasis gambar seperti Stable Diffusion, Midjourney, dan Sora. Melalui Inception, Ermon ingin memperluas penerapan model diffusion untuk tugas-tugas lain di luar gambar.
Model Mercury untuk Pengembangan Perangkat Lunak
Bersamaan dengan pendanaan ini, Inception meluncurkan versi baru model Mercury yang dirancang khusus untuk pengembangan perangkat lunak. Model ini sudah terintegrasi dalam sejumlah alat developer seperti ProxyAI, Buildglare, dan Kilo Code. Ermon menegaskan bahwa pendekatan diffusion membantu Inception menghemat dua aspek penting, yaitu waktu respons (latency) dan biaya komputasi.
“Model LLM berbasis diffusion jauh lebih cepat dan efisien dibandingkan pendekatan lain yang digunakan saat ini,” ujar Ermon. “Pendekatan ini benar-benar berbeda dan masih memiliki ruang besar untuk inovasi.”
Perbedaan Diffusion dan Auto-regression
Model diffusion memiliki struktur berbeda dari model auto-regression yang saat ini mendominasi layanan AI berbasis teks seperti GPT-5 dan Gemini. Model auto-regression bekerja secara berurutan, menebak kata berikutnya berdasarkan konteks sebelumnya. Sementara itu, model diffusion bekerja lebih menyeluruh dengan menyempurnakan struktur jawaban secara bertahap hingga sesuai dengan hasil yang diinginkan.
Selama ini, model auto-regression dianggap paling cocok untuk aplikasi teks dan terbukti sukses. Namun, riset terbaru menunjukkan bahwa model diffusion bisa lebih unggul dalam mengolah teks dalam jumlah besar atau saat menghadapi keterbatasan data. Ermon menilai keunggulan ini sangat penting saat AI digunakan untuk menangani basis kode besar.
Keunggulan dari Sisi Kinerja
Selain efisiensi, model diffusion juga lebih fleksibel dalam memanfaatkan perangkat keras. Berbeda dengan auto-regression yang memproses data secara berurutan, diffusion dapat menjalankan banyak operasi secara paralel. Hal ini memungkinkan waktu respons yang jauh lebih cepat untuk tugas-tugas kompleks.
“Kami telah mencapai kecepatan lebih dari 1.000 token per detik, jauh di atas kemampuan teknologi auto-regression yang ada,” kata Ermon. “Sistem kami memang dibangun untuk berjalan paralel dan sangat cepat.”

