Tag: LLM
-
Huawei Kalahkan Nvidia dalam Jalankan Model AI DeepSeek R1
Huawei kembali bikin gebrakan di dunia teknologi! Lewat arsitektur data center canggih bernama CloudMatrix 384, perusahaan teknologi asal Tiongkok ini berhasil membuat chip AI Ascend 910C mengalahkan performa GPU Nvidia H800 dalam menjalankan model AI super besar, DeepSeek R1 yang punya 671 miliar parameter. Temuan ini datang dari laporan teknis yang ditulis bersama oleh tim peneliti dari Huawei dan SiliconFlow, sebuah startup…
-
MiniMax Tantang DeepSeek, Rilis Model AI Open Source Berkualitas Tinggi
Perusahaan AI asal Tiongkok, MiniMax, baru saja menggebrak dunia teknologi dengan merilis model bahasa besar terbaru bernama MiniMax-M1, yang diklaim mampu mengungguli kompetitor lokal seperti DeepSeek dan bersaing ketat dengan pemain global seperti OpenAI, Google, dan Anthropic. Dirilis secara open source lewat lisensi Apache, M1 menjadi salah satu dari sedikit model AI besar dari Tiongkok yang benar-benar terbuka. Hal…
-
Peneliti MIT Temukan Cara Baru Agar AI Lebih Akurat dalam Coding
Para peneliti dari MIT dan beberapa institusi lainnya berhasil mengembangkan metode baru agar AI, khususnya Large Language Model (LLM), bisa menghasilkan teks atau kode pemrograman yang lebih akurat dan bebas dari kesalahan. Pendekatan ini membantu AI untuk fokus pada hasil yang menjanjikan dan membuang hasil yang tidak relevan sejak awal proses, sehingga lebih efisien dalam…
-
Hugging Face Bikin AI Yang Bisa Riset Data Internet
Hugging Face baru aja bikin kejutan dengan menciptakan Open Deep Research, sebuah AI yang bisa menjelajahi internet dan bikin laporan riset secara otomatis, hanya dalam 24 jam! Ini adalah versi open-source dari Deep Research milik OpenAI, yang sebelumnya cuma bisa diakses secara komersial. Balapan Teknologi AI Ceritanya, OpenAI baru aja meluncurkan fitur Deep Research yang…