DeepSeek R1 Versi Ringan Dirilis, Klaim Kalahkan Google
Teknologi

Laboratorium kecerdasan buatan (AI) asal Tiongkok, DeepSeek, kembali mencuri perhatian setelah merilis versi ringan dari model AI terbarunya.
Model bernama DeepSeek-R1-0528-Qwen3-8B ini menjadi sorotan karena disebut mampu mengungguli model sekelasnya dari raksasa teknologi lain, termasuk milik Google dan Microsoft.
Meski merupakan versi penyederhanaan dari model utama DeepSeek-R1, performa model ini cukup mencengangkan.
Baca Juga: Jangan Kecolongan, Ini Cara Deteksi Tulisan Dibuat AI atau Bukan
Dibangun dengan basis Qwen3-8B, model open-source besutan Alibaba yang diluncurkan Mei 2025, DeepSeek-R1-0528-Qwen3-8B berhasil mengalahkan Gemini 2.5 Flash milik Google dalam uji AIME 2025—sebuah kumpulan soal matematika yang menantang.
Saingi Microsoft
Baca Juga: Survei: 28 Persen Wisatawan Gunakan AI untuk Rencanakan Perjalanan
Ilustrasi kecerdasan buatan atau AI. (Meta AI)
Tak hanya itu, performa model ini juga disebut hampir setara dengan Phi-4 Plus, model AI terbaru dari Microsoft, dalam pengujian lain di kompetisi matematika HMMT (Harvard-MIT Math Tournament).
Model ringan seperti ini memang secara umum tidak sekuat versi penuhnya. Namun, keunggulan utamanya terletak pada efisiensi penggunaan komputasi.
Berdasarkan data dari platform cloud NodeShift, Qwen3-8B dapat dijalankan menggunakan GPU berkapasitas RAM 40GB hingga 80GB, seperti Nvidia H100.
Sebagai perbandingan, versi penuh dari DeepSeek-R1 memerlukan hingga 12 GPU 80GB untuk bisa beroperasi.
Riset Akademi
Ilustrasi kecerdasan buatan atau AI. (Meta AI)
DeepSeek menjelaskan bahwa model ini dilatih menggunakan data keluaran dari DeepSeek-R1 yang diperbarui, kemudian digunakan untuk menyempurnakan Qwen3-8B.
Di halaman resmi mereka di platform AI Hugging Face, DeepSeek menyebut model ini cocok untuk keperluan riset akademik maupun pengembangan industri berbasis model AI skala kecil.
Yang menarik, DeepSeek-R1-0528-Qwen3-8B dirilis dengan lisensi MIT, artinya dapat digunakan secara bebas, termasuk untuk kebutuhan komersial.
Beberapa platform seperti LM Studio juga sudah menyediakan akses ke model ini melalui API.
Sumber: Technocrunch