- Pencarian Mendalam R2 menjanjikan biaya pemrosesan hingga 97% lebih rendah daripada GPT-4o.
- Model ini menggunakan 1.200 miliar parameter dan telah dilatih pada 5,2 petabyte data.
- 82% chip yang digunakan dalam pelatihan Anda adalah Huawei Naik, mengurangi ketergantungan pada NVIDIA.
- Efisiensi dan harganya dapat menjadikannya pesaing global yang serius.
Sektor kecerdasan buatan sedang mengalami perlombaan teknologi sesungguhnya, di mana perusahaan-perusahaan besar bersaing untuk mendapatkan model yang lebih kuat dan efisien. DeepSeek, sebuah perusahaan yang berbasis di Tiongkok, telah muncul ke permukaan dengan rilis berikutnya: Pencarian Mendalam R2, yang menurut data yang bocor, bisa menjadi pengubah permainan dengan menawarkan IA berkapasitas tinggi dengan biaya yang jauh lebih rendah dibandingkan pesaing langsungnya.
Berita ini telah menyebar seperti api di sektor teknologi, karena DeepSeek R2 bertujuan untuk menjadi alternatif yang layak dan terjangkau bagi raksasa seperti ChatGPT, Google Gemini atau Meta Llama. Keinginan untuk bersaing secara langsung didasarkan pada argumen yang kuat: Biaya pemrosesan informasi dalam jumlah besar, menurut perkiraan, akan jauh lebih rendah daripada model-model mutakhir saat ini.
Fitur Teknis DeepSeek R2
DeepSeek R2 disajikan sebagai model kecerdasan buatan generatif sumber terbuka, memungkinkan perusahaan dan pengembang individu untuk meneliti, menyesuaikan, dan mengadaptasi teknologi sesuai kebutuhan mereka. Versi barunya menerapkan 1,2 triliun parameter, dengan demikian meningkatkan standar dibandingkan pendahulunya dan mendekati kinerja opsi tercanggih di pasaran.
Model ini telah dilatih dengan bantuan data sebesar 5,2 petabyte, Kebanyakan dari mereka berasal dari set C-Eval 2.0, detail yang menyoroti besarnya pekerjaan yang dilakukan. Dalam hal kemampuan, kinerja visi komputernya diharapkan mencapai hasil yang luar biasa, mencapai akurasi hingga 92,4% dalam pengujian dengan sistem COCO.
Biaya penggunaan adalah salah satu keuntungan terpentingnya. Menurut kebocoran, pengoperasian dengan DeepSeek R2 hanya akan memerlukan biaya $0,07 per juta token yang dimasukkan dan $0,27 per juta token yang dikeluarkan, yang merupakan pengurangan biaya hampir 97% dibandingkan dengan GPT-4.
Kemandirian teknologi dengan chip Huawei Ascend
Salah satu perubahan paling relevan dalam pengembangan DeepSeek R2 adalah komitmen untuk perangkat keras nasional 82% chip yang digunakan selama pelatihan berasal dari seri Huawei Ascend 910B, menandai perubahan yang jelas dari penggunaan GPU NVIDIA, yang selama ini umum di industri. Keputusan ini tidak hanya melibatkan pengurangan drastis dalam biaya energi dan produksi, tetapi juga kedaulatan teknologi yang lebih besar, terutama untuk pasar Cina.
Pergeseran ke arah solusi lokal ini memungkinkan DeepSeek untuk terus bergerak maju secara mandiri dan mengurangi ketergantungan pada rantai pasokan AS, yang dapat menandakan pergeseran dalam pengembangan AI di masa mendatang, baik di Tiongkok maupun pasar berkembang lainnya.
Pesaing global melawan raksasa AI
Dalam lanskap di mana inovasi terus-menerus terjadi, DeepSeek R2 muncul sebagai pesaing yang dapat memberi tekanan pada model populer seperti GPT-4 Turbo atau Google Gemini 2.0 Pro, berkat rasio harga-kinerjanya. Fokus pada efisiensi dan skalabilitas, ditambah dengan filosofi sumber terbuka, membuatnya menarik bagi pengembang perusahaan dan independen yang mencari alternatif yang lebih hemat biaya tanpa mengorbankan kinerja.
Untuk saat ini, sebagian besar rincian yang tersedia berasal dari kebocoran dan analisis oleh para ahli AI, dan kita harus menunggu konfirmasi resmi dari perusahaan. Namun, ekspektasi yang dihasilkan oleh model baru ini tidak dapat disangkal dan menandai titik balik dalam tren biaya dalam kecerdasan buatan generatif.
Tren meningkatnya persaingan di bidang AI terus berlanjut, mendorong kemajuan yang mendemokratisasi akses ke teknologi ini. DeepSeek R2 merupakan langkah penting dalam pencarian solusi yang lebih mudah diakses dan berkelanjutan, mampu mendemokratisasi akses ke kecerdasan buatan tingkat lanjut baik di dalam maupun di luar Asia.
Penulis yang bersemangat tentang dunia byte dan teknologi secara umum. Saya suka berbagi ilmu melalui tulisan, dan itulah yang akan saya lakukan di blog ini, menunjukkan kepada Anda semua hal paling menarik tentang gadget, perangkat lunak, perangkat keras, tren teknologi, dan banyak lagi. Tujuan saya adalah membantu Anda menavigasi dunia digital dengan cara yang sederhana dan menghibur.
