Jakarta –
Komunitas AI Sedang Sibuk, Deepsee berbicara tentang R1, model linguistik AI besar Tiongkok, karena mampu menandingi produk AI Amerika dengan biaya rendah. Model ini dikembangkan dari awal oleh Deepsee, yang mana R1 diklaim sama melebihi Openai Card, namun bekerja dengan biaya yang jauh lebih murah.
“Ini bisa menjadi penemuan yang sangat bagus bagi para peneliti dan pengembang dengan sumber daya terbatas,” kata Hancheng Cao, asisten profesor Sistem Informasi di Universitas Emory.
Deepsee sukses besar, perusahaan AI Tiongkok hingga merek canggih yang terkait dengan kontrol ekspor kami. Namun, Aliih, di saat kemampuan Tiongkok melemah, sanksi tersebut justru mendorong perusahaan startup seperti Deepseek untuk berinovasi.
Menurut Zihan Wang, mantan karyawan Deepseek, Deepseek perlu mengurangi bobot GPU-nya, jenis GPU yang dirilis Nvidia untuk pasar Cina, dan performanya setengah dari produknya.
Para peneliti memuji Deepseek R1 karena kemampuannya dalam melakukan penalaran yang kompleks, terutama dalam matematika dan coding. Model ini menggunakan pendekatan ‘rantai pemikiran’ yang mirip dengan Chatgpt O1, yang memungkinkan terjadinya masalah pemrosesan ekor.
Dimitris Papailiopoulos, peneliti di AI Frontiers di Microsoft Research Lab, mengatakan hal yang paling mengejutkan tentang R1 adalah kesederhanaan rekayasanya. “Deepsee bertujuan untuk mendapatkan jawaban yang akurat. Ini secara signifikan mengurangi waktu komputasi sekaligus mempertahankan tingkat efisiensi yang tinggi,” katanya.
Meskipun perdebatan sengit seputar R1, Deepseek relatif tidak dikenal. Berbasis di Hangzhou, perusahaan ini didirikan pada Juli 2023 oleh Liang Wenfeng, lulusan Universitas Zhejiang dengan latar belakang teknik informasi dan elektronik. Seperti Sam Altman dari OpenAI, Liang ingin membangun Artificial General Intelligence (AGI), AI yang dapat menandingi atau mengalahkan kecerdasan manusia.
Ada alasan lain mengapa Deepseek canggih. Jauh sebelum sanksi AS, Liang mendapat tawaran bagus untuk chip NVIDIA A100, jenis yang kini dilarang diekspor ke China. Media Tiongkok memperkirakan perusahaan tersebut memiliki lebih dari 10.000 makhluk, namun Dylan Patel, pendiri semi-analitik, memperkirakan mereka memiliki setidaknya 50.000 unit.
Mengidentifikasi potensi pelatihan AI ini adalah sesuatu yang dapat digunakan Burrows untuk mengembangkan model AI.
Liang mengatakan tantangan tambahan yang dihadapi oleh perusahaan-perusahaan Tiongkok selain sanksi kentang goreng, teknik rekayasa AI cenderung tidak efektif. “Untuk mendapatkan hasil yang sama kami harus mengonsumsi daya komputasi dua kali lebih banyak. Tujuan kami adalah untuk terus menutup kesenjangan tersebut,” ujarnya. Deepseek telah menemukan cara untuk menggunakan memori dan mempercepat penghitungan tanpa memengaruhi akurasi.
Namun, Deepsees menemukan cara untuk menggunakan memori dan mempercepat penghitungan tanpa ketidakakuratan yang signifikan. “Tim ingin mengubah tantangan materi menjadi peluang inovasi,” kata Wang. Simak video “Video: Cara Menggunakan Fitur Meta AI di WhatsApp” (FYK/HPS)