Jakarta –
Model AI pratinjau QwQ-32B baru dengan kemampuan penalaran telah hadir. Model ini adalah salah satu dari sedikit model pesaing o1 OpenAI dan model pertama yang tersedia untuk diunduh dengan lisensi permisif.
Dikembangkan oleh tim Qwen Alibaba, pratinjau QwQ-32B memiliki 32,5 miliar parameter dan dapat mempertimbangkan perintah hingga sekitar 32 ribu kata. Model ini mengungguli o1-preview dan o1-mini, dua model estimasi yang dirilis OpenAI sejauh ini, pada benchmark tertentu.
Menurut pengujian Alibaba, pratinjau QwQ-32B mengungguli model pratinjau o1 OpenAI dalam pengujian AIME dan MATH. AIME menggunakan model AI lain untuk mengevaluasi kinerja model, sedangkan MATH adalah kumpulan soal kata
Dikutip dari TechCrunch, pratinjau QwQ-32B dapat memecahkan teka-teki logika dan menjawab pertanyaan matematika yang cukup menantang berkat kemampuan “logika” yang dimilikinya. Namun model ini belum sempurna. Alibaba mencatat dalam postingan blognya bahwa model tersebut dapat berpindah bahasa secara tiba-tiba, terjebak dalam lingkaran, dan berkinerja buruk pada tugas-tugas yang memerlukan “akal sehat”.
Tidak seperti kebanyakan AI, Pratinjau QwQ-32B dan model logika lainnya memverifikasi informasi secara efektif. Hal ini membantu mereka menghindari beberapa masalah yang cenderung dialami oleh model, dengan kelemahannya adalah mereka sering membutuhkan waktu lebih lama untuk mencapai solusi.
Seperti o1, QwQ-32B-Preview memikirkan tugas, rencana ke depan, dan melakukan beberapa tindakan yang membantu model menemukan jawaban.
Pratinjau QwQ-32B, yang dapat diluncurkan dan diunduh dari platform pengembangan AI Hugging Face, tampak seperti model logika Dipsic yang baru-baru ini dirilis yang secara cermat memeriksa isu-isu politik tertentu.
Alibaba dan Dipsic, sebagai perusahaan Tiongkok, sedang dijadikan tolok ukur oleh regulator internet Tiongkok untuk memastikan pola respons mereka “mewujudkan nilai-nilai inti sosialisme-komunisme”. Banyak sistem AI Tiongkok yang menolak menanggapi isu-isu yang dapat memicu kemarahan regulator, seperti spekulasi mengenai rezim Xi Jinping.
Misalnya, ketika Pratinjau QwQ-32B ditanya “Apakah Taiwan bagian dari Tiongkok?”, sistem AI menjawab bahwa Taiwan adalah bagian dari Tiongkok (dan “tidak dapat dicabut”). Ini adalah pandangan yang tidak sejalan dengan sebagian besar negara di dunia, namun sejalan dengan partai berkuasa di Tiongkok.
Contoh lainnya, pertanyaan soal Lapangan Tiananmen tidak terjawab. Isu tersebut masih dianggap tabu dan sensitif di sebagian besar kalangan masyarakat Tiongkok.
Pratinjau QwQ-32B saat ini tersedia secara gratis di bawah lisensi Apache 2.0, yang berarti dapat digunakan untuk aplikasi komersial. Namun, hanya beberapa komponen model yang telah dirilis, sehingga tidak mungkin untuk menyalin Pratinjau QwQ-32B atau mendapatkan gambaran yang lebih baik tentang cara kerja sistemnya.
Meningkatnya perhatian terhadap pola penalaran muncul dari potensi “penskalaan hukum”. Teori lama yang menyatakan bahwa menyediakan model dengan lebih banyak data dan daya komputasi akan terus meningkatkan kemampuannya sedang mendapat sorotan. Serangkaian laporan pers menunjukkan bahwa model dari laboratorium AI besar, termasuk OpenAI, Google, dan Anthropic, tidak meningkat secara dramatis seperti dulu.
Hal ini menyebabkan adanya perlombaan metode, arsitektur, dan teknik baru untuk mengembangkan AI, salah satunya adalah komputasi selama pengujian. Juga dikenal sebagai komputasi tereka, komputasi waktu pengujian pada dasarnya memberi model waktu pemrosesan ekstra untuk dijalankan dan mendukung model seperti pratinjau o1 dan QwQ-32B.
Laboratorium besar selain OpenAI dan perusahaan Tiongkok bertaruh bahwa komputasi yang telah teruji oleh waktu adalah masa depan. Menurut laporan terbaru dari The Information, Google telah memperluas tim internalnya menjadi sekitar 200 orang yang berfokus pada model inferensi dan telah menambah kekuatan komputasi yang signifikan dalam upaya tersebut. Tonton video: Pemerintah mendorong KEK menjadi hub pengembangan semikonduktor dan AI (rns/rns)