Di sisi lain, model MoE Qwen3-235B-A22B disebut secara khusus dirancang untuk memberikan kinerja unggulan dengan biaya operasional yang diklaim lebih rendah dibandingkan model sekelasnya.
Kemampuan Unggulan Qwen3
Qwen3 dilatih menggunakan dataset sebesar 36 triliun token, yang disebut dua kali lipat lebih besar dari pendahulunya Qwen2.5, di mana Qwen3 memperlihatkan peningkatan signifikan dalam kemampuan multibahasa, pemrosesan instruksi, penggunaan alat digital, dan penyesuaian dengan preferensi manusia.
Fitur utama Qwen3 meliputi:
1. Kemampuan Multibahasa
Mendukung 119 bahasa dan dialek, dengan performa terdepan dalam penerjemahan dan mengikuti instruksi multibahasa.
2. Integrasi Agen Canggih
Mendukung secara native Model Context Protocol (MCP) dan pemanggilan fungsi yang andal, menjadikan Qwen 3 pemimpin di antara model open-source untuk tugas berbasis agen AI yang kompleks.
3. Penalaran Kognitif Tingkat Lanjut
Melampaui model Qwen sebelumnya (QwQ dalam mode berpikir dan Qwen2.5 dalam mode non-berpikir) dalam tolok ukur matematika, pengkodean, dan penalaran logis.
4. Penyesuaian terhadap Preferensi Manusia
Menghasilkan pengalaman menulis kreatif, bermain peran, dan dialog bergilir yang terasa lebih alami dan menarik.
Dominasi di Berbagai Tolok Ukur Industri
Qwen3 mencatat performa unggulan dalam berbagai benchmark industri, seperti AIME25 (penalaran matematika), LiveCodeBench (pengkodean), BFCL (penggunaan alat), dan Arena-Hard (pengujian pemahaman instruksi).
Dengan demikian, model ini dikembangkan melalui pendekatan pelatihan empat tahap yang mencakup long chain-of-thought cold start, reinforcement learning (RL) berbasis penalaran, fusi mode berpikir, serta reinforcement learning umum.
Qwen3 telah tersedia untuk diunduh gratis melalui Hugging Face, GitHub, dan ModelScope. Model ini juga dapat diuji langsung melalui chat.qwen.ai, dan akses API akan tersedia melalui Model Studio, platform pengembangan model AI dari Alibaba Cloud.
(wep)