HANGZHOU, CHINA – Media OutReach Newswire – Alibaba resmi meluncurkan Qwen3, generasi terbaru dari keluarga large language model (LLM) open-source mereka, menetapkan tolok ukur baru dalam inovasi kecerdasan buatan (AI).

Seri Qwen3 menghadirkan enam model dense dan dua model Mixture-of-Experts (MoE), menawarkan fleksibilitas bagi para pengembang untuk membangun aplikasi generasi berikutnya di berbagai bidang seperti perangkat mobile, kacamata pintar, kendaraan otonom, robotik, dan banyak lagi.

Seluruh model Qwen3 – termasuk model dense (0,6 miliar, 1,7 miliar, 4 miliar, 8 miliar, 14 miliar, dan 32 miliar parameter) serta model MoE (30 miliar dengan 3 miliar aktif, dan 235 miliar dengan 22 miliar aktif) – kini telah tersedia secara open-source dan dapat diakses secara global.

Hybrid Reasoning: Menggabungkan Mode Berpikir dan Non-Berfikir

Qwen3 menandai debut Alibaba dalam pengembangan model hybrid reasoning, yang menggabungkan kemampuan tradisional LLM dengan penalaran dinamis tingkat lanjut. Model Qwen3 mampu beralih secara mulus antara mode berpikir untuk tugas-tugas kompleks berjenjang seperti matematika, pemrograman, dan deduksi logis, serta mode non-berpikir untuk respons cepat dan serba guna.

Bagi pengembang yang mengakses Qwen3 melalui API, tersedia kontrol granular atas durasi berpikir (hingga 38.000 token), memungkinkan keseimbangan optimal antara performa kecerdasan dan efisiensi komputasi. Secara khusus, model Qwen3-235B-A22B MoE menawarkan pengurangan biaya deployment secara signifikan dibandingkan model canggih lainnya, memperkuat komitmen Alibaba untuk menghadirkan AI berperforma tinggi yang terjangkau.

Terobosan dalam Kemampuan Multibahasa, Agen, Penalaran, dan Human Alignment

Dilatih menggunakan dataset masif sebesar 36 triliun token — dua kali lipat dari Qwen2.5 — Qwen3 menunjukkan kemajuan besar dalam penalaran, mengikuti instruksi, penggunaan alat, dan tugas multibahasa.

Kemampuan unggulan Qwen3 meliputi:

  • Penguasaan Multibahasa: Mendukung 119 bahasa dan dialek dengan performa terdepan dalam terjemahan dan instruksi multibahasa.
  • Integrasi Agen Lanjutan: Secara native mendukung Model Context Protocol (MCP) dan pemanggilan fungsi, memimpin di antara model open-source dalam tugas berbasis agen kompleks.
  • Penalaran Superior: Melampaui model Qwen sebelumnya (QwQ untuk mode berpikir dan Qwen2.5 untuk mode non-berpikir) dalam benchmark matematika, pemrograman, dan penalaran logis.
  • Peningkatan Human Alignment: Menyajikan pengalaman percakapan yang lebih alami dan kreatif, termasuk penulisan kreatif, role-playing, dan percakapan multi-giliran yang lebih hidup dan menarik.
Keterangan Foto: Model Qwen3 meraih hasil terbaik di berbagai benchmark industri.

Berkat kemajuan dalam arsitektur model, peningkatan volume data pelatihan, serta metode pelatihan yang lebih efektif, model Qwen3 berhasil mencapai hasil tingkat atas di benchmark industri seperti AIME25 (penalaran matematika), LiveCodeBench (kemampuan pemrograman), BFCL (kemampuan penggunaan alat dan fungsi), dan Arena-Hard (benchmark untuk LLM yang disetel dengan instruksi).
Dalam mengembangkan model hybrid reasoning ini, Alibaba menerapkan proses pelatihan empat tahap, yang mencakup cold start long chain-of-thought (CoT), reinforcement learning (RL) berbasis penalaran, fusi mode berpikir, serta general RL.

Akses Terbuka untuk Mendorong Inovasi

Model Qwen3 kini tersedia secara gratis untuk diunduh melalui Hugging Face, GitHub, dan ModelScope, serta dapat dijelajahi di chat.qwen.ai. Akses API juga akan segera tersedia melalui platform pengembangan model AI Alibaba, Model Studio. Selain itu, Qwen3 juga menjadi tenaga penggerak aplikasi asisten AI unggulan Alibaba, Quark.

Sejak diluncurkan, keluarga model Qwen telah menarik lebih dari 300 juta unduhan di seluruh dunia. Para pengembang telah menciptakan lebih dari 100.000 model turunan berbasis Qwen di Hugging Face, menjadikan Qwen salah satu seri model AI open-source dengan adopsi terbanyak di dunia.