SINGAPURA – Media OutReach Newswire – GLM-5, yang baru dirilis sebagai open-source, menandai pergeseran yang lebih luas dalam kecerdasan buatan. Model bahasa besar kini bergerak melampaui kemampuan membuat potongan kode atau prototipe antarmuka, menuju pembangunan sistem lengkap dan pelaksanaan tugas kompleks secara menyeluruh. Perubahan ini menandai transisi dari apa yang disebut “vibe coding” menuju apa yang semakin banyak disebut peneliti sebagai agentic engineering.

Keterangan Foto: Evaluasi Kinerja LLM: Agentik, Reasoning, dan Coding

Dirancang untuk fase baru ini, GLM-5 menjadi salah satu model open-source terkuat untuk pemrograman dan pelaksanaan tugas otonom. Dalam pengaturan pemrograman praktis, kinerjanya mendekati Claude Opus 4.5, terutama dalam desain sistem kompleks dan tugas jangka panjang yang membutuhkan perencanaan dan eksekusi berkelanjutan.

Model ini dibangun pada arsitektur baru yang bertujuan meningkatkan kemampuan sekaligus efisiensi. Jumlah parameternya meningkat dari 355 miliar menjadi 744 miliar, dengan parameter aktif naik dari 32 miliar menjadi 40 miliar, sementara data pra-pelatihan tumbuh menjadi 28,5 triliun token. Peningkatan ini dipadukan dengan kemajuan metode pelatihan. Sebuah kerangka bernama Slime memungkinkan pembelajaran penguatan asinkron skala besar, memungkinkan model belajar secara berkelanjutan dari interaksi panjang dan meningkatkan efisiensi pasca-pelatihan. GLM-5 juga memperkenalkan DeepSeek Sparse Attention, yang mempertahankan kinerja konteks panjang sambil menurunkan biaya penerapan dan meningkatkan efisiensi token.

Hasil benchmark menunjukkan peningkatan signifikan. Pada SWE-bench-Verified dan Terminal Bench 2.0, GLM-5 mencetak skor 77,8 dan 56,2, masing-masing, yang merupakan hasil tertinggi yang dilaporkan untuk model open-source, melampaui Gemini 3 Pro dalam beberapa tugas rekayasa perangkat lunak. Pada Vending Bench 2, yang mensimulasikan menjalankan bisnis mesin penjual otomatis selama setahun, GLM-5 mencapai saldo $4,432, memimpin model open-source lainnya dalam manajemen operasional dan ekonomi.

Hasil ini menyoroti kualitas yang dibutuhkan untuk agentic engineering: mempertahankan tujuan dalam jangka panjang, mengelola sumber daya, dan mengoordinasikan proses multi-langkah. Seiring model semakin menguasai kemampuan ini, batas depan AI tampak bergeser dari sekadar menulis kode menjadi menyampaikan sistem yang berfungsi secara utuh.

Chat & Akses API Resmi
Z.ai Chat: https://chat.z.ai
GLM Coding Plan: https://z.ai/subscribe?utm_source=pr&utm_medium=press&utm_campaign=launch

Repositori Open-Source

GitHub: https://github.com/zai-org/GLM-5
Hugging Face: https://huggingface.co/zai-org/GLM-5

Blog Teknis

GLM-5 Technical Blog: https://z.ai/blog/glm-5