GLM-5

MoE decoder architecture with MLA + Sparse Attention attention mechanism.

MLA + Sparse Attention·MoE · 40B active

40B active / 744B total|202K context|MLA + Sparse Attention|MoE

Architecture Specifications

Parameters40B active / 744B total

Context Window202K

Decoder TypeMoE

AttentionMLA + Sparse Attention

Active Parameters40B

Release Date2026-02

CategoryMixture of Experts

OrganizationZhipu AI

MLA adoptionSparse attention40B active

Enterprise AI platform

Colaberry AI provides architecture specifications, benchmark comparisons, and deployment guidance for enterprise AI teams.