Nemotron 3 Super

Hybrid decoder architecture with Mostly Mamba-2 + GQA attention mechanism.

Mostly Mamba-2 + GQA·SwiGLU

12B active / 120B total|1M context|Mostly Mamba-2 + GQA|Hybrid

Architecture Specifications

Parameters12B active / 120B total

Context Window1M

Decoder TypeHybrid

AttentionMostly Mamba-2 + GQA

Active Parameters12B

Release Date2026-03

CategoryHybrid Architecture

OrganizationNVIDIA

Mamba-2 SSM1M context12B active hybrid

Enterprise AI platform

Colaberry AI provides architecture specifications, benchmark comparisons, and deployment guidance for enterprise AI teams.