nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any To Any·nvidia· 1.7M· 145

transformers other 18.3B params dataset:nvidia/Nemotron-Image-Training-v3arxiv:2604.24954base_model:nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

Open in MLForge Sign up free Desktop app Source ↗

# pull & run locally
pip install mlforge-sdk && mlforge pull nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Model details

Task

Any To Any

Provider

nvidia

Framework

transformers

Parameters

18.3B

Size

21 GB

License

other

Downloads

1.7M

Likes

145

Paper

arXiv:2604.24954

Updated

2026-05-05

About nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

------ Total parameters 31B (Mamba2-Transformer hybrid MoE) Active parameters ~3B per token Max context 256k tokens Modalities (in) Video, Audio, Image, Text Modality (out) Text Reasoning mode On by default; toggle via enablethinking Best for Video+speech analysis, document intelligence (OCR/charts/long docs), GUI/agentic workflows, ASR Minimum GPU (BF16) 1× H100 80GB (single-GPU); 1× B200 / 1× H200 recommended Minimum GPU (FP8) 1× L40S 48GB; 1× RTX Pro 6000 / 1× B200 recommended Minimum GPU (NVFP4) 1× RTX 5090 32GB; 1× DGX Spark / 1× Jetson Thor also supported Precisions BF16 (62 GB) · FP8 (33 GB) · NVFP4 (21 GB)

Related Any To Any

G google/gemma-4-E4B-it Any To Any ·8.0B params 6.0M 1.3K 🤗 HF G google/gemma-4-E2B-it Any To Any ·5.1B params 2.3M 777 🤗 HF G google/gemma-4-12B-it Any To Any ·12.0B params 2.2M 1.2K 🤗 HF Q Qwen/Qwen3-Omni-30B-A3B-Instruct Any To Any ·35.3B params 2.0M 944 🤗 HF G google/gemma-4-12B-it-qat-w4a16-ct Any To Any ·13.3B params 1.7M 33 🤗 HF Q Qwen/Qwen2.5-Omni-3B Any To Any ·5.5B params 1.7M 336 🤗 HF