Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,210

Full-text search

Active filters: nvidia

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated about 12 hours ago • 6.44k • 173

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated about 12 hours ago • 56k • 113

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated 1 day ago • 8.96k • 108

unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-GGUF

Text Generation • 121B • Updated 2 days ago • 26.4k • 51

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated 21 days ago • 939k • 668

nvidia/Qwen3-Nemotron-235B-A22B-GenRM-2603

Text Generation • 235B • Updated 4 days ago • 229 • 16

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-Base-BF16

Text Generation • 124B • Updated 3 days ago • 1.41k • 15

unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated 3 days ago • 20.7k • 12

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Text Generation • 32B • Updated 21 days ago • 1.45M • • 300

nvidia/Cosmos-Reason2-8B

Image-Text-to-Text • 9B • Updated 3 days ago • 109k • 144

nvidia/Nemotron-Terminal-8B

Text Generation • 8B • Updated 14 days ago • 2.05k • 24

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 21 days ago • 479k • 111

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 10 days ago • 304k • 64

embedl/Cosmos-Reason2-2B-W4A16-Edge2-FlashHead

Image-Text-to-Text • 2B • Updated 3 days ago • 730 • 6

nvidia/Kimi-K2.5-Thinking-Eagle3

Text Generation • Updated 3 days ago • 92 • 6

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated Dec 31, 2025 • 116k • 276

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated Feb 5 • 1.42k • 8

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 23 days ago • 110k • 67

unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated 2 days ago • 190 • 5

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-Base-BF16

Text Generation • 32B • Updated 21 days ago • 67.7k • 113

nvidia/Cosmos-Reason2-2B

Image-Text-to-Text • Updated 3 days ago • 107k • 54

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 21.4k • 26

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 29k • 16

nvidia/NVIDIA-Nemotron-Nano-9B-v2

Text Generation • 9B • Updated 9 days ago • 301k • 482

nvidia/gliner-PII

Token Classification • Updated Dec 7, 2025 • 6.57k • 83

nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese

Text Generation • 9B • Updated 22 days ago • 230k • 124

nvidia/Nemotron-Terminal-32B

Text Generation • 33B • Updated 14 days ago • 1.27k • 29

nvidia/Cosmos-Embed1-448p-anomaly-detection

Video Classification • 1B • Updated 4 days ago • 49 • 3

nvidia/Llama-3.1-Nemotron-70B-Reward

Updated Apr 13, 2025 • 19 • 80

nvidia/Llama-3.1-Nemotron-70B-Reward-HF

71B • Updated Apr 13, 2025 • 1.45k • 92