Model Intelligence Sheet
xCloudinfo/NVIDIA-Nemotron-3-Nano-30B-A3B-GGUF overview
NVIDIA Nemotron 3 Nano 30B A3B GGUF 云碩科技 · xCloudinfo · 系列: 社群量化 · Community GGUF nvidia/NVIDIA Nemotron 3 Nano 30B A3B https://huggingface.co/nvidia/NVIDIA Ne…
Runs locally from ~22.83 GB disk (24 GB VRAM class GPUs with llama.cpp / guIDE).
Repository Files & Downloads
4 GGUF files detected
Direct downloads for local inference
Model Details
| Model ID | xCloudinfo/NVIDIA-Nemotron-3-Nano-30B-A3B-GGUF |
|---|---|
| Author | xCloudinfo |
| Pipeline | text-generation |
| License | other |
| Base model | nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16 |
| Last modified | 2026-06-14T02:05:34.000Z |
Model README
---
license: other
license_name: nvidia-open-model-license
base_model: nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16
language:
- en
- es
- fr
- de
- ja
- it
tags:
- nemotron
- moe
- gguf
- llama-cpp
- xcloudinfo
pipeline_tag: text-generation
---
NVIDIA-Nemotron-3-Nano-30B-A3B-GGUF
云碩科技 · xCloudinfo · 系列:社群量化 · Community GGUF
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B 的 GGUF(llama.cpp / Ollama) 量化版本(30B 總參、A3B≈3B 活躍 MoE),供地端部署。
> 各量化等級見 Files 分頁。
用法
llama-server -m NVIDIA-Nemotron-3-Nano-30B-A3B-<quant>.gguf -c 4096 -ngl 99
授權與來源聲明
- 基底:
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B。 - 授權依 NVIDIA Open Model License(原作者條款);使用須遵守該授權與適用法律。
- 模型本體與能力屬 NVIDIA;本 repo 僅提供重新量化之 GGUF。
---
由 云碩科技 xCloudinfo 重新量化、散布。
Run xCloudinfo/NVIDIA-Nemotron-3-Nano-30B-A3B-GGUF with guIDE
Download guIDE — the AI-native code editor with local LLM inference and 69 built-in tools.
Source: Hugging Face · Compare models