Models for 32 GB+ VRAM

Large local models and high-bit quants for 32 GB+ VRAM setups. Sorted by Hugging Face downloads. Smallest GGUF file size shown per model.

AngelSlim/Hy3-GGUF

AngelSlim · from 83.30 GB · 109,749 downloads

antirez/glm-5.2-gguf

antirez · from 196.58 GB · 42,751 downloads

sokann/GLM-5.2-GGUF-2.244bpw

sokann · from 196.76 GB · 25,120 downloads

llmfan46/MiniMax-M2.7-ultra-uncensored-heretic-GGUF

llmfan46 · from 41.15 GB · 8,789 downloads

ggml-org/gpt-oss-120b-GGUF

ggml-org · from 59.03 GB · 8,554 downloads

audreyt/CyberNeurova-DeepSeek-V4-Flash-abliterated-GGUF

audreyt · from 80.76 GB · 7,951 downloads

frz1/GLM-5.2-abliterated-GGUF

frz1 · from 32.81 GB · 6,348 downloads

giannisan/Hy3-ds4-gguf

giannisan · from 78.81 GB · 6,053 downloads

RobinsonLabs/Qwen3.5-122B-A10B-abliterated-GGUF

RobinsonLabs · from 35.70 GB · 4,377 downloads

RobinsonLabs/Qwen3.5-REAP-212B-A17B-abliterated-GGUF

RobinsonLabs · from 52.41 GB · 3,884 downloads

icecubetr/GLM-5.2-REAM-GGUF

icecubetr · from 129.45 GB · 3,318 downloads

freakyskittle/kimi-k2.75-code-GGUF

freakyskittle · from 188.74 GB · 3,178 downloads

RemySkye/NVIDIA-Nemotron-Labs-3-Puzzle-75B-A9B-GGUF

RemySkye · from 29.30 GB · 2,404 downloads

sokann/GLM-5.2-GGUF-1.630bpw

sokann · from 142.96 GB · 2,093 downloads

sokann/DeepSeek-V4-Flash-GGUF

sokann · from 145.64 GB · 1,937 downloads

RobinsonLabs/Qwen3.5-REAP-262B-A17B-abliterated-GGUF

RobinsonLabs · from 64.50 GB · 1,782 downloads

SUPEROXIDES/ZAYA1_PREVIEW_74B-A4B_-_GGUF

SUPEROXIDES · from 25.98 GB · 1,746 downloads

autotrust/gpt-oss-120b-Fable-5-Distilled-GGUF

autotrust · from 75.15 GB · 1,636 downloads

plunderstruck/Qwen3-Coder-Next-ROCmFP4-GGUF

plunderstruck · from 39.85 GB · 1,503 downloads

kaitchup/MiniMax-M3-GGUF-MoQ

kaitchup · from 123.18 GB · 1,228 downloads

huihui-ai/Huihui-DeepSeek-V4-Flash-abliterated-GGUF

huihui-ai · from 80.84 GB · 1,112 downloads

sokann/GLM-5.2-GGUF-2.788bpw

sokann · from 244.49 GB · 1,048 downloads

ji-farthing/openPangu-2.0-Flash-ik-llama-GGUF

ji-farthing · from 53.46 GB · 1,010 downloads

twaggs88/DeepSeek-V4-Flash-REAP25-DSpark-ds4-GGUF

twaggs88 · from 85.05 GB · 934 downloads

Frosty40/Leanstral-1.5-119B-A6B-GGUF-NVFP4

Frosty40 · from 62.52 GB · 924 downloads

puwaer/Qwen3-Next-80B-A3B-Thinking-GRPO-Uncensored-gguf

puwaer · from 27.13 GB · 795 downloads

Myric/Kimi-Linear-48B-A3B-Instruct-APEX-GGUF

Myric · from 28.23 GB · 690 downloads

avar6/NVIDIA-Nemotron-3-Ultra-550B-A55B-Base-gguf

avar6 · from 31.71 GB · 655 downloads

AbteeXAILab/lumynax-reasoning-deepseek-r1-distill-llama-70b-gguf

AbteeXAILab · from 39.60 GB · 626 downloads

pcuenq/GLM-5.2-GGUF

pcuenq · from 334.22 GB · 593 downloads

Johnblick187/kimi-k2.7-code-abliterated-gguf

Johnblick187 · from 315.89 GB · 531 downloads

cloudyu/DeepSeek-V4-Flash-4Expert-GGUF

cloudyu · from 153.17 GB · 485 downloads

mradermacher/Hypernova-60B-2605-GGUF

mradermacher · from 28.72 GB · 455 downloads

majentik/gemma-4-26B-A4B-it-RotorQuant-GGUF-Q8_0

majentik · from 25.02 GB · 432 downloads

mradermacher/XORTRON-NXTXPRTXXL-GGUF

mradermacher · from 43.39 GB · 418 downloads

cloudyu/hy3-gguf

cloudyu · from 161.84 GB · 403 downloads

rcmorano/Jackrong-Qwopus3.6-35B-A3B-Coder-BF16-GGUF

rcmorano · from 66.19 GB · 396 downloads

majentik/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-TurboQuant-GGUF-Q8_0

majentik · from 31.28 GB · 380 downloads

majentik/gemma-4-31B-RotorQuant-GGUF-Q8_0

majentik · from 30.39 GB · 362 downloads

majentik/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-TurboQuant-GGUF-Q5_K_M

majentik · from 24.25 GB · 345 downloads

ghecko78/Laguna-S-2.1-NVFP4-GGUF

ghecko78 · from 67.03 GB · 339 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q4_K_M

majentik · from 80.14 GB · 334 downloads

greghavens/fabletron-nemotron-3-super-120b-GGUF

greghavens · from 80.14 GB · 321 downloads

andreaborio/DeepSeek-V4-Flash-Hebrus-GGUF

andreaborio · from 80.76 GB · 319 downloads

majentik/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-RotorQuant-GGUF-Q5_K_M

majentik · from 24.25 GB · 311 downloads

majentik/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-RotorQuant-GGUF-Q8_0

majentik · from 31.28 GB · 306 downloads

majentik/Qwen3.6-35B-A3B-RotorQuant-GGUF-Q8_0

majentik · from 34.37 GB · 292 downloads

majentik/gemma-4-26B-A4B-RotorQuant-GGUF-Q8_0

majentik · from 25.02 GB · 292 downloads

majentik/gemma-4-31B-it-RotorQuant-GGUF-Q8_0

majentik · from 30.39 GB · 285 downloads

zenlm/zen-5-mini-gguf

zenlm · from 128.84 GB · 282 downloads

zenlm/zen5-mini-gguf

zenlm · from 128.84 GB · 250 downloads

S1ntr/Qwen3.6-35b-a3b-Coder-GGUF

S1ntr · from 66.19 GB · 239 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q4_K_M

majentik · from 80.14 GB · 209 downloads

andreaborio/DeepSeek-V4-Flash-DS4-GGUF

andreaborio · from 80.76 GB · 207 downloads

arhamania/Qwen3-Coder-30B-A3B-Instruct-abliterated-GGUF

arhamania · from 30.25 GB · 191 downloads

zenlm/zen-5-max-gguf

zenlm · from 432.72 GB · 184 downloads

mradermacher/Latxa-Llama-3.1-70B-Instruct-v2-GGUF

mradermacher · from 24.56 GB · 183 downloads

EnclaveHost/qwen3.5-122b-gguf

EnclaveHost · from 56.09 GB · 179 downloads

giannisan/GLM-5.2-ds4-gguf

giannisan · from 196.58 GB · 174 downloads

majentik/Nemotron-Cascade-2-30B-A3B-TurboQuant-GGUF-Q5_K_M

majentik · from 24.25 GB · 167 downloads

Soofi-Project/Soofi-S-Instruct-Preview-GGUF

Soofi-Project · from 24.25 GB · 161 downloads

Johnblick187/Qwen2.5-Coder-32b-Instruct-Heretic-GGUF

Johnblick187 · from 32.43 GB · 160 downloads

majentik/Nemotron-Cascade-2-30B-A3B-RotorQuant-GGUF-Q8_0

majentik · from 31.28 GB · 159 downloads

otheru/DeepSeek-V4-Flash-Strix-Halo-GGUF

otheru · from 85.26 GB · 152 downloads

majentik/Nemotron-Cascade-2-30B-A3B-TurboQuant-GGUF-Q8_0

majentik · from 31.28 GB · 151 downloads

majentik/Nemotron-Cascade-2-30B-A3B-RotorQuant-GGUF-Q5_K_M

majentik · from 24.25 GB · 149 downloads

cloudyu/gpt-oss-120b-Fable-5-Distilled-GGUF

cloudyu · from 115.73 GB · 145 downloads

azanip/matter-llama-gguf

azanip · from 60.87 GB · 140 downloads

Merlinoz11/Solar-Open2-Apex-GGUF

Merlinoz11 · from 92.36 GB · 132 downloads

ddflr/qwimi-dolphin72b-474cold-q4km-gguf

ddflr · from 44.16 GB · 129 downloads

lellek/mita-qwen3.6-35B-gguf

lellek · from 26.56 GB · 124 downloads

mradermacher/MiMo-V2-Flash-Base-GGUF

mradermacher · from 104.57 GB · 122 downloads

zenlm/zen5-max-gguf

zenlm · from 432.72 GB · 112 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q6_K

majentik · from 105.17 GB · 102 downloads

Merlinoz11/Zengorithm-v1.0-GGUF

Merlinoz11 · from 27.05 GB · 102 downloads

kinson888/Huihui-DeepSeek-V4-Flash-Q2-ds4-GGUF

kinson888 · from 80.76 GB · 102 downloads

jcbtc/Laguna-S-2.1-Chadrock-ROCmFP4-StrixKVSpine-V4-GGUF

jcbtc · from 60.94 GB · 99 downloads

andreaborio/GLM-5.2-Hebrus-GGUF

andreaborio · from 244.14 GB · 98 downloads

mradermacher/MiniMax-M2.1-REAP-30-GGUF

mradermacher · from 55.04 GB · 96 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q8_0

majentik · from 119.65 GB · 92 downloads

mradermacher/L3.1-70b-MeowMix-GGUF

mradermacher · from 24.56 GB · 87 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q5_K_M

majentik · from 89.14 GB · 80 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q2_K

majentik · from 49.83 GB · 79 downloads

mradermacher/MiMo-V2-Flash-GGUF

mradermacher · from 104.57 GB · 77 downloads

majentik/Nemotron-3-Nano-30B-A3B-RotorQuant-GGUF-Q5_K_M

majentik · from 24.25 GB · 76 downloads

majentik/Qwen3.5-27B-RotorQuant-GGUF-Q8_0

majentik · from 26.63 GB · 74 downloads

Bluerosesbutterfly/BRIAN6145Qwen3.6-27B-Claude-Opus-Sonnet-DistilledV2-MTP-GGUF

Bluerosesbutterfly · from 27.05 GB · 70 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q2_K

majentik · from 49.83 GB · 69 downloads

mradermacher/llm-surgery-dark-arts-gpt-oss-60b-96a12-GGUF

mradermacher · from 30.25 GB · 68 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q3_K_M

majentik · from 62.61 GB · 67 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q8_0

majentik · from 119.65 GB · 65 downloads

ddh0/MiniMax-M2.5-GGUF

ddh0 · from 115.27 GB · 63 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q5_K_M

majentik · from 89.14 GB · 63 downloads

majentik/Nemotron-3-Super-120B-A12B-RotorQuant-GGUF-Q3_K_M

majentik · from 62.61 GB · 63 downloads

majentik/Nemotron-3-Super-120B-A12B-TurboQuant-GGUF-Q6_K

majentik · from 105.17 GB · 62 downloads

majentik/Nemotron-3-Nano-30B-A3B-TurboQuant-GGUF-Q8_0

majentik · from 31.28 GB · 60 downloads

Soofi-Project/Soofi-S-Rhine-Preview-GGUF

Soofi-Project · from 24.25 GB · 59 downloads

majentik/Nemotron-3-Nano-30B-A3B-RotorQuant-GGUF-Q8_0

majentik · from 31.28 GB · 56 downloads

andreaborio/DeepSeek-V4-Flash-DS4-ExpertMajor-v2-GGUF

andreaborio · from 80.76 GB · 52 downloads

bnjmnmarie/MiniMax-M3-GGUF-MoQ

bnjmnmarie · from 123.18 GB · 48 downloads

Run models locally with guIDE

Download guIDE — the AI-native code editor with local LLM inference and 69 built-in tools.

Download guIDE → · Browse 524k+ models · Compare models