Models for 12 GB VRAM

Models that fit 12 GB VRAM with room for context and batching. Sorted by Hugging Face downloads. Smallest GGUF file size shown per model.

ggml-org/gpt-oss-20b-GGUF

ggml-org · from 11.28 GB · 63,141 downloads

el4/SIQ-1-35B-OPAL-GGUF

el4 · from 10.03 GB · 14,999 downloads

el4/Qwopus3.6-35B-A3B-Coder-OPAL-GGUF

el4 · from 10.86 GB · 13,205 downloads

pearsonkyle/gemma-4-31b-it-imatrix-GGUF

pearsonkyle · from 10.17 GB · 12,447 downloads

realrebelai/Wan_Dancer_GGUFs

realrebelai · from 9.12 GB · 12,264 downloads

pearsonkyle/gemma-4-31B-it-awq-2bit-GGUF

pearsonkyle · from 10.17 GB · 12,187 downloads

el4/Darwin-36B-Opus-OPAL-GGUF

el4 · from 10.03 GB · 10,381 downloads

Brian6145/Qwen3.6-27B-Claude-Opus-DeepSeek-Distilled-Imatrix-MTP-GGUF

Brian6145 · from 10.12 GB · 9,601 downloads

bytkim/Qwen3.6-27B-MTP-pi-reasoning-GGUF

bytkim · from 10.15 GB · 8,169 downloads

Bahushruth/Qwen3.6-35B-A3B-abliterated-v4-GGUF

Bahushruth · from 10.86 GB · 6,915 downloads

BeaverAI/Artemis-31B-v1k-GGUF

BeaverAI · from 11.10 GB · 6,404 downloads

comfyit/Wan22_Bernini_GGUF

comfyit · from 8.99 GB · 6,385 downloads

Jackrong/Qwopus-GLM-18B-Merged-GGUF

Jackrong · from 9.16 GB · 5,656 downloads

BeaverAI/Artemis-31B-v1j-GGUF

BeaverAI · from 11.10 GB · 3,880 downloads

AbteeXAILab/lumynax-reasoning-gpt-oss-20b-gguf

AbteeXAILab · from 11.28 GB · 3,360 downloads

DavidAU/Command-R-01-Ultra-NEO-DARK-HORROR-V1-V2-35B-IMATRIX-GGUF

DavidAU · from 10.34 GB · 3,330 downloads

TaQuants/Tema_Q-X4-Thinking-TaQuants-GGUF

TaQuants · from 10.30 GB · 3,268 downloads

pearsonkyle/tmax-27b-imatrix-MTP-GGUF

pearsonkyle · from 8.89 GB · 2,982 downloads

trjxter/Qwimi-3.6-27B-Coder-MTP-GGUF

trjxter · from 11.27 GB · 2,900 downloads

pearsonkyle/Qwopus3.6-27B-Coder-imatrix-MTP-GGUF

pearsonkyle · from 8.89 GB · 2,651 downloads

pearsonkyle/Qwopus3.6-27B-Coder-2bit-MTP-GGUF

pearsonkyle · from 8.89 GB · 2,558 downloads

DAXZEIT/GRM-2.6-Plus-0628-MTP-reasoning-i1-GGUF

DAXZEIT · from 10.14 GB · 2,507 downloads

AtomicChat/qwen3-coder-30b-a3b-GGUF

AtomicChat · from 10.49 GB · 2,383 downloads

bytkim/Qwen3.6-27B-MTP-pi-tune-GGUF

bytkim · from 10.15 GB · 2,165 downloads

ManniX-ITA/Qwen3.6-27B-Omnimerge-v4-MTP-GGUF

ManniX-ITA · from 9.54 GB · 2,136 downloads

AbteeXAILab/lumynax-moe-moonlight-16b-a3b-gguf

AbteeXAILab · from 8.14 GB · 2,051 downloads

DavidAU/L3.1-MOE-6X8B-Dark-Reasoning-Dantes-Peak-HORROR-R1-Uncensored-36B-GGUF

DavidAU · from 9.08 GB · 1,970 downloads

SUPEROXIDES/HIVEMIND_PREVIEW_32B_-_GGUF

SUPEROXIDES · from 8.40 GB · 1,958 downloads

DavidAU/MN-DARKEST-UNIVERSE-29B-GGUF

DavidAU · from 10.25 GB · 1,946 downloads

DavidAU/MN-Oblivion-26B-UNCENSORED-NEO-Imatrix-GGUF

DavidAU · from 9.15 GB · 1,784 downloads

AtomicChat/qwen36-27b-GGUF

AtomicChat · from 9.98 GB · 1,371 downloads

mradermacher/atlas-trm10-gemma4-26b-GGUF

mradermacher · from 9.86 GB · 1,147 downloads

liodon-ai/Qwable-3.6-27b-imatrix-GGUF

liodon-ai · from 10.12 GB · 1,036 downloads

AbteeXAILab/lumynax-reasoning-deepseek-distill-text-gguf

AbteeXAILab · from 8.37 GB · 953 downloads

AlexAtomic/qwen3-coder-30b-a3b-GGUF

AlexAtomic · from 10.49 GB · 935 downloads

AlexAtomic/qwen36-27b-GGUF

AlexAtomic · from 9.98 GB · 897 downloads

ccharnkij/Phi-4-Uncensored-GGUF

ccharnkij · from 8.44 GB · 891 downloads

mradermacher/Mistral-Small-24B-Instruct-Jbliterated-GGUF

mradermacher · from 8.28 GB · 877 downloads

ilintar/Ornith-1.0-35B-GGUF

ilintar · from 11.82 GB · 848 downloads

Lucebox/DeepSeek-V4-Flash-DSpark-draft-GGUF

Lucebox · from 10.53 GB · 779 downloads

mradermacher/Aurora-Code-1-GGUF

mradermacher · from 10.49 GB · 752 downloads

AbteeXAILab/lumynax-infused-phi-4-text-gguf

AbteeXAILab · from 8.44 GB · 704 downloads

majentik/gpt-oss-20b-RotorQuant-GGUF-IQ4_XS

majentik · from 11.40 GB · 692 downloads

kairusama/Qwen3.6-27B-Omnimerge-v4-MTP-IQ3_XXS-GGUF

kairusama · from 10.64 GB · 688 downloads

Iloqt/Versi-StyleTune-31B-GGUF

Iloqt · from 11.53 GB · 687 downloads

deucebucket/Qwen3.6-27B-Cerebellum-GGUF

deucebucket · from 11.98 GB · 650 downloads

vinpix/Ternary-Bonsai-27B-Stock-MTP-GGUF

vinpix · from 8.18 GB · 641 downloads

ManniX-ITA/gemma-4-31b-he1-it-GGUF

ManniX-ITA · from 8.08 GB · 604 downloads

Brian6145/Qwen3.6-27B-Claude-Opus-DeepSeek-Distilled-Imatrix-MTP-1M-GGUF

Brian6145 · from 10.12 GB · 584 downloads

FINAL-Bench/POCKET-26B-GGUF

FINAL-Bench · from 10.36 GB · 534 downloads

AbteeXAILab/lumynax-infused-qwen3-14b-gguf

AbteeXAILab · from 8.38 GB · 533 downloads

mradermacher/Gemma-4-31B-storymaxxed2-GGUF

mradermacher · from 11.10 GB · 495 downloads

AtomicChat/Qwen2.5-14B-Instruct-GGUF

AtomicChat · from 8.37 GB · 474 downloads

majentik/gemma-4-26B-A4B-it-RotorQuant-GGUF-Q2_K

majentik · from 9.86 GB · 435 downloads

mradermacher/Gemma-4-31B-storymaxxed-GGUF

mradermacher · from 11.10 GB · 395 downloads

TracNetwork/mayhem-catalog-deepseek-r1-distill-qwen-14b-GGUF

TracNetwork · from 8.37 GB · 376 downloads

mradermacher/Paimon-24B-v1-GGUF

mradermacher · from 8.28 GB · 344 downloads

ressl/gemma-4-31B-it-uncensored-GGUF

ressl · from 11.10 GB · 343 downloads

ManniX-ITA/Qwen3.5-27B-Omnimerge-GGUF

ManniX-ITA · from 10.42 GB · 335 downloads

mfielding92/SmartCode-Fable-5-CoT-Reasoning-QVO-Qwen-3.6-27B-Distilled-GGUF

mfielding92 · from 11.18 GB · 332 downloads

HackerTwins/NVIDIA-Nemotron-Labs-3-Elastic-12B-A2B-GGUF

HackerTwins · from 8.07 GB · 330 downloads

cafepm/GLM-4.7-Flash-REAP-23B-A3B-Q3Q4-GGUF

cafepm · from 10.34 GB · 308 downloads

AliceThirty/G4-Alice-v1.2-31B-gguf

AliceThirty · from 11.10 GB · 300 downloads

YanissAmz/DeepSeek-V4-Flash-DSpark-draft-GGUF

YanissAmz · from 10.15 GB · 300 downloads

FINAL-Bench/Darwin-35B-A3B-Opus-Q8-GGUF

FINAL-Bench · from 10.01 GB · 286 downloads

mradermacher/Paimon-24B-v2-GGUF

mradermacher · from 8.28 GB · 280 downloads

majentik/gpt-oss-20b-RotorQuant-GGUF-Q2_K

majentik · from 11.24 GB · 279 downloads

majentik/gemma-4-31B-it-RotorQuant-GGUF-Q2_K

majentik · from 11.10 GB · 271 downloads

mradermacher/Kwai-AutoSQL-32B-GGUF

mradermacher · from 11.50 GB · 260 downloads

rosgar/specialist-qwen3.5-4b-lng-stc-027-001-gguf-f16

rosgar · from 8.07 GB · 260 downloads

123Ginger321/Gemma4-5B-unfiltered-GGUF

123Ginger321 · from 8.67 GB · 252 downloads

mradermacher/Ektome-Qwen3-30B-A3B-PristinelyUncensored-GGUF

mradermacher · from 10.49 GB · 249 downloads

majentik/gemma-4-31B-RotorQuant-GGUF-Q2_K

majentik · from 11.10 GB · 248 downloads

mrutkows/granite-4.1-30b-GGUF

mrutkows · from 11.92 GB · 237 downloads

MainStack/marvy-1-14B-GGUF

MainStack · from 8.37 GB · 236 downloads

mradermacher/SciJudge-30B-GGUF

mradermacher · from 10.49 GB · 235 downloads

majentik/gemma-4-26B-A4B-RotorQuant-GGUF-Q2_K

majentik · from 9.86 GB · 225 downloads

deucebucket/Qwen3.6-27B-Cerebellum-Q2K-GGUF

deucebucket · from 9.98 GB · 221 downloads

ManniX-ITA/Qwen3.5-27B-Omnimerge-v2-GGUF

ManniX-ITA · from 11.24 GB · 218 downloads

Koshkasa/TheDrummer_Skyfall-31B-v4.2_IQ3_KT-GGUF

Koshkasa · from 11.79 GB · 193 downloads

cmy2019/q8-gguf

cmy2019 · from 9.11 GB · 191 downloads

Foxy6770/boonie-v3-3-14b-gguf

Foxy6770 · from 11.29 GB · 190 downloads

RJTPP/scot0500s-qwen3-14b-gguf

RJTPP · from 8.38 GB · 173 downloads

Blackfrost-AI/Qwythos-9B-V2-EMERGED-GGUF

Blackfrost-AI · from 8.87 GB · 166 downloads

mradermacher/Trinity-Mini-GGUF

mradermacher · from 9.01 GB · 163 downloads

smarttasks/Mistral-Small-3.2-24B-Instruct-GGUF

smarttasks · from 10.69 GB · 153 downloads

Phil2Sat/Heimdallr-v0.02-31B-HB16-i1.gguf

Phil2Sat · from 8.88 GB · 137 downloads

mradermacher/Trinity-Mini-Base-GGUF

mradermacher · from 9.01 GB · 129 downloads

majentik/gemma-4-12B-it-TurboQuant-GGUF-Q8_0

majentik · from 11.80 GB · 125 downloads

mradermacher/ARI-32B-GGUF

mradermacher · from 11.50 GB · 125 downloads

gdfhhjk/spectrida-re-gguf

gdfhhjk · from 8.11 GB · 124 downloads

majentik/gemma-4-12B-RotorQuant-GGUF-Q8_0

majentik · from 11.80 GB · 122 downloads

NeuR0mancR/Pale-Sonneteer-24B-GGUF

NeuR0mancR · from 9.92 GB · 122 downloads

majentik/gemma-4-12B-TurboQuant-GGUF-Q8_0

majentik · from 11.80 GB · 121 downloads

majentik/gemma-4-12B-it-RotorQuant-GGUF-Q8_0

majentik · from 11.80 GB · 114 downloads

tooltd/Qwen3.6-27B-AutoRound-GGUF-NoMTP

tooltd · from 11.24 GB · 108 downloads

phani246/fast-formula-merged-GGUF

phani246 · from 8.87 GB · 106 downloads

DavidAU/MN-GRAND-Gutenberg-Lyra4-Lyra-23.5B-GGUF

DavidAU · from 8.29 GB · 104 downloads

jesse-r-s-hines/nvidia-Llama-3.1-Nemotron-Nano-4B-v1.1-FP16-GGUF

jesse-r-s-hines · from 8.41 GB · 104 downloads

ToastyPigeon/Gemma-4-Test-GGUFs

ToastyPigeon · from 11.80 GB · 103 downloads

Run models locally with guIDE

Download guIDE — the AI-native code editor with local LLM inference and 69 built-in tools.

Download guIDE → · Browse 524k+ models · Compare models