GraySoft
Projects Models Compare Cloud benchmarks FAQ Download guIDE →
Model Intelligence Sheet

bandtor/gemma-4-12B-it-GGUF overview

Gemma 4 12B Instruct — GGUF Q4 K M Quantização Q4 K M com imatrix do modelo google/gemma 4 12B it https://huggingface.co/google/gemma 4 12B it , obtida de bart…

ggufollamagemma4q4_k_mllama-cppmultimodalimage-text-to-textenptmultilingualbase_model:google/gemma-4-12B-itbase_model:quantized:google/gemma-4-12B-itlicense:gemmaendpoints_compatibleregion:usimatrixconversational

Runs locally from ~7.1 MB disk (4 GB VRAM class GPUs with llama.cpp / guIDE).

Downloads
0
Likes
0
Pipeline
image-text-to-text
Author

Repository Files & Downloads

3 GGUF files detected
Direct downloads for local inference
FileTypeQuantizationSizeLink
gemma-4-12B-it-Q4_K_M.ggufGGUFQ4_K_M7.14 GBDownload
gemma-4-12B-it-imatrix.ggufGGUFGGUF7.1 MBDownload
mmproj-gemma-4-12B-it-f16.ggufGGUFF16116.4 MBDownload

Model Details

Model IDbandtor/gemma-4-12B-it-GGUF
Authorbandtor
Pipelineimage-text-to-text
Licensegemma
Base modelgoogle/gemma-4-12B-it
Last modified2026-06-08T01:36:50.000Z

Model README

---

base_model: google/gemma-4-12B-it

license: gemma

tags:

- gguf

- ollama

- gemma4

- q4_k_m

- llama-cpp

- multimodal

- image-text-to-text

language:

- en

- pt

- multilingual

library_name: gguf

pipeline_tag: image-text-to-text

---

Gemma 4 12B Instruct — GGUF Q4_K_M

Quantização Q4_K_M com imatrix do modelo google/gemma-4-12B-it,

obtida de bartowski/gemma-4-12B-it-GGUF (llama.cpp b9496).

| Arquivo | Tamanho | Tipo |

|---|---|---|

| gemma-4-12B-it-Q4_K_M.gguf | 7.66 GB | Modelo principal |

| mmproj-gemma-4-12B-it-f16.gguf | ~122 MB | Projetor visual (multimodal) |

| gemma-4-12B-it-imatrix.gguf | — | Calibração imatrix |

| Modelfile | — | Template Ollama pronto para uso |

Especificações

  • Parâmetros: 12B (denso, arquitetura gemma4)
  • Contexto máximo: 128K tokens (131 072)
  • Quantização: Q4_K_M com imatrix calibration dataset
  • Ferramenta de build: llama.cpp b9496
  • Licença: Gemma Terms of Use

Uso com Ollama

# Baixar e criar modelo
huggingface-cli download bandtor/gemma-4-12B-it-GGUF --local-dir ./gemma4-12b
ollama create gemma4-12b -f ./gemma4-12b/Modelfile
ollama run gemma4-12b

Ou diretamente via HF (Ollama >= 0.3):

ollama run hf.co/bandtor/gemma-4-12B-it-GGUF

Uso com llama.cpp

# Apenas texto
llama-cli -m gemma-4-12B-it-Q4_K_M.gguf \
  --ctx-size 32768 \
  -fa 1 \
  --prompt "<|turn>user\nOlá!<turn|>\n<|turn>model\n"

# Multimodal (visão)
llama-cli -m gemma-4-12B-it-Q4_K_M.gguf \
  --mmproj mmproj-gemma-4-12B-it-f16.gguf \
  --image imagem.jpg \
  --prompt "<|turn>user\nDescreva esta imagem.<turn|>\n<|turn>model\n"

Formato de prompt (Gemma 4)

<bos><|turn>system
{system_prompt}<turn|>
<|turn>user
{mensagem}<turn|>
<|turn>model
{resposta}<turn|>

Créditos

Run bandtor/gemma-4-12B-it-GGUF with guIDE

Download guIDE — the AI-native code editor with local LLM inference and 69 built-in tools.

Download guIDE → · Browse 524k+ models · Compare models

Source: Hugging Face · Compare models