Model Intelligence Sheet

richarderkhov/nomic-ai_-_gpt4all-falcon-gguf overview

An Apache-2 licensed chatbot trained over a massive curated corpus of assistant interactions including word problems, multi-turn dialogue, code, poems, songs, and stories.

ggufendpoints_compatibleregion:us

richarderkhov/nomic-ai_-_gpt4all-falcon-gguf visual

Downloads

908

Likes

Pipeline

—

Library

—

Visibility

Public

Access

Open

Repository Files & Downloads

21 files detected

Direct downloads for all repository files

File	Type	Quantization	Size	Link
gpt4all-falcon.IQ3_M.gguf	GGUF	IQ3_M	3.71 GB	Download
gpt4all-falcon.IQ3_S.gguf	GGUF	IQ3_S	3.59 GB	Download
gpt4all-falcon.IQ3_XS.gguf	GGUF	IQ3_XS	3.59 GB	Download
gpt4all-falcon.IQ4_NL.gguf	GGUF	IQ4_NL	3.96 GB	Download
gpt4all-falcon.IQ4_XS.gguf	GGUF	IQ4_XS	3.89 GB	Download
gpt4all-falcon.Q2_K.gguf	GGUF	Q2_K	3.59 GB	Download
gpt4all-falcon.Q3_K.gguf	GGUF	Q3_K	3.86 GB	Download
gpt4all-falcon.Q3_K_L.gguf	GGUF	Q3_K_L	4.08 GB	Download
gpt4all-falcon.Q3_K_M.gguf	GGUF	Q3_K_M	3.86 GB	Download
gpt4all-falcon.Q3_K_S.gguf	GGUF	Q3_K_S	3.59 GB	Download
gpt4all-falcon.Q4_0.gguf	GGUF	—	3.92 GB	Download
gpt4all-falcon.Q4_1.gguf	GGUF	—	4.32 GB	Download
gpt4all-falcon.Q4_K.gguf	GGUF	Q4_K	4.63 GB	Download
gpt4all-falcon.Q4_K_M.gguf	GGUF	Q4_K_M	4.63 GB	Download
gpt4all-falcon.Q4_K_S.gguf	GGUF	Q4_K_S	4.42 GB	Download
gpt4all-falcon.Q5_0.gguf	GGUF	—	4.73 GB	Download
gpt4all-falcon.Q5_1.gguf	GGUF	—	5.13 GB	Download
gpt4all-falcon.Q5_K.gguf	GGUF	Q5_K	5.34 GB	Download
gpt4all-falcon.Q5_K_M.gguf	GGUF	Q5_K_M	5.34 GB	Download
gpt4all-falcon.Q5_K_S.gguf	GGUF	Q5_K_S	4.98 GB	Download
gpt4all-falcon.Q6_K.gguf	GGUF	Q6_K	6.55 GB	Download

Model Details Live

Model Slug

richarderkhov/nomic-ai_-_gpt4all-falcon-gguf

Author

RichardErkhov

Pipeline Task

—

Library

—

Created

2024-05-03

Last Modified

2024-06-06

Gated

Private

HF SHA

5bded00ad50c034fa2875f34ba9d33bdd401cd6a

License

Unknown

Language

Unknown

Base Model

Unknown

Metadata Inspector

Normalized metadata (stored in metadata_json)

{
  "metadata": {},
  "card_data": {
    "frontmatter": {},
    "hero_image_url": "",
    "summary": "An Apache-2 licensed chatbot trained over a massive curated corpus of assistant interactions including word problems, multi-turn dialogue, code, poems, songs, and stories.",
    "quick_links": [],
    "benchmark_table_html": "",
    "readme_markdown": "Quantization made by Richard Erkhov.\n\n[Github](https://github.com/RichardErkhov)\n\n[Discord](https://discord.gg/pvy7H8DZMG)\n\n[Request more models](https://github.com/RichardErkhov/quant_request)\n\n\ngpt4all-falcon - GGUF\n- Model creator: https://huggingface.co/nomic-ai/\n- Original model: https://huggingface.co/nomic-ai/gpt4all-falcon/\n\n\n| Name | Quant method | Size |\n| ---- | ---- | ---- |\n| [gpt4all-falcon.Q2_K.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q2_K.gguf) | Q2_K | 3.59GB |\n| [gpt4all-falcon.IQ3_XS.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.IQ3_XS.gguf) | IQ3_XS | 3.59GB |\n| [gpt4all-falcon.IQ3_S.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.IQ3_S.gguf) | IQ3_S | 3.59GB |\n| [gpt4all-falcon.Q3_K_S.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q3_K_S.gguf) | Q3_K_S | 3.59GB |\n| [gpt4all-falcon.IQ3_M.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.IQ3_M.gguf) | IQ3_M | 3.71GB |\n| [gpt4all-falcon.Q3_K.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q3_K.gguf) | Q3_K | 3.86GB |\n| [gpt4all-falcon.Q3_K_M.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q3_K_M.gguf) | Q3_K_M | 3.86GB |\n| [gpt4all-falcon.Q3_K_L.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q3_K_L.gguf) | Q3_K_L | 4.08GB |\n| [gpt4all-falcon.IQ4_XS.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.IQ4_XS.gguf) | IQ4_XS | 3.89GB |\n| [gpt4all-falcon.Q4_0.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q4_0.gguf) | Q4_0 | 3.92GB |\n| [gpt4all-falcon.IQ4_NL.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.IQ4_NL.gguf) | IQ4_NL | 3.96GB |\n| [gpt4all-falcon.Q4_K_S.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q4_K_S.gguf) | Q4_K_S | 4.42GB |\n| [gpt4all-falcon.Q4_K.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q4_K.gguf) | Q4_K | 4.63GB |\n| [gpt4all-falcon.Q4_K_M.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q4_K_M.gguf) | Q4_K_M | 4.63GB |\n| [gpt4all-falcon.Q4_1.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q4_1.gguf) | Q4_1 | 4.32GB |\n| [gpt4all-falcon.Q5_0.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q5_0.gguf) | Q5_0 | 4.73GB |\n| [gpt4all-falcon.Q5_K_S.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q5_K_S.gguf) | Q5_K_S | 4.98GB |\n| [gpt4all-falcon.Q5_K.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q5_K.gguf) | Q5_K | 5.34GB |\n| [gpt4all-falcon.Q5_K_M.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q5_K_M.gguf) | Q5_K_M | 5.34GB |\n| [gpt4all-falcon.Q5_1.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q5_1.gguf) | Q5_1 | 5.13GB |\n| [gpt4all-falcon.Q6_K.gguf](https://huggingface.co/RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf/blob/main/gpt4all-falcon.Q6_K.gguf) | Q6_K | 6.55GB |\n\n\n\n\nOriginal model description:\n---\nlicense: apache-2.0\ndatasets:\n- nomic-ai/gpt4all-j-prompt-generations\nlanguage:\n- en\npipeline_tag: text-generation\n---\n\n# Model Card for GPT4All-Falcon\n\nAn Apache-2 licensed chatbot trained over a massive curated corpus of assistant interactions including word problems, multi-turn dialogue, code, poems, songs, and stories.\n\n## Model Details\n\n### Model Description\n\n<!-- Provide a longer summary of what this model is. -->\n\nThis model has been finetuned from [Falcon](https://huggingface.co/tiiuae/falcon-7b)\n\n- **Developed by:** [Nomic AI](https://home.nomic.ai)\n- **Model Type:** A finetuned Falcon 7B model on assistant style interaction data\n- **Language(s) (NLP):** English\n- **License:** Apache-2\n- **Finetuned from model [optional]:** [Falcon](https://huggingface.co/tiiuae/falcon-7b)\n\n\nTo download a model with a specific revision run \n\n```python\nfrom transformers import AutoModelForCausalLM\n\nmodel = AutoModelForCausalLM.from_pretrained(\"nomic-ai/gpt4all-falcon\", trust_remote_code=True)\n```\n\nDownloading without specifying `revision` defaults to `main`/`v1.0`.\n\nTo use it for inference with Cuda, run\n\n```python\nfrom transformers import AutoTokenizer, pipeline\nimport transformers\nimport torch\n\ntokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)\nmodel.to(\"cuda:0\")\n\nprompt = \"Describe a painting of a falcon in a very detailed way.\" # Change this to your prompt\nprompt_template = f\"### Instruction: {prompt}\\n### Response:\"\n\ntokens = tokenizer(prompt_template, return_tensors=\"pt\").input_ids.to(\"cuda:0\")\noutput = model.generate(input_ids=tokens, max_new_tokens=256, do_sample=True, temperature=0.8)\n\n# Print the generated text\nprint(tokenizer.decode(output[0]))\n```\n\n\n### Model Sources [optional]\n\n<!-- Provide the basic links for the model. -->\n\n- **Repository:** [https://github.com/nomic-ai/gpt4all](https://github.com/nomic-ai/gpt4all)\n- **Base Model Repository:** [https://huggingface.co/tiiuae/falcon-7b](https://huggingface.co/tiiuae/falcon-7b)\n- **Demo [optional]:** [https://gpt4all.io/](https://gpt4all.io/)\n\n\n### Training Procedure \nGPT4All is made possible by our compute partner [Paperspace](https://www.paperspace.com/).\n\nTrained on a DGX cluster with 8 A100 80GB GPUs for ~12 hours. Using Deepspeed + Accelerate, we use a global batch size of 256 with a learning rate of 2e-5. More information can be found in the repo.\n\n\n### Results\n\nResults on common sense reasoning benchmarks\n\n\n| Model                     |  BoolQ   |   PIQA   | HellaSwag | WinoGrande |  ARC-e   |  ARC-c   |   OBQA   |   Avg.   |\n|:--------------------------|:--------:|:--------:|:---------:|:----------:|:--------:|:--------:|:--------:|:--------:|\n| GPT4All-J 6B v1.0         |   73.4   |   74.8   |   63.4    |    64.7    |   54.9   |   36.0   |   40.2   |   58.2   |\n| GPT4All-J v1.1-breezy     |   74.0   |   75.1   |   63.2    |    63.6    |   55.4   |   34.9   |   38.4   |   57.8   |\n| GPT4All-J v1.2-jazzy      |   74.8   |   74.9   |   63.6    |    63.8    |   56.6   |   35.3   |   41.0   |   58.6   |\n| GPT4All-J v1.3-groovy     |   73.6   |   74.3   |   63.8    |    63.5    |   57.7   |   35.0   |   38.8   |   58.1   |\n| GPT4All-J Lora 6B         |   68.6   |   75.8   |   66.2    |    63.5    |   56.4   |   35.7   |   40.2   |   58.1   |\n| GPT4All LLaMa Lora 7B     |   73.1   |   77.6   |   72.1    |    67.8    |   51.1   |   40.4   |   40.2   |   60.3   |\n| GPT4All 13B snoozy        | **83.3** |   79.2   |   75.0    |  **71.3**  |   60.9   |   44.2   |   43.4   |   65.3   |\n| GPT4All Falcon            |   77.6   |   79.8   |   74.9    |    70.1    |   67.9   |   43.4   |   42.6   |   65.2   |\n| Dolly 6B                  |   68.8   |   77.3   |   67.6    |    63.9    |   62.9   |   38.7   |   41.2   |   60.1   |\n| Dolly 12B                 |   56.7   |   75.4   |   71.0    |    62.2    |   64.6   |   38.5   |   40.4   |   58.4   |\n| Alpaca 7B                 |   73.9   |   77.2   |   73.9    |    66.1    |   59.8   |   43.3   |   43.4   |   62.4   |\n| Alpaca Lora 7B            |   74.3   |   79.3   |   74.0    |    68.8    |   56.6   |   43.9   |   42.6   |   62.8   |\n| GPT-J 6.7B                |   65.4   |   76.2   |   66.2    |    64.1    |   62.2   |   36.6   |   38.2   |   58.4   |\n| LLama 7B                  |   73.1   |   77.4   |   73.0    |    66.9    |   52.5   |   41.4   |   42.4   |   61.0   |\n| LLama 13B                 |   68.5   |   79.1   |   76.2    |    70.1    |   60.0   | **44.6** |   42.2   |   63.0   |\n| Pythia 6.7B               |   63.5   |   76.3   |   64.0    |    61.1    |   61.3   |   35.2   |   37.2   |   57.0   |\n| Pythia 12B                |   67.7   |   76.6   |   67.3    |    63.8    |   63.9   |   34.8   |    38    |   58.9   |\n| Fastchat T5               |   81.5   |   64.6   |   46.3    |    61.8    |   49.3   |   33.3   |   39.4   |   53.7   |\n| Fastchat Vicuña 7B        |   76.6   |   77.2   |   70.7    |    67.3    |   53.5   |   41.2   |   40.8   |   61.0   |\n| Fastchat Vicuña 13B       |   81.5   |   76.8   |   73.3    |    66.7    |   57.4   |   42.7   |   43.6   |   63.1   |\n| StableVicuña RLHF         |   82.3   |   78.6   |   74.1    |    70.9    |   61.0   |   43.5   | **44.4** |   65.0   |\n| StableLM Tuned            |   62.5   |   71.2   |   53.6    |    54.8    |   52.4   |   31.1   |   33.4   |   51.3   |\n| StableLM Base             |   60.1   |   67.4   |   41.2    |    50.1    |   44.9   |   27.0   |   32.0   |   42.2   |\n| Koala 13B                 |   76.5   |   77.9   |   72.6    |    68.8    |   54.3   |   41.0   |   42.8   |   62.0   |\n| Open Assistant Pythia 12B |   67.9   |   78.0   |   68.1    |    65.0    |   64.2   |   40.4   |   43.2   |   61.0   |\n| Mosaic MPT7B              |   74.8   |   79.3   |   76.3    |    68.6    |   70.0   |   42.2   |   42.6   |   64.8   |\n| Mosaic mpt-instruct       |   74.3   |   80.4   | **77.2**  |    67.8    | **72.2** | **44.6** |   43.0   | **65.6** |\n| Mosaic mpt-chat           |   77.1   |   78.2   |   74.5    |    67.5    |   69.4   |   43.3   |   44.2   |   64.9   |\n| Wizard 7B                 |   78.4   |   77.2   |   69.9    |    66.5    |   56.8   |   40.5   |   42.6   |   61.7   |\n| Wizard 7B Uncensored      |   77.7   |   74.2   |   68.0    |    65.2    |   53.5   |   38.7   |   41.6   |   59.8   |\n| Wizard 13B Uncensored     |   78.4   |   75.5   |   72.1    |    69.5    |   57.5   |   40.4   |   44.0   |   62.5   |\n| GPT4-x-Vicuna-13b         |   81.3   |   75.0   |   75.2    |    65.0    |   58.7   |   43.9   |   43.6   |   62.2   |\n| Falcon 7b                 |   73.6   | **80.7** |   76.3    |    67.3    |   71.0   |   43.3   |   44.4   |   65.2   |   \n| text-davinci-003          |   88.1   |   83.8   |   83.4    |    75.8    |   83.9   |   63.9   |   51.0   |   75.7   |\n\n\n",
    "related_quantizations": []
  },
  "tags": [
    "gguf",
    "endpoints_compatible",
    "region:us"
  ],
  "likes": 0,
  "downloads": 908,
  "gated": false,
  "private": false,
  "last_modified": "2024-06-06T08:30:05.000Z",
  "created_at": "2024-05-03T03:15:48.000Z",
  "pipeline_tag": "",
  "library_name": ""
}

Source payload excerpt (from Hugging Face API)

{
  "_id": "663456e4dcf96f82195ea366",
  "id": "RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf",
  "modelId": "RichardErkhov/nomic-ai_-_gpt4all-falcon-gguf",
  "sha": "5bded00ad50c034fa2875f34ba9d33bdd401cd6a",
  "createdAt": "2024-05-03T03:15:48.000Z",
  "lastModified": "2024-06-06T08:30:05.000Z",
  "author": "RichardErkhov",
  "downloads": 908,
  "likes": 0,
  "gated": false,
  "private": false,
  "pipeline_tag": "",
  "library_name": "",
  "siblings_count": 23
}