Model Intelligence Sheet

richarderkhov/ai-sweden-models_-_llama-3-8b-gguf overview

### Intended usage: This is a base model, it can be finetuned to a particular use case. -----> instruct version here >> "Sommar och sol är det bästa jag vet! Och nu när jag har fått lite extra semester så ska jag njuta till max av allt som våren och sommaren har att erbjuda. Jag har redan börjat med att sitta ute på min altan och ta en kopp kaffe och läsa i tidningen, det är så skönt att bara sitta där och njuta av livet. Ikväll blir det grillat och det ser jag fram emot!"

ggufarxiv:2303.17183endpoints_compatibleregion:us

richarderkhov/ai-sweden-models_-_llama-3-8b-gguf visual

Downloads

258

Likes

Pipeline

—

Library

—

Visibility

Public

Access

Open

Repository Files & Downloads

22 files detected

Direct downloads for all repository files

File	Type	Quantization	Size	Link
Llama-3-8B.IQ3_M.gguf	GGUF	IQ3_M	3.52 GB	Download
Llama-3-8B.IQ3_S.gguf	GGUF	IQ3_S	3.43 GB	Download
Llama-3-8B.IQ3_XS.gguf	GGUF	IQ3_XS	3.28 GB	Download
Llama-3-8B.IQ4_NL.gguf	GGUF	IQ4_NL	4.38 GB	Download
Llama-3-8B.IQ4_XS.gguf	GGUF	IQ4_XS	4.18 GB	Download
Llama-3-8B.Q2_K.gguf	GGUF	Q2_K	2.96 GB	Download
Llama-3-8B.Q3_K.gguf	GGUF	Q3_K	3.74 GB	Download
Llama-3-8B.Q3_K_L.gguf	GGUF	Q3_K_L	4.03 GB	Download
Llama-3-8B.Q3_K_M.gguf	GGUF	Q3_K_M	3.74 GB	Download
Llama-3-8B.Q3_K_S.gguf	GGUF	Q3_K_S	3.41 GB	Download
Llama-3-8B.Q4_0.gguf	GGUF	—	4.34 GB	Download
Llama-3-8B.Q4_1.gguf	GGUF	—	4.78 GB	Download
Llama-3-8B.Q4_K.gguf	GGUF	Q4_K	4.58 GB	Download
Llama-3-8B.Q4_K_M.gguf	GGUF	Q4_K_M	4.58 GB	Download
Llama-3-8B.Q4_K_S.gguf	GGUF	Q4_K_S	4.37 GB	Download
Llama-3-8B.Q5_0.gguf	GGUF	—	5.21 GB	Download
Llama-3-8B.Q5_1.gguf	GGUF	—	5.65 GB	Download
Llama-3-8B.Q5_K.gguf	GGUF	Q5_K	5.34 GB	Download
Llama-3-8B.Q5_K_M.gguf	GGUF	Q5_K_M	5.34 GB	Download
Llama-3-8B.Q5_K_S.gguf	GGUF	Q5_K_S	5.21 GB	Download
Llama-3-8B.Q6_K.gguf	GGUF	Q6_K	6.14 GB	Download
Llama-3-8B.Q8_0.gguf	GGUF	—	7.95 GB	Download

Model Details Live

Model Slug

richarderkhov/ai-sweden-models_-_llama-3-8b-gguf

Author

RichardErkhov

Pipeline Task

—

Library

—

Created

2024-08-20

Last Modified

2024-08-21

Gated

Private

HF SHA

09c2ec2872cb8242618474a3fe838511f3880a5d

License

Unknown

Language

Unknown

Base Model

Unknown

Metadata Inspector

Normalized metadata (stored in metadata_json)

{
  "metadata": {},
  "card_data": {
    "frontmatter": {},
    "hero_image_url": "https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/l3swe.png?download=true",
    "summary": "![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/l3swe.png?download=true) ### Intended usage: This is a base model, it can be finetuned to a particular use case. **-----> instruct version here >> \"Sommar och sol är det bästa jag vet! Och nu när jag har fått lite extra semester så ska jag njuta till max av allt som våren och sommaren har att erbjuda. Jag har redan börjat med att sitta ute på min altan och ta en kopp kaffe och läsa i tidningen, det är så skönt att bara sitta där och njuta av livet. Ikväll blir det grillat och det ser jag fram emot!\" ``",
    "quick_links": [],
    "benchmark_table_html": "",
    "readme_markdown": "Quantization made by Richard Erkhov.\n\n[Github](https://github.com/RichardErkhov)\n\n[Discord](https://discord.gg/pvy7H8DZMG)\n\n[Request more models](https://github.com/RichardErkhov/quant_request)\n\n\nLlama-3-8B - GGUF\n- Model creator: https://huggingface.co/AI-Sweden-Models/\n- Original model: https://huggingface.co/AI-Sweden-Models/Llama-3-8B/\n\n\n| Name | Quant method | Size |\n| ---- | ---- | ---- |\n| [Llama-3-8B.Q2_K.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q2_K.gguf) | Q2_K | 2.96GB |\n| [Llama-3-8B.IQ3_XS.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.IQ3_XS.gguf) | IQ3_XS | 3.28GB |\n| [Llama-3-8B.IQ3_S.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.IQ3_S.gguf) | IQ3_S | 3.43GB |\n| [Llama-3-8B.Q3_K_S.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q3_K_S.gguf) | Q3_K_S | 3.41GB |\n| [Llama-3-8B.IQ3_M.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.IQ3_M.gguf) | IQ3_M | 3.52GB |\n| [Llama-3-8B.Q3_K.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q3_K.gguf) | Q3_K | 3.74GB |\n| [Llama-3-8B.Q3_K_M.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q3_K_M.gguf) | Q3_K_M | 3.74GB |\n| [Llama-3-8B.Q3_K_L.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q3_K_L.gguf) | Q3_K_L | 4.03GB |\n| [Llama-3-8B.IQ4_XS.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.IQ4_XS.gguf) | IQ4_XS | 4.18GB |\n| [Llama-3-8B.Q4_0.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q4_0.gguf) | Q4_0 | 4.34GB |\n| [Llama-3-8B.IQ4_NL.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.IQ4_NL.gguf) | IQ4_NL | 4.38GB |\n| [Llama-3-8B.Q4_K_S.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q4_K_S.gguf) | Q4_K_S | 4.37GB |\n| [Llama-3-8B.Q4_K.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q4_K.gguf) | Q4_K | 4.58GB |\n| [Llama-3-8B.Q4_K_M.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q4_K_M.gguf) | Q4_K_M | 4.58GB |\n| [Llama-3-8B.Q4_1.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q4_1.gguf) | Q4_1 | 4.78GB |\n| [Llama-3-8B.Q5_0.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q5_0.gguf) | Q5_0 | 5.21GB |\n| [Llama-3-8B.Q5_K_S.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q5_K_S.gguf) | Q5_K_S | 5.21GB |\n| [Llama-3-8B.Q5_K.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q5_K.gguf) | Q5_K | 5.34GB |\n| [Llama-3-8B.Q5_K_M.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q5_K_M.gguf) | Q5_K_M | 5.34GB |\n| [Llama-3-8B.Q5_1.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q5_1.gguf) | Q5_1 | 5.65GB |\n| [Llama-3-8B.Q6_K.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q6_K.gguf) | Q6_K | 6.14GB |\n| [Llama-3-8B.Q8_0.gguf](https://huggingface.co/RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf/blob/main/Llama-3-8B.Q8_0.gguf) | Q8_0 | 7.95GB |\n\n\n\n\nOriginal model description:\n---\nlanguage:\n- sv\n- da\n- 'no'\nlicense: llama3\ntags:\n- pytorch\n- llama\n- llama-3\n- ai-sweden\nbase_model: meta-llama/Meta-Llama-3-8B\npipeline_tag: text-generation\ninference:\n  parameters:\n    temperature: 0.6\n---\n\n# AI-Sweden-Models/Llama-3-8B\n![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/l3swe.png?download=true)\n\n### Intended usage:\nThis is a base model, it can be finetuned to a particular use case.\n\n[**-----> instruct version here <-----**](https://huggingface.co/AI-Sweden-Models/Llama-3-8B-instruct)\n\n### Use with transformers\n\nSee the snippet below for usage with Transformers:\n\n```python\nimport transformers\nimport torch\n\nmodel_id = \"AI-Sweden-Models/Llama-3-8B\"\n\npipeline = transformers.pipeline(\n    task=\"text-generation\",\n    model=model_id,\n    model_kwargs={\"torch_dtype\": torch.bfloat16},\n    device_map=\"auto\"\n)\n\npipeline(\n    text_inputs=\"Sommar och sol är det bästa jag vet\",\n    max_length=128,\n    repetition_penalty=1.03\n)\n```\n```python\n>>> \"Sommar och sol är det bästa jag vet!\nOch nu när jag har fått lite extra semester så ska jag njuta till max av allt som våren och sommaren har att erbjuda.\nJag har redan börjat med att sitta ute på min altan och ta en kopp kaffe och läsa i tidningen, det är så skönt att bara sitta där och njuta av livet.\n\nIkväll blir det grillat och det ser jag fram emot!\"\n```\n## Training information\n\n`AI-Sweden-Models/Llama-3-8B` is a continuation of the pretraining process from `meta-llama/Meta-Llama-3-8B`. \nIt was trained on a subset from [The Nordic Pile](https://arxiv.org/abs/2303.17183) containing Swedish, Norwegian and Danish. The training is done on all model parameters, it is a full finetune.\n\nThe training dataset consists of 227 105 079 296 tokens. It was trained on the Rattler supercomputer at the Dell Technologies Edge Innovation Center in Austin, Texas. The training used 23 nodes of a duration of 30 days, where one node contained 4X Nvidia A100 GPUs, yielding 92 GPUs.\n\n## trainer.yaml:\n```yaml\nlearning_rate: 2e-5\nwarmup_steps: 100\nlr_scheduler: cosine\noptimizer: adamw_torch_fused\nmax_grad_norm: 1.0\ngradient_accumulation_steps: 16\nmicro_batch_size: 1\nnum_epochs: 1\nsequence_len: 8192\n```\n\n## deepspeed_zero2.json:\n```json\n{\n  \"zero_optimization\": {\n    \"stage\": 2,\n    \"offload_optimizer\": {\n      \"device\": \"cpu\"\n    },\n    \"contiguous_gradients\": true,\n    \"overlap_comm\": true\n  },\n  \"bf16\": {\n    \"enabled\": \"auto\"\n  },\n  \"fp16\": {\n    \"enabled\": \"auto\",\n    \"auto_cast\": false,\n    \"loss_scale\": 0,\n    \"initial_scale_power\": 32,\n    \"loss_scale_window\": 1000,\n    \"hysteresis\": 2,\n    \"min_loss_scale\": 1\n  },\n  \"gradient_accumulation_steps\": \"auto\",\n  \"gradient_clipping\": \"auto\",\n  \"train_batch_size\": \"auto\",\n  \"train_micro_batch_size_per_gpu\": \"auto\",\n  \"wall_clock_breakdown\": false\n}\n```\n![](https://huggingface.co/AI-Sweden-Models/Llama-3-8B/resolve/main/13333333.jpg?download=true)\n\n## Checkpoints\n* 15/6/2024 (18833) => 1 epoch\n* 11/6/2024 (16000)\n* 07/6/2024 (14375)\n* 03/6/2024 (11525)\n* 29/5/2024 (8200)\n* 26/5/2024 (6550)\n* 24/5/2024 (5325)\n* 22/5/2024 (3900)\n* 20/5/2024 (2700)\n* 13/5/2024 (1500)\n\n",
    "related_quantizations": []
  },
  "tags": [
    "gguf",
    "arxiv:2303.17183",
    "endpoints_compatible",
    "region:us"
  ],
  "likes": 0,
  "downloads": 258,
  "gated": false,
  "private": false,
  "last_modified": "2024-08-21T01:51:48.000Z",
  "created_at": "2024-08-20T23:58:12.000Z",
  "pipeline_tag": "",
  "library_name": ""
}

Source payload excerpt (from Hugging Face API)

{
  "_id": "66c52d94b8460fccee183b07",
  "id": "RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf",
  "modelId": "RichardErkhov/AI-Sweden-Models_-_Llama-3-8B-gguf",
  "sha": "09c2ec2872cb8242618474a3fe838511f3880a5d",
  "createdAt": "2024-08-20T23:58:12.000Z",
  "lastModified": "2024-08-21T01:51:48.000Z",
  "author": "RichardErkhov",
  "downloads": 258,
  "likes": 0,
  "gated": false,
  "private": false,
  "pipeline_tag": "",
  "library_name": "",
  "siblings_count": 24
}