Model Intelligence Sheet

richarderkhov/mala-lm_-_emma-500-llama2-7b-gguf overview

Comprehensive model page for richarderkhov/mala-lm-emma-500-llama2-7b-gguf

ggufarxiv:2409.17892endpoints_compatibleregion:us

richarderkhov/mala-lm_-_emma-500-llama2-7b-gguf visual

Downloads

122

Likes

Pipeline

—

Library

—

Visibility

Public

Access

Open

Repository Files & Downloads

22 files detected

Direct downloads for all repository files

File	Type	Quantization	Size	Link
emma-500-llama2-7b.IQ3_M.gguf	GGUF	IQ3_M	2.90 GB	Download
emma-500-llama2-7b.IQ3_S.gguf	GGUF	IQ3_S	2.75 GB	Download
emma-500-llama2-7b.IQ3_XS.gguf	GGUF	IQ3_XS	2.60 GB	Download
emma-500-llama2-7b.IQ4_NL.gguf	GGUF	IQ4_NL	3.58 GB	Download
emma-500-llama2-7b.IQ4_XS.gguf	GGUF	IQ4_XS	3.40 GB	Download
emma-500-llama2-7b.Q2_K.gguf	GGUF	Q2_K	2.36 GB	Download
emma-500-llama2-7b.Q3_K.gguf	GGUF	Q3_K	3.07 GB	Download
emma-500-llama2-7b.Q3_K_L.gguf	GGUF	Q3_K_L	3.35 GB	Download
emma-500-llama2-7b.Q3_K_M.gguf	GGUF	Q3_K_M	3.07 GB	Download
emma-500-llama2-7b.Q3_K_S.gguf	GGUF	Q3_K_S	2.75 GB	Download
emma-500-llama2-7b.Q4_0.gguf	GGUF	—	3.56 GB	Download
emma-500-llama2-7b.Q4_1.gguf	GGUF	—	3.95 GB	Download
emma-500-llama2-7b.Q4_K.gguf	GGUF	Q4_K	3.80 GB	Download
emma-500-llama2-7b.Q4_K_M.gguf	GGUF	Q4_K_M	3.80 GB	Download
emma-500-llama2-7b.Q4_K_S.gguf	GGUF	Q4_K_S	3.59 GB	Download
emma-500-llama2-7b.Q5_0.gguf	GGUF	—	4.33 GB	Download
emma-500-llama2-7b.Q5_1.gguf	GGUF	—	4.72 GB	Download
emma-500-llama2-7b.Q5_K.gguf	GGUF	Q5_K	4.45 GB	Download
emma-500-llama2-7b.Q5_K_M.gguf	GGUF	Q5_K_M	4.45 GB	Download
emma-500-llama2-7b.Q5_K_S.gguf	GGUF	Q5_K_S	4.33 GB	Download
emma-500-llama2-7b.Q6_K.gguf	GGUF	Q6_K	5.15 GB	Download
emma-500-llama2-7b.Q8_0.gguf	GGUF	—	6.67 GB	Download

Model Details Live

Model Slug

richarderkhov/mala-lm_-_emma-500-llama2-7b-gguf

Author

RichardErkhov

Pipeline Task

—

Library

—

Created

2024-10-09

Last Modified

2024-10-10

Gated

Private

HF SHA

5048966eb6b1a76ab3a170401782bf16e5706a78

License

Unknown

Language

Unknown

Base Model

Unknown

Metadata Inspector

Normalized metadata (stored in metadata_json)

{
  "metadata": {},
  "card_data": {
    "frontmatter": {},
    "hero_image_url": "",
    "summary": "",
    "quick_links": [],
    "benchmark_table_html": "",
    "readme_markdown": "Quantization made by Richard Erkhov.\n\n[Github](https://github.com/RichardErkhov)\n\n[Discord](https://discord.gg/pvy7H8DZMG)\n\n[Request more models](https://github.com/RichardErkhov/quant_request)\n\n\nemma-500-llama2-7b - GGUF\n- Model creator: https://huggingface.co/MaLA-LM/\n- Original model: https://huggingface.co/MaLA-LM/emma-500-llama2-7b/\n\n\n| Name | Quant method | Size |\n| ---- | ---- | ---- |\n| [emma-500-llama2-7b.Q2_K.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q2_K.gguf) | Q2_K | 2.36GB |\n| [emma-500-llama2-7b.IQ3_XS.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.IQ3_XS.gguf) | IQ3_XS | 2.6GB |\n| [emma-500-llama2-7b.IQ3_S.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.IQ3_S.gguf) | IQ3_S | 2.75GB |\n| [emma-500-llama2-7b.Q3_K_S.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q3_K_S.gguf) | Q3_K_S | 2.75GB |\n| [emma-500-llama2-7b.IQ3_M.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.IQ3_M.gguf) | IQ3_M | 2.9GB |\n| [emma-500-llama2-7b.Q3_K.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q3_K.gguf) | Q3_K | 3.07GB |\n| [emma-500-llama2-7b.Q3_K_M.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q3_K_M.gguf) | Q3_K_M | 3.07GB |\n| [emma-500-llama2-7b.Q3_K_L.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q3_K_L.gguf) | Q3_K_L | 3.35GB |\n| [emma-500-llama2-7b.IQ4_XS.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.IQ4_XS.gguf) | IQ4_XS | 3.4GB |\n| [emma-500-llama2-7b.Q4_0.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q4_0.gguf) | Q4_0 | 3.56GB |\n| [emma-500-llama2-7b.IQ4_NL.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.IQ4_NL.gguf) | IQ4_NL | 3.58GB |\n| [emma-500-llama2-7b.Q4_K_S.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q4_K_S.gguf) | Q4_K_S | 3.59GB |\n| [emma-500-llama2-7b.Q4_K.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q4_K.gguf) | Q4_K | 3.8GB |\n| [emma-500-llama2-7b.Q4_K_M.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q4_K_M.gguf) | Q4_K_M | 3.8GB |\n| [emma-500-llama2-7b.Q4_1.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q4_1.gguf) | Q4_1 | 3.95GB |\n| [emma-500-llama2-7b.Q5_0.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q5_0.gguf) | Q5_0 | 4.33GB |\n| [emma-500-llama2-7b.Q5_K_S.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q5_K_S.gguf) | Q5_K_S | 4.33GB |\n| [emma-500-llama2-7b.Q5_K.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q5_K.gguf) | Q5_K | 4.45GB |\n| [emma-500-llama2-7b.Q5_K_M.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q5_K_M.gguf) | Q5_K_M | 4.45GB |\n| [emma-500-llama2-7b.Q5_1.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q5_1.gguf) | Q5_1 | 4.72GB |\n| [emma-500-llama2-7b.Q6_K.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q6_K.gguf) | Q6_K | 5.15GB |\n| [emma-500-llama2-7b.Q8_0.gguf](https://huggingface.co/RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf/blob/main/emma-500-llama2-7b.Q8_0.gguf) | Q8_0 | 6.67GB |\n\n\n\n\nOriginal model description:\n---\nlicense: llama2\ndatasets:\n- MaLA-LM/mala-monolingual-split\nbase_model:\n- meta-llama/Llama-2-7b-hf\nlibrary_name: transformers\n---\n\n# EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models\n\n## Model Description\n\n**EMMA-500** is a state-of-the-art multilingual language model designed to improve language representation, especially in low-resource languages, through continual pre-training on the **Llama 2 7B** architecture. Leveraging the **MaLA Corpus**, which spans over 500 languages and 74 billion tokens, EMMA-500 excels in multilingual tasks like commonsense reasoning, machine translation, open-ended generation, and text classification.\n\n**EMMA-500** outperforms other Llama 2-based models in diverse multilingual settings while maintaining robustness in specialized tasks.\n\n---\n\n## Model Details\n\n- **Architecture**: Built on Llama 2 7B with enhanced language adaptation through continual pre-training.\n- **Languages**: Supports **546 languages** with substantial training data (over 100k tokens each).\n- **Data Mix**: A diverse mix of text from domains like code, books, instruction data, and more.\n- **Key Tasks**: Commonsense reasoning, machine translation, text classification, natural language inference, code generation, and open-ended generation.\n\n### Data Access\n- [MaLA Corpus](https://huggingface.co/collections/MaLA-LM/mala-corpus-66e05127641a51de34d39529)\n- [PolyWrite Benchmark](https://huggingface.co/datasets/MaLA-LM/PolyWrite)\n\n---\n\n## Usage\n\nYou can use **EMMA-500** for multilingual text generation. Below is an example to generate text using the model:\n\n```python\nfrom transformers import AutoModelForCausalLM, AutoTokenizer\n\nmodel_name = \"MaLA-LM/emma-500-llama2-7b\"\ntokenizer = AutoTokenizer.from_pretrained(model_name)\nmodel = AutoModelForCausalLM.from_pretrained(model_name)\n\ninput_text = \"Once upon a time\"\ninputs = tokenizer(input_text, return_tensors=\"pt\")\noutputs = model.generate(**inputs)\n\nprint(tokenizer.decode(outputs[0], skip_special_tokens=True))\n```\n\n---\n\n## Model Performance\n\n**EMMA-500** was evaluated across multiple benchmarks and tasks, demonstrating:\n\n- **Lowest negative log-likelihood** in intrinsic evaluations.\n- Significant improvements in **commonsense reasoning**, **machine translation**, and **open-ended generation**.\n- **Outperformed** all Llama 2-based models in **text classification** and **natural language inference**.\n- Enhanced performance in **code generation** and **machine reading comprehension (MRC)**.\n\nChallenges remain in low-resource languages, where the model tends to have higher **Self-BLEU** scores, indicating reduced output diversity.\n\n---\n\n\n## Citation\n\n```\n@article{ji2024emma500enhancingmassivelymultilingual,\n      title={{EMMA}-500: Enhancing Massively Multilingual Adaptation of Large Language Models}, \n      author={Shaoxiong Ji and Zihao Li and Indraneil Paul and Jaakko Paavola and Peiqin Lin and Pinzhen Chen and Dayyán O'Brien and Hengyu Luo and Hinrich Schütze and Jörg Tiedemann and Barry Haddow},\n      year={2024},\n      journal={arXiv preprint 2409.17892},\n      url={https://arxiv.org/abs/2409.17892}, \n}\n```\n\n## Acknowledgements\n\nWe extend our thanks to the language communities and contributors who helped source, clean, and validate the diverse data used in the MaLA Corpus. Their efforts are invaluable in supporting linguistic diversity in AI research.\n\nThis work is done by researchers at [Helsinki-NLP](https://huggingface.co/Helsinki-NLP) in collaboration with partners from TU Darmstadt, the University of Edinburgh, and LMU Munich. It is funded by [HPLT](https://hplt-project.org) and [UTTER](https://he-utter.eu).\n\n",
    "related_quantizations": []
  },
  "tags": [
    "gguf",
    "arxiv:2409.17892",
    "endpoints_compatible",
    "region:us"
  ],
  "likes": 0,
  "downloads": 122,
  "gated": false,
  "private": false,
  "last_modified": "2024-10-10T00:52:40.000Z",
  "created_at": "2024-10-09T22:17:10.000Z",
  "pipeline_tag": "",
  "library_name": ""
}

Source payload excerpt (from Hugging Face API)

{
  "_id": "670700e6923d9f2f362a8cef",
  "id": "RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf",
  "modelId": "RichardErkhov/MaLA-LM_-_emma-500-llama2-7b-gguf",
  "sha": "5048966eb6b1a76ab3a170401782bf16e5706a78",
  "createdAt": "2024-10-09T22:17:10.000Z",
  "lastModified": "2024-10-10T00:52:40.000Z",
  "author": "RichardErkhov",
  "downloads": 122,
  "likes": 0,
  "gated": false,
  "private": false,
  "pipeline_tag": "",
  "library_name": "",
  "siblings_count": 24
}