Model Intelligence Sheet

msu-rcc-lair/ruadaptqwen2.5-32b-instruct-gguf overview

Comprehensive model page for msu-rcc-lair/ruadaptqwen2.5-32b-instruct-gguf

gguftext-generationrudataset:IlyaGusev/saiga_scoreddataset:IlyaGusev/saiga_preferencesdataset:dichspace/darulmarxiv:2412.21140license:apache-2.0endpoints_compatibleregion:usconversational

msu-rcc-lair/ruadaptqwen2.5-32b-instruct-gguf visual

Downloads

410

Likes

Pipeline

text-generation

Library

—

Visibility

Public

Access

Open

Repository Files & Downloads

8 files detected

Direct downloads for all repository files

File	Type	Quantization	Size	Link
Q2_K.gguf	GGUF	Q2_K	11.44 GB	Download
Q3_K_M.gguf	GGUF	Q3_K_M	14.81 GB	Download
Q4_0.gguf	GGUF	—	17.33 GB	Download
Q4_K_M.gguf	GGUF	Q4_K_M	18.46 GB	Download
Q5_0.gguf	GGUF	—	21.05 GB	Download
Q5_K_M.gguf	GGUF	Q5_K_M	21.63 GB	Download
Q6_K.gguf	GGUF	Q6_K	25.00 GB	Download
Q8_0.gguf	GGUF	—	32.38 GB	Download

Model Details Live

Model Slug

msu-rcc-lair/ruadaptqwen2.5-32b-instruct-gguf

Author

msu-rcc-lair

Pipeline Task

text-generation

Library

—

Created

2024-11-13

Last Modified

2024-12-31

Gated

Private

HF SHA

2fad10205ce673ea4ae4591ea0b167fc3fdee471

License

apache-2.0

Language

Base Model

Unknown

Metadata Inspector

Normalized metadata (stored in metadata_json)

{
  "metadata": {},
  "card_data": {
    "datasets": [
      "IlyaGusev/saiga_scored",
      "IlyaGusev/saiga_preferences",
      "dichspace/darulm"
    ],
    "language": [
      "ru"
    ],
    "pipeline_tag": "text-generation",
    "license": "apache-2.0",
    "frontmatter": {
      "datasets": [
        "IlyaGusev/saiga_scored",
        "IlyaGusev/saiga_preferences",
        "dichspace/darulm"
      ],
      "language": [
        "ru"
      ],
      "pipeline_tag": "text-generation",
      "license": "apache-2.0"
    },
    "hero_image_url": "https://cdn-uploads.huggingface.co/production/uploads/652cedbdf120598322ae358a/O4eQEhnowETEatDPcmArB.png",
    "summary": "",
    "quick_links": [],
    "benchmark_table_html": "",
    "readme_markdown": "---\ndatasets:\n- IlyaGusev/saiga_scored\n- IlyaGusev/saiga_preferences\n- dichspace/darulm\nlanguage:\n- ru\npipeline_tag: text-generation\nlicense: apache-2.0\n---\n\n## Описание модели\n\nGGUF версия. WORK IN PROGRESS!!! Текущая версия v1.\n\nИнструктивная версия адаптированной на русский язык модели Qwen2.5-32B. В модели был заменен токенизатор, затем произведено дообучение (Continued pretraining) на русскоязычном корпусе, после чего была применена техника LEP (Learned Embedding Propagation, paper will be soon).\n\nБлагодаря новому токенизатору (расширенный tiktoken cl100k с помощью униграм токенизатора на 48 т. токенов) скорость генерации* русскоязычных текстов возрасла до 60% по сравнению с исходной моделью Qwen-2.5-32B-Instruct.\n\n*Под скоростью генерации подразумевается количество русскоязычных символов/слов в секунду на одинаковых текстовых последовательностях.\n\n## Попробовать\n\nМодель можно попробовать в поднятом Space (внизу в параметрах выбор модели): \nhttps://huggingface.co/spaces/RefalMachine/RuadaptQwen2.5\n\n## Токенизация\n\n\n![image/png](https://cdn-uploads.huggingface.co/production/uploads/652cedbdf120598322ae358a/O4eQEhnowETEatDPcmArB.png)\n\n\n![image/png](https://cdn-uploads.huggingface.co/production/uploads/652cedbdf120598322ae358a/oW0Q6LzD_Py3GdH0kfqu4.png)\n\n## Метрики и оценка качества\n\nМодель была оценена на Ru-Arena-General, MERA, llmtf_open\n\n#### Результаты на Ru-Arena-General\n\nTODO\n\n#### Результаты на MERA\n\nДля сабмита на MERA был подготовлен кастомный системный промпт, который смягчает недостатки оценки на кодовых задачах. Для сравнения был также сделан сабмит с этим же системным промптом оригинальной модели.\n\n![image/png](https://cdn-uploads.huggingface.co/production/uploads/652cedbdf120598322ae358a/PwPTdwp0synSCE2Nn75xE.png)\n\n\n#### Результаты на llmtf_open\n\nTODO\n\n## How to cite:\n\nTikhomirov M., Chernyshev D. Facilitating large language model Russian adaptation with Learned Embedding Propagation // 2024 (Preprint: https://arxiv.org/abs/2412.21140)\n\nTikhomirov M., Chernyshev D. Impact of Tokenization on LLaMa Russian Adaptation //2023 Ivannikov Ispras Open Conference (ISPRAS). – IEEE, 2023. – С. 163-168.\n\n## Предупреждение\n\nОтветы модели не отражают мнения авторов, а лишь повторяют знания полученные из данных на всех этапах обучения (предобучение, смена токенизатора, обучение на инструкциях, калибровка качества ответов). Модель была получена из сторонней предобученной модели, **контроль за предобучением** которой **не является ответственностью текущих авторов**. При создании данной версии модели не производилось никаких дополнительных действий, направленных на изменение заложенных в LLM \"мнений\". Используйте с осторожностью.",
    "related_quantizations": []
  },
  "tags": [
    "gguf",
    "text-generation",
    "ru",
    "dataset:IlyaGusev/saiga_scored",
    "dataset:IlyaGusev/saiga_preferences",
    "dataset:dichspace/darulm",
    "arxiv:2412.21140",
    "license:apache-2.0",
    "endpoints_compatible",
    "region:us",
    "conversational"
  ],
  "likes": 19,
  "downloads": 410,
  "gated": false,
  "private": false,
  "last_modified": "2024-12-31T10:09:29.000Z",
  "created_at": "2024-11-13T15:23:22.000Z",
  "pipeline_tag": "text-generation",
  "library_name": ""
}

Source payload excerpt (from Hugging Face API)

{
  "_id": "6734c46a7e5caf2c610818f5",
  "id": "msu-rcc-lair/RuadaptQwen2.5-32B-instruct-GGUF",
  "modelId": "msu-rcc-lair/RuadaptQwen2.5-32B-instruct-GGUF",
  "sha": "2fad10205ce673ea4ae4591ea0b167fc3fdee471",
  "createdAt": "2024-11-13T15:23:22.000Z",
  "lastModified": "2024-12-31T10:09:29.000Z",
  "author": "msu-rcc-lair",
  "downloads": 410,
  "likes": 19,
  "gated": false,
  "private": false,
  "pipeline_tag": "text-generation",
  "library_name": "",
  "siblings_count": 10
}