Модели эмбеддингов и переранжирования Qwen3 на Ollama: передовые достижения

Новые потрясающие ЛЛМ доступны в Ollama

Содержимое страницы

Модели Qwen3 Embedding и Reranker являются последними выпусками в семействе Qwen, специально разработанными для продвинутых задач встраивания, извлечения и повторного ранжирования текста.

Радость для глаза Qwen3 Embedding Reranker Длина контекста и размеры встраивания

Модели Qwen3 Embedding и Reranker представляют собой значительное достижение в области многократной обработки естественного языка (NLP), обеспечивая передовые результаты в задачах встраивания и повторного ранжирования текста. Эти модели, входящие в серию Qwen, разработанные Alibaba, предназначены для поддержки широкого спектра приложений, от семантического извлечения до поиска кода. Хотя Ollama является популярной открытой платформой для размещения и развертывания крупных языковых моделей (LLMs), интеграция моделей Qwen3 с Ollama не подробно описана в официальной документации. Однако модели доступны через Hugging Face, GitHub и ModelScope, что позволяет потенциально развернуть их локально с помощью Ollama или подобных инструментов.

Обзор новых моделей Qwen3 Embedding и Reranker на Ollama

Эти модели теперь доступны для развертывания на Ollama в различных размерах, обеспечивая передовые результаты и гибкость для широкого круга приложений, связанных с языком и кодом.

Ключевые функции и возможности

  • Размеры моделей и гибкость

    • Доступны в нескольких размерах: 0.6B, 4B и 8B параметров для задач встраивания и повторного ранжирования.
    • 8B модель встраивания на данный момент занимает 1-е место в рейтинге MTEB для многократного языка (по состоянию на 5 июня 2025 года с оценкой 70.58).
    • Поддерживает широкий спектр вариантов квантования (Q4, Q5, Q8 и т.д.) для балансировки производительности, использования памяти и скорости. Q5_K_M рекомендуется большинству пользователей, так как сохраняет большинство производительности модели, одновременно обеспечивая эффективность ресурсов.
  • Архитектура и обучение

    • Построены на основе Qwen3, используя как архитектуру двойного кодера (для встраивания), так и архитектуру перекрестного кодера (для повторного ранжирования).
    • Модель встраивания: обрабатывает отдельные текстовые сегменты, извлекая семантические представления из конечного скрытого состояния.
    • Модель повторного ранжирования: принимает пары текста (например, запрос и документ) и выдает оценку релевантности с использованием подхода перекрестного кодера.
    • Модели встраивания используют трехэтапную парадигму обучения: контрастное предварительное обучение, надзорное обучение с высококачественными данными и объединение моделей для оптимальной обобщаемости и адаптируемости.
    • Модели повторного ранжирования обучаются напрямую с использованием высококачественных помеченных данных для эффективности и эффективности.
  • Многократная и многозадачная поддержка

    • Поддерживает более 100 языков, включая языки программирования, обеспечивая надежные возможности многократной, межъязыковой и поиска кода.
    • Модели встраивания позволяют гибко определять векторы и пользовательские инструкции для настройки производительности под конкретные задачи или языки.
  • Производительность и сценарии использования

    • Передовые результаты в задачах извлечения текста, извлечения кода, классификации, кластеризации и добыче двуязычных текстов.
    • Модели повторного ранжирования превосходны в различных сценариях извлечения текста и могут быть легко объединены с моделями встраивания для конвейеров извлечения end-to-end.

Как использовать на Ollama

Вы можете запускать эти модели на Ollama с помощью команд, таких как:

ollama run dengcao/Qwen3-Embedding-8B:Q5_K_M
ollama run dengcao/Qwen3-Reranker-0.6B:F16

Выберите версию квантования, которая лучше всего подходит для ваших аппаратных и производительных потребностей.


Таблица сводки

Тип модели Доступные размеры Основные сильные стороны Многократная поддержка Варианты квантования
Встраивание 0.6B, 4B, 8B Лучшие результаты MTEB, гибкость, эффективность, SOTA Да (более 100 языков) Q4, Q5, Q6, Q8 и т.д.
Повторное ранжирование 0.6B, 4B, 8B Превосходство в оценке релевантности пар текста, эффективность, гибкость Да F16, Q4, Q5 и т.д.

Великолепные новости!

Модели Qwen3 Embedding и Reranker на Ollama представляют собой значительный скачок в области многократной, многозадачной извлечения текста и кода. С гибкими вариантами развертывания, сильной производительностью на тестах и поддержкой широкого круга языков и задач, они подходят как для исследовательских, так и для промышленных сред.

Модельный зоопарк - удовольствие для глаз теперь

Qwen3 Embedding

https://ollama.com/dengcao/Qwen3-Embedding-8B

Qwen3 Embedding 8b

https://ollama.com/dengcao/Qwen3-Embedding-4B/tags

Qwen3 Embedding 4b

https://ollama.com/dengcao/Qwen3-Embedding-0.6B/tags

Qwen3 Embedding 0.6b

Qwen3 Reranker

https://ollama.com/dengcao/Qwen3-Reranker-8B

Qwen3 Reranker 8b

dengcao/Qwen3-Reranker-8B:Q3_K_M
dengcao/Qwen3-Reranker-8B:Q5_K_M

https://ollama.com/dengcao/Qwen3-Reranker-4B/tags

dengcao/Qwen3-Reranker-4B:Q5_K_M

Qwen3-Reranker-4B

https://ollama.com/dengcao/Qwen3-Reranker-0.6B/tags

Qwen3-Reranker-0.6B

Отлично!

Полезные ссылки