Self-Hosting

Сравнение качества перевода страниц Hugo - модели больших языков на Ollama

Сравнение качества перевода страниц Hugo - модели больших языков на Ollama

qwen3 8b, 14b и 30b, devstral 24b, mistral small 24b

В этом тесте я сравниваю, как разные LLM, размещённые на Ollama, переводят Hugo-страницу с английского на немецкий.
Три страницы, которые я протестировал, были на разных темах, имели хорошее markdown-форматирование с определённой структурой: заголовки, списки, таблицы, ссылки и т.д.

Переранжирование текстовых документов с помощью Ollama и модели Qwen3 Embedding - в Go

Переранжирование текстовых документов с помощью Ollama и модели Qwen3 Embedding - в Go

Реализация RAG? Вот несколько фрагментов кода на языке Golang.

Этот маленький
Пример кода на Go для переоценки вызывает Ollama для генерации вложений
для запроса и для каждого кандидата документа,
затем сортируя по убыванию косинусной схожести.

Цены на Nvidia RTX 5080 и RTX 5090 в Австралии - Июнь 2025

Цены на Nvidia RTX 5080 и RTX 5090 в Австралии - Июнь 2025

Реалистичная оценка цен — RTX 5080 и RTX 5090

Просто три месяца назад мы не видели RTX 5090 в магазинах, а теперь они здесь, но цены немного выше, чем MRSP.
Давайте сравним самые низкие цены на RTX 5080 и RTX 5090 в Австралии и посмотрим, как обстоят дела.

YaCy: Децентрализованный поисковый движок, преимущества, вызовы и будущее

YaCy: Децентрализованный поисковый движок, преимущества, вызовы и будущее

Самохостинг веб-поискового движка? Просто!

YaCy — это децентрализованный, peer-to-peer (P2P) поисковик разработан для работы без централизованных серверов, позволяя пользователям создавать локальные или глобальные индексы и выполнять поиски, запрашивая информацию у распределённых узлов.

Хорош ли Quadro RTX 5880 Ada 48 ГБ?

Хорош ли Quadro RTX 5880 Ada 48 ГБ?

Больше ОЗУ, меньше мощности, и всё равно дорогой, как...

Самая продвинутая автоматизированная система для потрясающей работы.

Модели эмбеддингов и переранжирования Qwen3 на Ollama: передовые достижения

Модели эмбеддингов и переранжирования Qwen3 на Ollama: передовые достижения

Новые потрясающие ЛЛМ доступны в Ollama

Модели Qwen3 Embedding и Reranker являются последними выпусками в семействе Qwen, специально разработанными для продвинутых задач встраивания, извлечения и повторного ранжирования текста.

Как хранить превью-изображения в папке пакета страниц для сайтов Hugo с темой Mainroad

Как хранить превью-изображения в папке пакета страниц для сайтов Hugo с темой Mainroad

Сохранение всех материалов, связанных со страницей, в одной папке...

Долгое время меня мучила эта навязчивая идея поместить превью-изображения страниц в статический каталог.
Это касается тем Mainroad, Rodster и подобных.

Тест: Как Ollama использует производительность процессора Intel и эффективные ядра

Тест: Как Ollama использует производительность процессора Intel и эффективные ядра

Ollama на процессоре Intel: эффективные ядра против производительных ядер

У меня есть теория для проверки - если использовать все ядра процессора Intel для повышения скорости LLM Меня беспокоит, что новый модель gemma3 27 бит (gemma3:27b, 17 ГБ на ollama) не помещается в 16 ГБ видеопамяти моего GPU, и частично работает на CPU.

Сравнение пригодности GPU NVidia для ИИ

Сравнение пригодности GPU NVidia для ИИ

Искусственный интеллект требует много мощности...

В условиях хаоса современного мира здесь я сравниваю технические характеристики различных карт, подходящих для задач AI (Deep Learning, Обнаружение объектов и LLMs). Однако они все невероятно дорогие.