Руководство по настройке размера контекста Docker Model Runner
Настройка размеров контекста в Docker Model Runner с обходными путями
Настройка размеров контекста в Docker Model Runner сложнее, чем должно быть.
Настройка размеров контекста в Docker Model Runner с обходными путями
Настройка размеров контекста в Docker Model Runner сложнее, чем должно быть.
Включите ускорение с помощью GPU для Docker Model Runner с поддержкой NVIDIA CUDA
Docker Model Runner — это официальный инструмент Docker для запуска моделей ИИ локально, но включение ускорения NVIDIA GPU в Docker Model Runner требует специальной настройки.
Оптимизация разработки и запуска сайтов на Hugo
Стратегии кэширования Hugo (https://www.glukhov.org/ru/post/2025/11/hugo-caching-strategies/ “Стратегии кэширования Hugo”) являются ключевыми для максимизации производительности вашего статического генератора сайтов. Хотя Hugo генерирует статические файлы, которые изначально быстры, правильное кэширование на нескольких уровнях может значительно улучшить время сборки, снизить нагрузку на сервер и повысить пользовательский опыт.
Овладеть четырьмя ключевыми метриками DORA для достижения превосходства в DevOps
Метрики DORA (DevOps Research and Assessment) являются эталоном для измерения производительности доставки программного обеспечения.
Полное руководство по шаблонам многоквартирных баз данных
Мультитенантность — это фундаментальный архитектурный паттерн для SaaS-приложений, позволяющий нескольким клиентам (арендаторам) использовать одну и ту же инфраструктуру приложения, сохраняя при этом изоляцию данных.
Полное руководство по безопасности - данные в состоянии покоя, в транзите, во время выполнения
Когда данные становятся ценным активом, их защита никогда не была более критичной. С момента создания информации до момента ее утилизации, ее путь полон рисками - будь то хранение, передача или активное использование.
Сравнение headless CMS: функции, производительность и случаи использования
Выбор правильной headless CMS может сделать или сломать вашу стратегию управления контентом. Давайте сравним три открытых решения, которые влияют на то, как разработчики создают приложения, основанные на контенте.
Разработка CLI на Go с фреймворками Cobra и Viper
Интерфейсы командной строки (CLI) являются важными инструментами для разработчиков, системных администраторов и специалистов DevOps. Два библиотеки Go стали де-факто стандартом для разработки CLI на Go: Cobra для структуры команд и Viper для управления конфигурацией.
Сократите расходы на LLM на 80% за счет интеллектуальной оптимизации токенов
Оптимизация токенов — это ключевой навык, который отделяет экономически эффективные приложения на базе LLM от экспериментов, истощающих бюджет.
Событийная архитектура с AWS Kinesis для масштабирования
AWS Kinesis стал краеугольным камнем для построения современных микросервисных архитектур на основе событий, обеспечивая обработку данных в реальном времени в масштабируемых объемах при минимальных эксплуатационных затратах.
Управляйте своими данными с помощью облачного хранилища Nextcloud с саморазмещением
Nextcloud — это ведущая открытая платформа для хранения и совместной работы в облаке, которая полностью контролирует ваши данные.
Ваши фотографии на самоуправляемом AI-облаке
Immich — это революционное открытое программное обеспечение с открытым исходным кодом для управления фотографиями и видео, которое дает вам полный контроль над вашими воспоминаниями. С функциями, сопоставимыми с Google Photos, включая распознавание лиц с использованием ИИ, умный поиск и автоматическое резервное копирование с мобильных устройств, при этом все ваши данные остаются конфиденциальными и защищенными на вашем собственном сервере.
Команды Elasticsearch для поиска, индексации и аналитики
Elasticsearch — это мощный распределенный поисковый и аналитический движок, построенный на базе Apache Lucene. Эта всеобъемлющая шпаргалка охватывает основные команды, лучшие практики и быстрые справочники для работы с кластерами Elasticsearch.
Бенчмарки GPT-OSS 120b на трёх платформах ИИ
Я выкопал некоторые интересные тесты производительности GPT-OSS 120b, работающего на Ollama на трех разных платформах: NVIDIA DGX Spark, Mac Studio и RTX 4080. Модель GPT-OSS 120b из библиотеки Ollama весит 65ГБ, что означает, что она не помещается в 16ГБ видеопамяти RTX 4080 (или более новой RTX 5080).
Тестирование на Python с использованием pytest, TDD, мокирования и покрытия кода
Модульное тестирование гарантирует, что ваш код на Python работает правильно и продолжает работать по мере развития проекта. Это всеобъемлющее руководство охватывает все, что вам нужно знать о модульном тестировании в Python, от базовых концепций до продвинутых техник.
Быстрая справка по командам Docker Model Runner
Docker Model Runner (DMR) — это официальное решение Docker для запуска моделей ИИ локально, представленное в апреле 2025 года. Этот справочник предоставляет быстрый доступ ко всем основным командам, настройкам и лучшим практикам.