DevOps

Руководство по настройке размера контекста Docker Model Runner

Настройка размеров контекста в Docker Model Runner сложнее, чем должно быть.

Добавление поддержки GPU NVIDIA в Docker Model Runner

Docker Model Runner — это официальный инструмент Docker для запуска моделей ИИ локально, но включение ускорения NVIDIA GPU в Docker Model Runner требует специальной настройки.

Стратегии кэширования Hugo для повышения производительности

Стратегии кэширования Hugo (https://www.glukhov.org/ru/post/2025/11/hugo-caching-strategies/ “Стратегии кэширования Hugo”) являются ключевыми для максимизации производительности вашего статического генератора сайтов. Хотя Hugo генерирует статические файлы, которые изначально быстры, правильное кэширование на нескольких уровнях может значительно улучшить время сборки, снизить нагрузку на сервер и повысить пользовательский опыт.

Руководство по метрикам DORA: Измерение успеха DevOps

Метрики DORA (DevOps Research and Assessment) являются эталоном для измерения производительности доставки программного обеспечения.

Шаблоны многоквартирных баз данных с примерами на Go

Мультитенантность — это фундаментальный архитектурный паттерн для SaaS-приложений, позволяющий нескольким клиентам (арендаторам) использовать одну и ту же инфраструктуру приложения, сохраняя при этом изоляцию данных.

Архитектурные шаблоны для обеспечения безопасности данных: в состоянии покоя, в процессе передачи и во время выполнения

Когда данные становятся ценным активом, их защита никогда не была более критичной. С момента создания информации до момента ее утилизации, ее путь полон рисками - будь то хранение, передача или активное использование.

Strapi против Directus против Payload: Сражение бесплатных CMS

Выбор правильной headless CMS может сделать или сломать вашу стратегию управления контентом. Давайте сравним три открытых решения, которые влияют на то, как разработчики создают приложения, основанные на контенте.

Создание CLI-приложений на Go с использованием Cobra и Viper

Интерфейсы командной строки (CLI) являются важными инструментами для разработчиков, системных администраторов и специалистов DevOps. Два библиотеки Go стали де-факто стандартом для разработки CLI на Go: Cobra для структуры команд и Viper для управления конфигурацией.

Снижение затрат на LLM: стратегии оптимизации токенов

Оптимизация токенов — это ключевой навык, который отделяет экономически эффективные приложения на базе LLM от экспериментов, истощающих бюджет.

Создание микросервисов на основе событий с помощью AWS Kinesis

AWS Kinesis стал краеугольным камнем для построения современных микросервисных архитектур на основе событий, обеспечивая обработку данных в реальном времени в масштабируемых объемах при минимальных эксплуатационных затратах.

Самостоятельное развертывание Nextcloud: Ваше частное облачное решение

Nextcloud — это ведущая открытая платформа для хранения и совместной работы в облаке, которая полностью контролирует ваши данные.

Самостоятельное размещение Immich: частное фотооблако

Immich — это революционное открытое программное обеспечение с открытым исходным кодом для управления фотографиями и видео, которое дает вам полный контроль над вашими воспоминаниями. С функциями, сопоставимыми с Google Photos, включая распознавание лиц с использованием ИИ, умный поиск и автоматическое резервное копирование с мобильных устройств, при этом все ваши данные остаются конфиденциальными и защищенными на вашем собственном сервере.

Шпаргалка по Elasticsearch: основные команды и советы

Elasticsearch — это мощный распределенный поисковый и аналитический движок, построенный на базе Apache Lucene. Эта всеобъемлющая шпаргалка охватывает основные команды, лучшие практики и быстрые справочники для работы с кластерами Elasticsearch.

Сравнение производительности Ollama: NVIDIA DGX Spark против Mac Studio против RTX-4080

Я выкопал некоторые интересные тесты производительности GPT-OSS 120b, работающего на Ollama на трех разных платформах: NVIDIA DGX Spark, Mac Studio и RTX 4080. Модель GPT-OSS 120b из библиотеки Ollama весит 65ГБ, что означает, что она не помещается в 16ГБ видеопамяти RTX 4080 (или более новой RTX 5080).

Модульное тестирование в Python: Полное руководство с примерами

Модульное тестирование гарантирует, что ваш код на Python работает правильно и продолжает работать по мере развития проекта. Это всеобъемлющее руководство охватывает все, что вам нужно знать о модульном тестировании в Python, от базовых концепций до продвинутых техник.

Шпаргалка по Docker Model Runner: команды и примеры

Docker Model Runner (DMR) — это официальное решение Docker для запуска моделей ИИ локально, представленное в апреле 2025 года. Этот справочник предоставляет быстрый доступ ко всем основным командам, настройкам и лучшим практикам.