K8S - Рост Глухов | Персональный сайт и технический блог

Мониторинг инференса LLM в продакшене (2026): Prometheus и Grafana для vLLM, TGI и llama.cpp

Инференс LLM выглядит как «еще один API» — до тех пор, пока не возникнут скачки задержки, не начнут накапливаться очереди, а ваши GPU не окажутся загружены по памяти на 95% без очевидной причины.

Топ-19 актуальных проектов на Go в GitHub — январь 2026 года

Экосистема Go продолжает процветать с инновационными проектами, охватывающими инструменты ИИ, самоуправляемые приложения и инфраструктуру разработчиков. Этот обзор анализирует самые популярные репозитории Go на GitHub в этом месяце.

Открытый WebUI: Интерфейс самонастроенного LLM

Открыть WebUI — это мощное, расширяемое и функциональное веб-приложение для взаимодействия с большими языковыми моделями.

Технические мероприятия в Мельбурне, на которые стоит сходить в 2026 году

Техническое комьюнити Мельбурна продолжает процветать в 2026 году с впечатляющим набором конференций, митапов и мастер-классов, охватывающих разработку программного обеспечения, облачные вычисления, ИИ, кибербезопасность и новые технологии.

vLLM — это высокопроизводительный, экономичный по памяти движок для вывода и развертывания больших языковых моделей (LLM), разработанный лабораторией Sky Computing Калифорнийского университета в Беркли.

Go Linters: Необходимые инструменты для контроля качества кода

Современная разработка на Go требует строгих стандартов качества кода. Линтеры для Go автоматизируют обнаружение ошибок, уязвимостей безопасности и стилистических несоответствий до их попадания в продакшен.

Микросервисы на Go для оркестрации AI/ML

По мере усложнения рабочих нагрузок искусственного интеллекта (ИИ) и машинного обучения (МО) возрастает потребность в надежных системах оркестрации. Простота, производительность и возможности параллельного выполнения в Go делают его идеальным выбором для создания слоя оркестрации конвейеров машинного обучения, даже если сами модели написаны на Python.

Инфраструктура искусственного интеллекта на потребительском оборудовании

Демократизация искусственного интеллекта уже здесь. С появлением открытых LLM, таких как Llama, Mistral и Qwen, которые теперь не уступают проприетарным моделям, команды могут создавать мощную инфраструктуру ИИ на потребительском оборудовании — значительно сокращая расходы при сохранении полного контроля над конфиденциальностью данных и развертыванием.

Мониторинг с Prometheus: полная настройка и лучшие практики

Prometheus стал де-факто стандартом для мониторинга облачных приложений и инфраструктуры, предлагая сбор метрик, запросы и интеграцию с инструментами визуализации.

Установка и использование Grafana на Ubuntu: полное руководство

Grafana — это ведущая открытая платформа для мониторинга и наблюдения, которая преобразует метрики, логи и трассировки в действенные инсайты через потрясающие визуализации.

Helm Charts: Управление пакетами в Kubernetes

Helm изменил подход к развертыванию приложений в Kubernetes, внедрив концепции управления пакетами, знакомые из традиционных операционных систем.

StatefulSets и постоянное хранилище в Kubernetes

Kubernetes StatefulSets — это основное решение для управления приложениями с состоянием, которым требуются стабильные идентификаторы, постоянное хранилище и упорядоченные паттерны развертывания, что критически важно для баз данных, распределенных систем и кэш-услуг.

Архитектурные шаблоны для обеспечения безопасности данных: в состоянии покоя, в процессе передачи и во время выполнения

Когда данные становятся ценным активом, их защита никогда не была более критичной. С момента создания информации до момента ее утилизации, ее путь полон рисками - будь то хранение, передача или активное использование.

Реализация сервис-меша с использованием Istio и Linkerd: Полное руководство

Узнайте, как реализовать и оптимизировать архитектуры сервис-мешей с использованием Istio и Linkerd. Это руководство охватывает стратегии развертывания, сравнения производительности, конфигурации безопасности и лучшие практики для производственных сред.

Установка k3s на baremetal - пошаговое руководство и с использованием Terraform

Вот пошаговое руководство по установке кластера K3s из 3 узлов на серверах с “голым” железом (1 мастер + 2 рабочих узла).

Дистрибутивы Kubernetes — краткий обзор kubeadm, k3s, MicroK8s, Minikube, Talos Linux и RKE2

Сравнение дистрибутивов Kubernetes для саморазвертывания на bare-metal или домашних серверах, с акцентом на простоту установки, производительность, системные требования и функциональность.