관측 가능성과 알림을 위한 Go의 slog를 활용한 구조화된 로깅
트레이스에 연결되는 쿼리 가능한 JSON 로그
로그는 시스템이 화재 상태일 때도 여전히 사용할 수 있는 디버깅 인터페이스입니다. 문제는 평문 텍스트 로그는 시간이 지날수록 관리하기 어려워진다는 점입니다. 필터링, 집계, 알림이 필요해지자마자 문장을 파싱하게 됩니다.
트레이스에 연결되는 쿼리 가능한 JSON 로그
로그는 시스템이 화재 상태일 때도 여전히 사용할 수 있는 디버깅 인터페이스입니다. 문제는 평문 텍스트 로그는 시간이 지날수록 관리하기 어려워진다는 점입니다. 필터링, 집계, 알림이 필요해지자마자 문장을 파싱하게 됩니다.
대부분의 로컬 AI 설정은 모델과 런타임에서 시작합니다.
프로메테우스와 그라파나를 사용하여 LLM 모니터링하기
LLM 추론은 “단순한 API처럼” 보일 수 있지만, 지연 시간이 급격히 증가하고 대기열이 다시 쌓이기 시작하며, GPU가 95% 메모리 사용률에 도달하면서도 명확한 설명이 없을 때 문제가 발생합니다.
몇 분 안에 Docker에서 Garage 실행하기
Garage은 소규모에서 중간 규모 배포에 적합한 오픈소스, 자체 호스팅, S3 호환 오브젝트 스토리지 시스템으로, 강력한 내구성과 지리 분산에 중점을 두고 설계되었습니다.
프로덕션 시스템을 위한 지표, 대시보드, 로그 및 알림 — Prometheus, Grafana, Kubernetes 및 AI 워크로드.
관측 가능성 은 신뢰할 수 있는 프로덕션 시스템의 토대입니다.
메트릭, 대시보드, 경보가 없으면 쿠버네티스 클러스터는 점진적으로 이상을 띠게 되고, AI 워크로드가 조용히 실패하며, 사용자가 불평하기 전까지 지연 시간의 악화는 감지되지 않습니다.