Notes on the margins

Rost Glukhov. Personal site and technical blog

Documentatietools
Hardware
LLM-hosting
LLM-prestaties
Programmeren
DevOps
Recepten
Hardware-nieuws
AI
Ollama
Spiekbriefjes
Handleidingen
Offline
Over

Inference

LLM-prestaties in 2026: benchmarks, bottlenecks & optimalisatie

A performance engineering hub for running LLMs efficiently: runtime behavior, bottlenecks, benchmarks, and the real constraints that shape throughput and latency.

Recente posts

Browser Automatisering in Go: Selenium, chromedp, Playwright, ZenRows
Hoe je bureaubladlauncher op Ubuntu 24 configureert met standaardicoons
Maak AWS CloudFront aan op Pay-as-You-Go (niet het Gratis Plan)
Browserautomatisering in Python: Playwright, Selenium & Meer
Terminal UI: BubbleTea (Go) vs Ratatui (Rust)

Categorieën

AI
Architecture
Cheatsheet
Coding
Community
Cookbook
Dev
DevOps
Hardware
Howtos
Offline
Privacy
Research
Security
Self-Hosting

Tags

AI AI Coding Ai-Infrastructure Anaconda Android API Architecture AWS AWS Amplify Backup Bash Cheatsheet CI/CD Claude CLI Cloud Cloud-Llm CloudFront Coding Community Conversion Cookbook Cpu Database DeepLearning Dev DevOps DGX Spark Digital Detox Docker Docker-Model-Runner Documentation Filofax Flutter Food Git Gitea GitHub GitHub Actions Go Golang Gpu GraphQL Hardware Hosting Howtos Hugo Images Inference Infrastructure JavaScript K8S Kubernetes LabelStudio Latency Latex Linux LLM Llm-Benchmarks Llm-Hosting Llm-Infrastructure Llm-Performance Llm-Server Local-Llm Machine Learning Mainroad Markdown MCP Melbourne Memory Microservices Minio MMDetection Monitoring NLP Node.js NVidia ObjectDetection Offline Ollama Open Source Pdf Performance Performance-Engineering Perplexica Photos PostgreSQL Printing Privacy Prometheus Python PyTorch RAG Rust S3 Search Security Self-Hosted-Llm Self-Hosting SEO Serverless Social Media SQL Terminal Terraform Testing Throughput Tools TUI TypeScript Ubuntu Vllm Vram VSCode Web Hosting Windows

Social

root@@@glukhov.au

rost @ lemmy.world

rosgluk @ github

rosgluk @ bluesky

rosgluk @ Medium

rosgluk @ blogspot

rosgluk @ tumblr

Talen

EN English
RU Русский
DE Deutsch
ES Español
FR Français
IT Italiano
JA 日本語
KO 한국어
PL Polski
PT Português
NL Nederlands
SV Svenska

© 2026 Rost Glukhov. Gegenereerd met Hugo en het Mainroad theme.