Rost Glukhov | Persönliche Website und technischer Blog

Google A2A-Protokoll 2026: Adoption, Hype und Realität

Googles Agent2Agent-Protokoll, meist abgekürzt als A2A, hatte ein seltsames erstes Jahr.

Polling Agents in KI-Assistenten: 11 Implementierungsmuster

Polling-Agenten gehören zu den wenig glamourösen Teilen der Architektur von KI-Assistenten, sind aber gleichzeitig auch eine der nützlichsten Komponenten.

Was ist das A2A-Protokoll? Agent Cards und Tasks im Überblick

Das A2A-Protokoll, kurz für Agent2Agent Protocol, ist ein offener Standard für die Kommunikation zwischen unabhängigen KI-Agent-Systemen.

A2A vs. MCP: Benötigen KI-Agenten wirklich beide Protokolle?

Die Architektur von KI-Agenten beginnt sich in zwei Schichten aufzuspalten.

Implementierung von CQRS in Go: Ein praktischer Leitfaden für skalierbare Architektur

CQRS ist eines dieser Patterns, das überbeworben, überkompliziert und gelegentlich fälschlicherweise als Heilmittel gegen die langweilige CRUD-Alltagsarbeit dargestellt wird.

Mermaid-Diagramme: Schnellstart und Cheat Sheet für Entwickler

Mermaid ist ein textbasiertes Diagrammwerkzeug für Menschen, die Diagramme lieber schreiben, als Kästchen auf einer Leinwand zu verschieben. Es verwendet eine Markdown-ähnliche Syntax, um Flussdiagramme, Sequenzdiagramme, Klassendiagramme, Zustandsautomaten, Zeitachsen, Gantt-Diagramme, Entity-Relationship-Diagramme und mehr zu beschreiben.

PARA-Methode für Ingenieurinnen und Ingenieure: Wissen nach Aktionen organisieren

Die Organisation von Notizen nach Themen klingt logisch, bis man Notizen zu PostgreSQL in fünf verschiedenen Ordnern hat und diejenige, die für das aktuelle Problem relevant ist, nicht findet.

Evergreen Notes: Notizen verfassen, die im Laufe der Zeit an Wert gewinnen

Die meisten Engineering-Notizen werden einmal geschrieben und dann vergessen. Man fasst etwas während einer Debugging-Sitzung zusammen, kopiert es irgendwohin und findet es zwei Jahre später, ohne Kontext dafür zu haben, warum es damals wichtig war.

Digitale Gärten: Wissen wachsen lassen statt es nur zu veröffentlichen

Das vorherrschende Modell zur Veröffentlichung von Wissen im Internet hat sich seit den frühen 2000er Jahren kaum verändert: Etwas schreiben, polieren, veröffentlichen und dann weiterziehen.

Modell-Routing: Verwenden Sie nicht ein Modell für alles

Das Ausführen eines Modells mit 70 Milliarden Parametern, um eine 200-Wörter-E-Mail zusammenzufassen, ist verschwenderisch. Das Ausführen eines 3-Milliarden-Parameter-Modells zur Überprüfung von Produktionscode ist fahrlässig. Die meisten Systeme liegen irgendwo dazwischen – und genau hier kommt das Modell-Routing ins Spiel.

LLM-Guardrails in der Praxis: Was wirklich funktioniert

LLMs sind unvorhersehbar. Sie halluzinieren, geben Daten preis, generieren schädliche Inhalte oder lehnen legitime Anfragen ab. Guardrails (Sicherheitsvorkehrungen) beschränken das Modellverhalten, ohne dabei die Fähigkeiten zu beeinträchtigen.

Kostenoptimierung für LLM-Systeme: Wo das Geld tatsächlich fließt

Die Kosten für LLMs steigen linear mit der Nutzung. Ein System, das täglich 10.000 Anfragen mit $0,01 pro Anfrage verarbeitet, kostet täglich $100 — also $365 pro Jahr. Im Unternehmensmaßstab belaufen sich die Kosten auf über $10.000.

Design von Multi-Model-Systemen: Wenn ein einzelnes Modell nicht ausreicht

Einzige-Modell-Systeme sind einfach. Multi-Modell-Systeme sind leistungsstark. Die Herausforderung besteht nicht darin, Modelle auszuwählen, sondern die Architektur zu entwerfen, die sie orchestriert.

Speicher verwandelt Assistenten von reaktiv in persistent, ist aber auch der Ort, an dem viele Systeme stillschweigend veralten. Umfragen argumentieren, dass die Trennung zwischen kurzfristigem und langfristigem Speicher für moderne Agenten-Speicher nicht mehr ausreicht; OpenAI- und LangGraph-SDKs weisen auf einen einfacheren Stack hin – Arbeitsgedächtnis, dauerhafter Zustand und Abruf.

Architektur eines KI-Assistenten: LLM, Speicher, Werkzeuge, Routing, Observability

Ein produktionsreifes KI-Assistentensystem ist nicht einfach „ein LLM mit einem Prompt“. Es ist ein System, das Absichten akzeptiert, Zustände verwaltet, entscheidet, wann es Informationen abrufen oder Aktionen ausführen soll, und genügend Laufzeitdetails offenlegt, um Fehler zu debuggen.

KI für das Wissensmanagement: Praktische Workflows, die wirklich halten

KI ersetzt nicht das Wissensmanagement; sie verändert dessen Gestalt für Einzelpersonen und Teams gleichermaßen.

Abonnieren