Rost Glukhov | Personlig webbplats och teknisk blogg

Spekulativ dekodering: 20–50 % snabbare LLM-inferens

Ett modell med 70 miljarder parametrar (70B) genererar en token per framåtriktad passering (forward pass), och vid varje passering laddas vikterna in från VRAM, uppmärksamheten beräknas över kontexten och minnet synkroniseras. Mellan tokenerna sitter GPU:n idle medan den väntar på att sekventiella beroenden ska lösas.

Mönster för orkestrering av flera agenter: En praktisk guide

Enkelt agenter-baserade AI-system nådde sin topp 2025 — du gav en LLM en prompt, några verktyg och ett mål, och den klarade sig rimligt bra på begränsade uppgifter.

Det transaktionella utboks mönstret i Go med PostgreSQL

Två skrivningar som bör lyckas tillsammans, kommer med största sannolikhet att misslyckas separat. Din orderservice sparar ordern i databasen och publicerar sedan ett order.created-händelsemeddelande till en meddelandebroker.

Go context.Context gjort rätt: Avbrott, tidsgränser och värden

Go:s context.Context är enkel nog att använda fel — och det är just det problemet.

Vad är specdriven utveckling? Specen som sanningens källa

Specdriven utveckling är en av de idéer som mjukvarutekniker har vänt sig till tidigare och sedan lagt åt sidan när insatsen inte längre gav avkastning.

Spec-driven development vs. vibe coding: Vattenfall?

Spec-driven development (SDD) inledde 2026 som det seriösa alternativet för utvecklare som ville motverka drift i “vibe coding”.

Beslutsprotokoll för AI-driven mjukvaruutveckling

Beslutsprotokoll är den saknas minneslagret i AI-assisterad mjukvaruutveckling. De fångar inte bara vad som byggdes, utan varför — och den skillnaden blir avgörande när AI-verktyg skriver din kod.

Arkitektur för felhantering i Go: Gränser och mönster

Felhantering i Go är lätt att klaga på. Varje Go-utvecklare har skrivit denna kod hundratals gånger:

Att testa sammanparalliserad Go-kod har alltid krävt en viss disciplin. Goroutiner är billiga, kanaler är enkla och avbrott via context är idiomatic — bakgrundsgoroutiner och timrar finns överallt i verkliga Go-tjänster.

Google A2A-protokollet 2026: Adaption, hype och verklighet

Google:s Agent2Agent-protokoll, oftast förkortat A2A, hade ett konstigt första år.

Polling-agenter i AI-assistenter: 11 implementeringsmönster

Pollningsagenter är en av de minst glamourösa delarna av arkitekturen för AI-assistenter, men de är också en av de mest användbara.

Vad är A2A-protokollet? Agentkort och uppgifter förklaras

A2A-protokollet, förkortat för Agent2Agent Protocol, är en öppen standard för kommunikation mellan oberoende AI-agent-system.

A2A kontra MCP: Behöver AI-agenter verkligen båda protokollen?

AI-agentarkitektur börjar delas upp i två lager.

Implementering av CQRS i Go: En praktisk guide till skalbar arkitektur

CQRS är ett av de mönster som ofta överförsäljs, överkomplieras och ibland felaktigt diagnostiseras som botemedel mot den vanliga CRUD-tråkigheten.

Snabbstart och referensguide för Mermaid-diagram för utvecklare

Mermaid är ett textbaserat verktyg för diagramskapning, riktat till de som föredrar att skriva diagram framför att dra runt rutor på en canvas. Det använder en Markdown-liknande syntax för att beskriva flödesdiagram, sekvensdiagram, klassdiagram, statmaskiner, tidslinjer, Gantt-diagram, entitetsrelationsdiagram och mer.

PARA-metoden för ingenjörer: Organisera kunskap efter åtgärd

Att organisera anteckningar efter ämne låter logiskt, tills du har anteckningar om PostgreSQL i fem olika mappar och inte kan hitta den som är relevant för dagens problem.

Prenumerera