DevOps

Snabbstart och referensguide för Mermaid-diagram för utvecklare

Snabbstart och referensguide för Mermaid-diagram för utvecklare

Diagram som kod, utan krångel.

Mermaid är ett textbaserat verktyg för diagramskapning, riktat till de som föredrar att skriva diagram framför att dra runt rutor på en canvas. Det använder en Markdown-liknande syntax för att beskriva flödesdiagram, sekvensdiagram, klassdiagram, statmaskiner, tidslinjer, Gantt-diagram, entitetsrelationsdiagram och mer.

AI-assistentarkitektur: LLM, minne, verktyg, ruttning, observabilitet

AI-assistentarkitektur: LLM, minne, verktyg, ruttning, observabilitet

Hur seriösa assistenter faktiskt byggs.

Ett produktionsklart AI-assistent-system är inte bara “en LLM med en prompt”. Det är ett system som tar emot intentioner, behåller tillstånd, beslutar när det ska hämta information eller utföra handlingar, och exponerar tillräckligt med detaljer om körningen för att kunna felsöka misslyckanden.

Avladda alla llama.cpp-routermodeller utan att starta om

Avladda alla llama.cpp-routermodeller utan att starta om

Frigör VRAM utan att stoppa llama-server.

Routerläge för llama.cpp är en av de mest användbara förändringarna i llama-server på flera år. Det ger slutligen lokala aktörer av LLM (Large Language Models) något som liknar modellhanteringsupplevelsen som man förväntar sig från Ollama, samtidigt som det behåller den råa prestanda och den lågnivåkontroll som gör llama.cpp värd att använda i första hand.

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes Agent: installation och snabbstart för utvecklare

Hermes Agent är en självhostad, modellagnostisk AI-assistent som körs på en lokal maskin eller en lågkostnadsvirtuell server (VPS), fungerar via terminal- och meddelandegränssnitt och förbättras över tid genom att omvandla upprepade uppgifter till återanvändbara färdigheter.

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama-server med komposition i förgrunden, GPU och uthållighet.

Ollama fungerar utmärkt på “bare metal”. Det blir ännu mer intressant när du behandlar det som en tjänst: en stabil slutpunkt, fastlagda versioner, beständig lagring och en GPU som antingen är tillgänglig eller inte.