SelfHosting

MinIO CE 2026: Upstream zurückgezogen, nur noch Quellcode und was man stattdessen nutzen sollte

Die MinIO Community Edition (CE) ist nicht länger eine sichere Standardoption für neue Produktionsysteme.

KI-Systeme-Speicher – Persistente Wissensspeicherung und Agentenspeicher

Dieser Abschnitt sammelt Anleitungen zu persistentem Wissen und Gedächtnis für KI-Systeme — wie Assistenten Fakten, Präferenzen und kondensierten Kontext über Sitzungen hinweg beibehalten, ohne jeden Token in einen einzigen Prompt zu stopfen. Hier bedeutet Gedächtnis die bewusste Speicherung (Nutzerfakten, Zusammenfassungen, durch Plugins gestützte Speicher), nicht GPU-RAM oder Modellgewichte.

Vergleich von Agent Memory Providern — Honcho, Mem0, Hindsight und fünf weitere

Moderne Assistenten vergessen nach dem Schließen des Tabs immer noch alles, es sei denn, etwas bleibt über das Kontextfenster hinaus bestehen. Agent Memory Provider (Speicheranbieter für Agenten) sind Dienste oder Bibliotheken, die Fakten und Zusammenfassungen über Sitzungen hinweg halten – oft als Plugins integriert, damit das Framework schlank bleibt, während der Speicher skaliert.

Hermes-Agent-Speichersystem: So funktioniert persistentes KI-Speicher

Sie kennen das Prinzip. Sie öffnen einen Chat mit einem KI-Agenten, erläutern Ihr Projekt, teilen Ihre Präferenzen, lassen Aufgaben erledigen und schließen den Tab. Wenn Sie in der folgenden Woche zurückkehren, ist es, als würden Sie mit einem Fremden sprechen – der gesamte Kontext ist verloren, jede Präferenz vergessen, das Projekt muss von Grund auf neu erklärt werden.

OpenClaw: Aufstieg und Fall – Zeitplan und die wahren Gründe für den Zusammenbruch

OpenClaw ist als Produkt gescheitert. Es hat seinen Treibstoff verloren.

Llama-Server Router-Modus – Dynamisches Modellwechseln ohne Neustart

Lange Zeit hatte llama.cpp eine offensichtliche Einschränkung: Man konnte nur ein Modell pro Prozess bereitstellen, und ein Wechsel bedeutete einen Neustart.

Wissensmanagement 2026: PKM-Tools, selbst gehostete Wikis und digitale Systeme

Persönliches Wissensmanagement umfasst Obsidian, Logseq, DokuWiki, Zettelkasten und PARA – die richtige Wahl hängt davon ab, ob Sie einen lokalen Notizgraphen, ein selbst gehostetes Wiki oder einen Outliner-gesteuerten Workflow bevorzugen.

Hermes KI-Assistenten-Funktionen für echte Produktionsumgebungen

Der Hermes KI-Assistent, offiziell dokumentiert als Hermes Agent, wird nicht als einfacher Chat-Wrapper positioniert.

OpenClaw Skills-Ökosystem und praxisnahe Auswahl für den Produktiveinsatz

OpenClaw verfügt über zwei Erweiterungskonzepte, die leicht verwechselt werden können.

Plugins erweitern die Laufzeitumgebung. Skills erweitern das Verhalten des Agents.

OpenClaw-Plugins – Ökosystem-Leitfaden und praktische Empfehlungen

Dieser Artikel handelt von OpenClaw-Plugins — nativen Gateway-Paketen, die Kanäle, Modellanbieter, Tools, Sprachfunktionen, Speicher, Medien, Websuche und andere Laufzeitschnittstellen hinzufügen.

OpenClaw-Produktionskonfigurationen mit Plugins und Skills

OpenClaw wirkt in Demos einfach. In der Produktion wird es zu einem System.

Vane (Perplexica 2.0) Schnellstart mit Ollama und llama.cpp

Vane ist einer der pragmatischeren Einträge im Bereich „KI-Suche mit Quellenangaben": eine selbst gehostete Antwortmaschine, die live abrufbare Websuche mit lokalen oder Cloud-LLMs kombiniert, während der gesamte Stack unter Ihrer Kontrolle bleibt.

Hermes AI-Assistent – Installation, Einrichtung, Workflow und Fehlerbehebung

Hermes Agent ist ein selbst gehosteter, modellagnostischer KI-Assistent, der auf einem lokalen Computer oder einem kostengünstigen VPS läuft, über Terminal- und Messaging-Schnittstellen arbeitet und sich im Laufe der Zeit verbessert, indem er wiederholte Aufgaben in wiederverwendbare Fertigkeiten umwandelt.

TGI – Text Generation Inference – Installation, Konfiguration, Fehlerbehebung

Text Generation Inference (TGI) hat eine sehr spezifische Energie. Es ist nicht das neueste Kind auf der Inferenz-Straße, aber es ist dasjenige, das bereits gelernt hat, wie Produktion funktioniert –

SGLang-Schnellstart: LLMs installieren, konfigurieren und über die OpenAI-API bereitstellen

SGLang ist ein leistungsfähiges Bereitstellungsframework für große Sprachmodelle und multimodale Modelle, das entwickelt wurde, um Inferenz mit geringer Latenz und hohem Durchsatz von einzelnen GPUs bis hin zu verteilten Clustern zu ermöglichen.

llama.swap Modellwechsler: Schnellstart für OpenAI-kompatible lokale LLMs

Bald jonglieren Sie mit vLLM, llama.cpp und mehr – jeder Stack auf einem eigenen Port. Alles nachgeschaltete System erwartet dennoch eine einzige /v1-Basis-URL; andernfalls sortieren Sie ständig Ports, Profile und Einmal-Skripte neu. llama-swap ist der /v1-Proxy vor diesen Stacks.