Память систем ИИ — устойчивые знания и память агентов
Постоянное хранение знаний за пределами одной цепочки диалога.
Этот раздел содержит руководства по постоянному хранению знаний и памяти для ИИ-систем — как ассистенты сохраняют факты, предпочтения и сжатый контекст между сеансами, не перегружая один промпт всеми токенами. Здесь под памятью подразумевается осознанное удержание данных (факты о пользователе, резюме, хранилища, поддерживаемые плагинами), а не оперативная память GPU или веса моделей.
Он дополняет более широкий кластер AI Systems — OpenClaw, Hermes, оркестрацию — и находится рядом с RAG для механизмов извлечения и LLM Hosting для запуска моделей.
Память является частью более широкого стека ассистентов, описанного в AI Assistant Architecture наряду с маршрутизацией, инструментарием и наблюдаемостью.
Проектирование памяти для ассистентов
Руководство по краткосрочной, структурированной и памяти извлечения данных, независимое от фреймворков: политика консолидации, компромиссы векторных баз данных и паттерны от OpenAI, LangGraph, Hermes и OpenClaw.
- Системы памяти в ИИ-ассистентах, которые действительно помогают — рабочая память, структурированное состояние, уровни извлечения и случаи, когда память помогает, а когда мешает
Поставщики памяти для агентов
Бэкенды, которые можно легко интегрировать и которые предоставляют фреймворки, такие как Hermes Agent и OpenClaw — Honcho, OpenViking, Mem0, Hindsight и другие — с различными компромиссами в использовании LLM, эмбеддингов и баз данных.
- Сравнение поставщиков памяти для агентов — полная таблица, заметки о зависимостях и потоки
memory setupдля Hermes
Для ограниченной основной памяти только для Hermes (MEMORY.md / USER.md) см. Система памяти агента Hermes.
Графы знаний и Cognee
Институциональные и проектные знания, извлеченные в графы для ассистентов с поддержкой извлечения данных.
- Самохостинг Cognee — Выбор LLM на Ollama — практическое быстрое начало работы с Cognee с использованием локальных моделей
- Выбор подходящего LLM для Cognee — Локальная настройка Ollama — сравнение моделей для качества графа и аппаратного обеспечения
Инструменты построения графов, такие как Cognee, обычно импортируют хранилища Markdown, вики или экспорты, которые люди уже отредактировали — значимость, названия и «почему это было важно» в значительной степени определяются до того, как фрагменты попадают в эмбеддинги. Небрежный исходный корпус возвращает неоднозначность обратно в ассистента; дисциплинированные рабочие процессы захвата через выражение минимизируют этот ущерб. Для такого центрированного на человека подхода, включая то, как он отличается от RAG, ориентированного на извлечение, см. Второй мозг для инженеров.