AIシステムメモリ — 永続的な知識とエージェントメモリ
単一のチャットスレッドを超えた持続的な知識。
このセクションでは、AI システムにおける永続的な知識とメモリに関するガイドをまとめています。アシスタントが、すべてのトークンを1つのプロンプトに押し込むことなく、セッション間で事実、設定、抽出された文脈をどのように保持するかについて説明します。ここで言う「メモリ」とは、GPU の RAM やモデルの重みを指すものではなく、意図的な保持(ユーザーの事実、要約、プラグインによるストアなど)を意味します。
これは、より広範な AI システム クラスタ(OpenClaw、Hermes、オーケストレーションなど)を補完し、取得メカニクスに関する RAG や、モデルの実行に関する LLM ホスティング と並立しています。
メモリは、AI アシスタントのアーキテクチャ で説明されているより広範なアシスタントスタックの一部に位置し、ルーティング、ツール、可観測性と併存します。
アシスタントのためのメモリ設計
短期記憶、構造化メモリ、検索メモリに関するクロスフレームワークガイド — 統合ポリシー、ベクトルのトレードオフ、および OpenAI、LangGraph、Hermes、OpenClaw からのパターン。
- 実際に役立つ AI アシスタントのメモリシステム — ワーキングメモリ、構造化された状態、検索レイヤ、およびメモリが有効に働く場合と逆効果になる場合
エージェントメモリプロバイダ
Hermes Agent や OpenClaw などのフレームワークが公開するドロップインバックエンド — Honcho、OpenViking、Mem0、Hindsight など — 異なる LLM、埋め込み、データベースのトレードオフに対応。
- エージェントメモリプロバイダの比較 — 完全な表、依存関係の注記、および Hermes の
memory setupフロー
Hermes 専用のバウンデッドコアメモリ(MEMORY.md / USER.md)については、Hermes エージェントメモリシステム を参照してください。
ナレッジグラフと Cognee
検索対応アシスタントのために、機関やプロジェクトの知識をグラフに抽出する。
- Cognee のセルフホスティング — Ollama 上の LLM の選択 — ローカルモデルを用いた Cognee のハンズオンクイックスタート
- Cognee に適した LLM の選択 — ローカル Ollama セットアップ — グラフの品質とハードウェアに対するモデル比較
Cognee などのグラフビルダは、通常、すでに編集されている Markdown バルト、ウィキ、またはエクスポートデータをインポートします。重要性、命名、および「なぜそれが重要だったのか」は、チャンクが埋め込み処理に到達する前にほぼ決定されています。粗悪な上流コーパスは、曖昧さをアシスタントに学習させてしまいます。一方、表現を通じた規律あるキャプチャワークフローは、その被害を制限します。その人間中心のフレームワーク(および取得優先の RAG との違い)については、エンジニアのためのセカンダリーブレンの説明 を参照してください。