AIシステムメモリ — 永続的な知識とエージェントメモリ

単一のチャットスレッドを超えた持続的な知識。

目次

このセクションでは、AI システムにおける永続的な知識とメモリに関するガイドをまとめています。アシスタントが、すべてのトークンを1つのプロンプトに押し込むことなく、セッション間で事実、設定、抽出された文脈をどのように保持するかについて説明します。ここで言う「メモリ」とは、GPU の RAM やモデルの重みを指すものではなく、意図的な保持(ユーザーの事実、要約、プラグインによるストアなど)を意味します。

これは、より広範な AI システム クラスタ(OpenClaw、Hermes、オーケストレーションなど)を補完し、取得メカニクスに関する RAG や、モデルの実行に関する LLM ホスティング と並立しています。

メモリは、AI アシスタントのアーキテクチャ で説明されているより広範なアシスタントスタックの一部に位置し、ルーティング、ツール、可観測性と併存します。


アシスタントのためのメモリ設計

短期記憶、構造化メモリ、検索メモリに関するクロスフレームワークガイド — 統合ポリシー、ベクトルのトレードオフ、および OpenAI、LangGraph、Hermes、OpenClaw からのパターン。


エージェントメモリプロバイダ

Hermes Agent や OpenClaw などのフレームワークが公開するドロップインバックエンド — Honcho、OpenViking、Mem0、Hindsight など — 異なる LLM、埋め込み、データベースのトレードオフに対応。

Hermes 専用のバウンデッドコアメモリ(MEMORY.md / USER.md)については、Hermes エージェントメモリシステム を参照してください。


ナレッジグラフと Cognee

検索対応アシスタントのために、機関やプロジェクトの知識をグラフに抽出する。

Cognee などのグラフビルダは、通常、すでに編集されている Markdown バルト、ウィキ、またはエクスポートデータをインポートします。重要性、命名、および「なぜそれが重要だったのか」は、チャンクが埋め込み処理に到達する前にほぼ決定されています。粗悪な上流コーパスは、曖昧さをアシスタントに学習させてしまいます。一方、表現を通じた規律あるキャプチャワークフローは、その被害を制限します。その人間中心のフレームワーク(および取得優先の RAG との違い)については、エンジニアのためのセカンダリーブレンの説明 を参照してください。


スタックのコンテキスト

購読する

システム、インフラ、AIエンジニアリングの新記事をお届けします。