エージェントメモリプロバイダー比較 — Honcho、Mem0、Hindsight、それにさらに5つ

永続的なエージェント記憶のための8つのプラグイン対応バックエンド。

目次

モダンなアシスタントは、タブを閉じると、コンテキストウィンドウを超えて何らかの状態が保持されない限り、すべての記憶を失います。エージェントメモリプロバイダーは、セッション間で事実や要約を保持するサービスまたはライブラリであり、フレームワーク自体は軽量に保ちつつメモリをスケーリングできるように、しばしばプラグインとして接続されます。

このガイドでは、Hermes Agentの外部メモリプラグインとして提供される8つのバックエンド(Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory)を比較し、それらがより広範な**AIシステムのスタックにどのように組み込まれるかを説明します。これらのベンダーは、コミュニティまたは公式の統合を通じて、OpenClawや他のエージェントツールでも利用されています。AI Systems Memory hub**では、この記事をCogneeや関連ガイドと並べてリストしています。

Hermes固有のバウンデッドコアメモリ(MEMORY.mdおよびUSER.md)、フリーズ動作、トリガーについては、**Hermes Agent Memory System**を参照してください。Hermesの8つのネイティブメモリプロバイダーが、GitHubスター数、OpenRouterトークンランキング、エコシステム規模の比較など、OpenClawに対する採用優位性をどのように高めているかの背景については、OpenClaw vs Hermes Agent: Stars, Downloads & Usage 2026を参照してください。


Hermes Agentは、永続的でセッション間の知識のために8つの外部メモリプロバイダープラグインをリストしています。一度にアクティブな外部プロバイダーは1つだけです。組み込みのMEMORY.mdとUSER.mdは、それと並行して読み込まれます(置き換えではなく追加です)。

外部依存関係。 Holographicを除くすべての外部プロバイダーは、少なくとも1つの外部サービス呼び出しを必要とします——メモリ抽出のためのLLM、セマンティック検索のための埋め込みモデル、またはPostgreSQLのようなデータベースです。これらの依存関係は、プライバシー、コスト、およびメモリスタックが完全にセルフホストで実行できるかどうかにも直接的な影響を及ぼします。HindsightとByteRoverは最も多くの依存関係バンドルまたは排除しています。Honcho、Mem0、Supermemoryは最も多くの移動部品を必要とします。プロバイダーがOllamaまたはOpenAI互換のエンドポイントをサポートする場合、LLMおよび埋め込み呼び出しをローカルモデルにルーティングし、データを完全にサードパーティサーバーから外すことができます。

ai agent memory system providers

Hermes Agentでのアクティベーション

以下のコマンドライン手順は、Hermes Agent CLIチートシートのテーブルと一致します。

hermes memory setup   # インタラクティブな選択と設定
hermes memory status  # 何がアクティブか確認
hermes memory off     # 外部プロバイダーを無効化

または~/.hermes/config.yamlで手動設定:

memory:
  provider: openviking  # または honcho, mem0, hindsight, holographic, retaindb, byterover, supermemory

プロバイダー比較

プロバイダー ストレージ コスト 外部依存関係 セルフホスト可能 独自機能
Honcho クラウド/セルフホスト 有料/無料 LLM + 埋め込みモデル + PostgreSQL/pgvector + Redis はい — Docker / K3s / Fly.io 弁証法的ユーザーモデリング + セッションスコープのコンテキスト
OpenViking セルフホスト 無料 LLM (VLM) + 埋め込みモデル はい — ローカルサーバー; Ollamaネイティブ初期化ウィザード ファイルシステム階層 + 階層型ローディング
Mem0 クラウド/セルフホスト 有料/無料OSS LLM + 埋め込みモデル + ベクターストア (Qdrant または pgvector) はい — Docker Compose OSS; 完全ローカル可能 サーバーサイドLLM抽出
Hindsight クラウド/ローカル 無料/有料 LLM + バンドルされたPostgreSQL + 組み込みエンベッダー + 組み込みリランカー はい — Dockerまたは埋め込みPython; Ollamaで完全ローカル ナレッジグラフ + reflect シンセシス
Holographic ローカル 無料 なし ネイティブ — インフラ不要 HRR代数 + 信頼スコアリング
RetainDB クラウド $20/月 クラウド管理 (LLM + RetainDBサーバー上の取得) いいえ デルタ圧縮
ByteRover ローカル/クラウド 無料/有料 LLMのみ — 埋め込みモデルなし、DBなし はい — デフォルトでローカルファースト; Ollama対応 ファイルベースのコンテキストツリー; 埋め込みパイプラインなし
Supermemory クラウド 有料 LLM + PostgreSQL/pgvector (エンタープライズCloudflareデプロイ) エンタープライズプランのみ コンテキストフェンシング + セッショングラフインジェスト

詳細な解説

Honcho

最適な用途: マルチエージェントシステム、セッション間のコンテキスト、ユーザーエージェントの整列。

Honchoは既存のメモリと並行して動作します——USER.mdはそのままで、Honchoは追加のコンテキストレイヤーを追加します。会話をメッセージを交換するピアとしてモデル化します——1人のユーザーピアと、Hermesプロフィールごとに1人のAIピアが、ワークスペースを共有します。

外部依存関係: Honchoは、セッションの要約、ユーザー表現の派生、および弁証法的推論のためのLLM、観察事項全体のセマンティック検索のための埋め込みモデル、ベクトルストレージ用のpgvector拡張付きPostgreSQL、およびキャッシュ用のRedisを必要とします。api.honcho.devのマネージドクラウドはこれらすべてを処理します。セルフホストデプロイメント(Docker、K3s、またはFly.io)の場合、独自の資格情報を提供する必要があります。LLMスロットは、OllamaやvLLMを含む任意のOpenAI互換エンドポイントを受け付けますので、推論をオンプレミスに保持できます。埋め込みスロットはopenai/text-embedding-3-smallがデフォルトですが、LLM_EMBEDDING_API_KEYLLM_EMBEDDING_BASE_URL経由で構成可能なプロバイダーをサポートしています——BGEモデル搭載のvLLMなどのローカルオプションを含む、任意のOpenAI互換埋め込みサーバーが機能します。

ツール: honcho_profile (ピアカードの読み取り/更新)、honcho_search (セマンティック検索)、honcho_context (セッションコンテキスト——要約、表現、カード、メッセージ)、honcho_reasoning (LLM合成)、honcho_conclude (結論の作成/削除)。

主要な設定パラメータ:

  • contextCadence (デフォルト 1): ベースレイヤーリフレッシュ間の最小ターン数
  • dialecticCadence (デフォルト 2): peer.chat() LLM呼び出し間の最小ターン数 (1-5を推奨)
  • dialecticDepth (デフォルト 1): 1回の呼び出しあたりの.chat()パス数 (1-3にクランプ)
  • recallMode (デフォルト ‘hybrid’): hybrid (自動+ツール)、context (インジェクションのみ)、tools (ツールのみの)
  • writeFrequency (デフォルト ‘async’): フラッシュタイミング: asyncturnsession、または整数N
  • observationMode (デフォルト ‘directional’): directional (すべてオン) または unified (共有プール)

アーキテクチャ: 2層のコンテキストインジェクション——ベースレイヤー (セッション要約 + 表現 + ピアカード) + 弁証法的補足 (LLM推論)。コールドスタートとウォームプロンプトを自動的に選択します。

マルチピアマッピング: ワークスペースはプロフィール全体の共有環境です。ユーザーピア (peerName) はグローバルな人間アイデンティティです。AIピア (aiPeer) はHermesプロフィールごとに1つ (hermes デフォルト、他は hermes.<profile>)。

セットアップ:

hermes memory setup  # "honcho"を選択
# またはレガシー: hermes honcho setup

設定: $HERMES_HOME/honcho.json (プロフィールローカル) または ~/.honcho/config.json (グローバル)。

プロフィール管理:

hermes profile create coder --clone  # 共有ワークスペースを持つhermes.coderを作成
hermes honcho sync                   # 既存のプロフィールのAIピアをバックフィル

OpenViking

最適な用途: 構造化されたブラウジングを備えたセルフホスト型知識管理。

OpenVikingは階層型ローディングを備えたファイルシステム階層を提供します。無料であり、セルフホストであり、メモリストレージに対する完全な制御を提供します。

外部依存関係: OpenVikingは、セマンティック処理とメモリ抽出のためのVLM (ビジョン言語モデル)と、ベクトル検索のための埋め込みモデルを必要とします——両方とも必須です。サポートされるVLMプロバイダーには、OpenAI、Anthropic、DeepSeek、Gemini、Moonshot、vLLM (ローカルデプロイ用) が含まれます。埋め込み用には、OpenAI、Volcengine (Doubao)、Jina、Voyage、およびOllama経由で任意のローカルで提供される埋め込みモデルがサポートされています。openviking-server init インタラクティブウィザードは、利用可能なRAMを検出し、適切なOllamaモデル (埋め込みにQwen3-Embedding 8B、VLMにGemma 4 27Bなど) を推奨し、完全にローカルでAPIキー不要のセットアップのためにすべてを自動的に構成できます。外部データベースは必要ありません。OpenVikingはメモリをファイルシステムに保存します。

ツール: viking_searchviking_read (階層型)、viking_browseviking_rememberviking_add_resource

セットアップ:

pip install openviking
openviking-server init   # インタラクティブウィザード (ローカルセットアップ用にOllamaモデルを推奨)
openviking-server
hermes memory setup  # "openviking"を選択
echo "OPENVIKING_ENDPOINT=http://localhost:1933" >> ~/.hermes/.env

Mem0

最適な用途: 自動抽出を備えたハンドズフリーのメモリ管理。

Mem0は、add操作ごとにLLM呼び出しを介してサーバーサイドでメモリ抽出を処理します——会話を読み取り、離散的な事実を抽出し、重複を削除し、保存します。マネージドクラウドAPIはすべてのインフラストラクチャを処理します。オープンソースライブラリとセルフホストサーバーは、完全な制御を提供します。

外部依存関係: Mem0は、メモリ抽出のためのLLM (デフォルト: OpenAI gpt-4.1-nano; Ollama、vLLM、LM Studioを含むローカルモデルを20のプロバイダーがサポート) と、取得のための埋め込みモデル (デフォルト: OpenAI text-embedding-3-small; OllamaおよびHuggingFaceを含むローカルモデルを10のプロバイダーがサポート) を必要とします。ストレージはライブラリモードでは/tmp/qdrantのQdrant、セルフホストサーバーモードではpgvector付きPostgreSQLを使用します——両方ともローカルで実行できます。完全ローカルでクラウド不要のMem0スタックは可能です: LLMにOllama、埋め込みにOllama、ローカルQdrantインスタンスを使用し、すべてMemory.from_configで構成します。

ツール: mem0_profilemem0_searchmem0_conclude

セットアップ:

pip install mem0ai
hermes memory setup  # "mem0"を選択
echo "MEM0_API_KEY=your-key" >> ~/.hermes/.env

設定: $HERMES_HOME/mem0.json (user_id: hermes-useragent_id: hermes)。

Hindsight

最適な用途: エンティティ関係を備えたナレッジグラフベースの想起。

Hindsightはあなたのメモリのナレッジグラフを構築し、エンティティと関係を抽出します。独自のreflectツールはクロスメモリシンセシスを実行します——複数のメモリを組み合わせて新しい洞察を生み出します。想起は4つの取得戦略 (セマンティック、キーワード/BM25、グラフトラバーサル、Temporal) を並行して実行し、その後、逆位融合を使用して結果をマージし再順序付けします。

外部依存関係: Hindsightは、retain呼び出しでの事実とエンティティの抽出、およびreflect呼び出しでのシンセシスのためのLLMを必要とします (デフォルト: OpenAI; サポートされるプロバイダーにはAnthropic、Gemini、Groq、Ollama、LM Studio、および任意のOpenAI互換エンドポイントが含まれます)。埋め込みモデルとクロスエンコーダリランキングモデルはHindsight自体にバンドルされています——それらはhindsight-allパッケージ内でローカルに実行され、外部APIは必要ありません。PostgreSQLも、管理されたpg0データディレクトリを介して埋め込みPythonインストールとバンドルされています。代わりに、Hindsightを外部PostgreSQLインスタンスに接続することもできます。完全ローカルでクラウド不要のセットアップの場合、HINDSIGHT_API_LLM_PROVIDER=ollamaを設定し、ローカルOllamaモデルを指します——retainrecallは完全に機能します; reflectはツール呼び出し機能を持つモデル (例: qwen3:8b) が必要です。

ツール: hindsight_retainhindsight_recallhindsight_reflect (独自のクロスメモリシンセシス)。

セットアップ:

hermes memory setup  # "hindsight"を選択
echo "HINDSIGHT_API_KEY=your-key" >> ~/.hermes/.env

hindsight-client (クラウド) または hindsight-all (ローカル) が自動インストールされます。>= 0.4.22が必要です。

設定: $HERMES_HOME/hindsight/config.json

  • mode: cloud または local
  • recall_budget: low / mid / high
  • memory_mode: hybrid / context / tools
  • auto_retain / auto_recall: true (デフォルト)

ローカルUI: hindsight-embed -p hermes ui start

Holographic

最適な用途: ローカルストレージのみを備えたプライバシー重視のセットアップ。

HolographicはメモリエンコーディングにHRR (Holographic Reduced Representation) 代数を使用し、メモリ信頼性のために信頼スコアリングを備えています。クラウド依存はありません——すべてはあなたのハードウェアでローカルに実行されます。

外部依存関係: なし。HolographicはLLM、埋め込みモデル、データベース、ネットワーク接続を必要としません。メモリエンコーディングは、プロセス内で実行されるHRR代数によって完全に処理されます。これは、8つのプロバイダーの中で唯一、ゼロ外部呼び出しで動作するものです。トレードオフは、取得品質が埋め込みベースのセマンティック検索よりも低く、Hindsightのreflectのようなクロスメモリシンセシスがないことです。プライバシーとゼロ依存関係動作が譲歩できないユーザーにとって、Holographicはその条件を無条件に満たす唯一のオプションです。

ツール: HRR代数によるメモリ操作用2つのツール。

セットアップ:

hermes memory setup  # "holographic"を選択

RetainDB

最適な用途: デルタ圧縮を備えた高頻度アップデート。

RetainDBは、メモリアップデートを効率的に保存するためのデルタ圧縮と、関連コンテキストを表面化するためのハイブリッド取得 (ベクトル + BM25 + リランキング) を使用します。$20/月のコストでクラウドベースであり、すべてのメモリ処理はサーバーサイドで処理されます。

外部依存関係: RetainDBのLLM呼び出し、埋め込みパイプライン、リランキングはすべてRetainDBの独自のクラウドインフラストラクチャで実行されます——あなたはRETAINDB_KEYのみを提供します。メモリ抽出はサーバーサイドでClaude Sonnetを使用します。セルフホスティングオプションやローカルモードはありません。すべての会話データは処理とストレージのためにRetainDBサーバーに送信されます。データ主権やオフライン動作があなたのユースケースにとって重要であれば、このプロバイダーは適していません。

ツール: retaindb_profile (ユーザープロフィール)、retaindb_search (セマンティック検索)、retaindb_context (タスク関連コンテキスト)、retaindb_remember (型と重要度で保存)、retaindb_forget (メモリ削除)。

セットアップ:

hermes memory setup  # "retaindb"を選択

ByteRover

最適な用途: 人間が読みやすく監査可能なストレージを備えたローカルファーストメモリ。

ByteRoverは、埋め込みベクトルやデータベースではなく、ドメイン、トピック、サブトピックファイルの階層である構造化されたマークダウンコンテキストツリーとしてメモリを保存します。LLMはソースコンテンツを読み取り、推論し、抽出された知識を階層内の適切な場所に配置します。取得はMiniSearch完全テキスト検索で、ベクトルデータベースを必要とせずにLLMパワード検索への階層型フォールバックを使用します。

外部依存関係: ByteRoverは、メモリキュレーションと検索のためのLLMを必要とします (Anthropic、OpenAI、Google、Ollama、およびopenai-compatibleプロバイダースロットを介した任意のOpenAI互換エンドポイントを含む18のプロバイダーがサポートされています)。埋め込みモデルやデータベースは必要ありません——コンテキストツリーはプレーンマークダウンファイルのローカルディレクトリです。クラウド同期はオプションであり、チームコラボレーションのみに使用されます——すべてデフォルトで完全にオフラインで機能します。完全に自己完結型のローカルセットアップの場合、プロバイダーとしてOllamaを接続し (brv providers connect openai-compatible --base-url http://localhost:11434/v1)、データはマシンから外部に出ません。

ツール: メモリ操作用3つのツール。

セットアップ:

hermes memory setup  # "byterover"を選択

Supermemory

最適な用途: コンテキストフェンシングとセッショングラフインジェストを備えたエンタープライズワークフロー。

Supermemoryは、コンテキストフェンシング (コンテキストごとにメモリを隔離) とセッショングラフインジェスト (会話履歴全体をインポート) を提供します。自動的にメモリを抽出し、ユーザープロフィールを構築し、セマンティック検索とキーワード検索を組み合わせたハイブリッド取得を実行します。マネージドクラウドAPIが主要なデプロイターゲットです。

外部依存関係: Supermemoryのクラウドサービスは、すべてのLLM推論と埋め込みをサーバーサイドで処理します——あなたはSupermemory APIキーのみを提供します。セルフホスティングは、エンタープライズプランのアドオンとしてのみ利用可能であり、Cloudflare Workersにデプロイされます。PostgreSQL (pgvector拡張付き、ベクトルストレージ用) とOpenAI APIキー (必須、AnthropicとGeminiはオプションの追加) を提供する必要があります。Dockerベースまたはローカルのセルフホスティングパスはありません——アーキテクチャはCloudflare Workersエッジコンピューティングと密結合しています。エンタープライズ契約なしで完全なデータ主権を必要とするユーザーにとって、このプロバイダーは適切な選択ではありません。

ツール: メモリ操作用4つのツール。

セットアップ:

hermes memory setup  # "supermemory"を選択

選択方法

  • マルチエージェントサポートが必要ですか? Honcho
  • セルフホストで無料が欲しいですか? OpenViking または Holographic
  • ゼロ設定が欲しいですか? Mem0
  • ナレッジグラフが欲しいですか? Hindsight
  • デルタ圧縮が欲しいですか? RetainDB
  • 帯域幅効率性が欲しいですか? ByteRover
  • エンタープライズ機能が欲しいですか? Supermemory
  • プライバシー (ローカルのみ) が欲しいですか? Holographic
  • 外部サービスゼロで完全ローカルが欲しいですか? Holographic (依存関係なし) または Ollamaを使用するHindsight/Mem0/ByteRover
  • 埋め込みパイプラインなしで人間が読みやすく監査可能なメモリが欲しいですか? ByteRover

プロフィール別のプロバイダー設定と実世界のワークフローパターンについては、Hermes Agent production setupを参照してください。


関連ガイド

購読する

システム、インフラ、AIエンジニアリングの新記事をお届けします。