AI - Page 2 - Rost Glukhov | 個人サイトとテクニカルブログ

PKM、RAG、ウィキ、AIメモリシステム、そして実用的なAI支援ワークフローは、あたかも同じ問題を解決するかのように議論されることがよくあります。しかし、そうではありません。これらはすべて知識を扱いますが、異なるレイヤーで動作しています：

ほとんどのLLM「構造化出力」チュートリアルは、本気度にかけるものです。それらは、JSONを丁寧な口調でリクエストし、モデルが適切に動作することを祈る方法を教えます。それでは検証ではありません。それは単に括弧で囲まれた楽観主義にすぎません。

このページは、エージェント型LLM推論チューニングの実用的なリファレンス（temperature、top_p、top_k、ペナルティ、およびマルチステップやツール多用なワークフローにおけるそれらの相互作用）です。

より広範なLLMパフォーマンスエンジニアリングハブと併せて参照し、明確なLLMホスティングとサービングの概要と組み合わせることで、モデルがリソース不足に陥った際にはスループットとスケジューリングが依然として支配的ですが、不安定なサンプリングはGPUが処理を終える前にリトライと出力トークンを消費してしまうことがわかります。

このページでは以下をまとめます：

スマートフォンからテキストでヘルメスエージェントとチャットすることはすでに可能でしょう。今、あなたはエージェントと直接会話し、音声で返信を受け取りたいと考えています。これは通常、正しい選択です。特にHermesを永続的な自己ホスト型アシスタントとして使用している場合には顕著です。小さな画面で長いプロンプトをタイプするのは、時間がかかり、誤りも生じやすいものです。

Hermes AgentにはKanbanスタイルのボードとHermes Gatewayが標準で搭載されていますが、一度に多数のタスクがディスパッチされると、セルフホスト型のLLMが過負荷状態に陥る可能性があります。

Hermesエージェントスキル作成 — SKILL.mdの構造とベストプラクティス

Hermes Agentは、スキルを反復可能なワークフローを教えるデフォルトの方法として扱います。公式ドキュメントでは、それらはオープンな agentskills.io 仕様に準拠したオンデマンドのナレッジドキュメントとして説明されており、**プログレッシブディスクロージャー（段階的開示）**を通じて読み込まれます。これにより、モデルはまず小さなインデックスを見て、タスクが実際に必要とする場合にのみ完全な指示を取得します。

Hermes Agent CLI チートシート — コマンド、フラグ、およびスラッシュショートカット

Nous Research の Hermes Agent は、モデルに依存せず、ローカルまたは VPS で実行できるツール対応アシスタントです。

大多数のAIエージェントスタックは、セキュリティをデモ後の修正事項として扱っています。 NemoClawは対極の前提から始まり、隔離、ポリシー、ルーティングを初期設定（Day-Zero defaults）として採用しています。

このセクションでは、AI システムにおける永続的な知識とメモリに関するガイドをまとめています。アシスタントが、すべてのトークンを1つのプロンプトに押し込むことなく、セッション間で事実、設定、抽出された文脈をどのように保持するかについて説明します。ここで言う「メモリ」とは、GPU の RAM やモデルの重みを指すものではなく、意図的な保持（ユーザーの事実、要約、プラグインによるストアなど）を意味します。

エージェントメモリプロバイダー比較 — Honcho、Mem0、Hindsight、それにさらに5つ

モダンなアシスタントは、タブを閉じると、コンテキストウィンドウを超えて何らかの状態が保持されない限り、すべての記憶を失います。エージェントメモリプロバイダーは、セッション間で事実や要約を保持するサービスまたはライブラリであり、フレームワーク自体は軽量に保ちつつメモリをスケーリングできるように、しばしばプラグインとして接続されます。

このガイドでは、Hermes Agentの外部メモリプラグインとして提供される8つのバックエンド（Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory）を比較し、それらがより広範な**AIシステムのスタックにどのように組み込まれるかを説明します。これらのベンダーは、コミュニティまたは公式の統合を通じて、OpenClawや他のエージェントツールでも利用されています。AI Systems Memory hub**では、この記事をCogneeや関連ガイドと並べてリストしています。

Hermes固有のバウンデッドコアメモリ（MEMORY.mdおよびUSER.md）、フリーズ動作、トリガーについては、**Hermes Agent Memory System**を参照してください。Hermesの8つのネイティブメモリプロバイダーが、GitHubスター数、OpenRouterトークンランキング、エコシステム規模の比較など、OpenClawに対する採用優位性をどのように高めているかの背景については、OpenClaw vs Hermes Agent: Stars, Downloads & Usage 2026を参照してください。

Hermes エージェントメモリシステム：永続的AIメモリが実際にどのように機能するか

あなたはご存知の通り、AIエージェントとのチャットを開き、プロジェクトを説明し、好みを共有し、作業を進めて、タブを閉じます。翌週に戻ってみると、まるで他人と話をしているかのようです。すべての文脈が消え、すべての好みが忘れられ、プロジェクトは最初から再説明する必要があります。

OpenClawは製品として失敗したわけではありません。単に「燃料」を失っただけです。

Llama-Server ルーターモード - リスタートなしでの動的モデル切り替え

長らく llama.cpp には顕著な制限がありました。1つのプロセスで1つのモデルしか提供できず、モデルの切り替えには再起動が必要だったのです。

開発者向け Claude Skills と SKILL.md：VS Code、JetBrains、Cursor

多くのチームは、Claude Skills を 2 つの方法のいずれかで誤用しています。SKILL.md を何でもありの dumping ground（ごみ箱）にするか、巨大なコピペプロンプトから卒業できないかのどちらかです。

公式にはHermes Agentとして文書化されているHermes AIアシスタントは、単なるチャットラッパーとして位置づけられてはいません。

OpenClawには2つの拡張ストーリーがあり、それらは混同されやすいものです。

プラグインはランタイムを拡張します。スキルはエージェントの振る舞いを拡張します。

AI

PKM、RAG、Wiki、メモリシステムを明確に解説

Pythonで堅牢なLLM構造化出力の検証

QwenおよびGemmaにおけるエージェンティックLLM推論パラメータの参照

スマートフォンからのヘルメス音声コントロール

セルフホスト型LLMワークフローにおけるHermesエージェントの看板

Hermesエージェントスキル作成 — SKILL.mdの構造とベストプラクティス

Hermes Agent CLI チートシート — コマンド、フラグ、およびスラッシュショートカット

2026年版の安全なOpenClaw運用に関するNemoClaw実用的ガイド

AIシステムメモリ — 永続的な知識とエージェントメモリ

エージェントメモリプロバイダー比較 — Honcho、Mem0、Hindsight、それにさらに5つ

Hermes エージェントメモリシステム：永続的AIメモリが実際にどのように機能するか

OpenClawの興亡 — 崩壊のタイムラインと真の背景

Llama-Server ルーターモード - リスタートなしでの動的モデル切り替え

開発者向け Claude Skills と SKILL.md：VS Code、JetBrains、Cursor

本番環境向けのHermes AIアシスタントスキル

OpenClawスキルエコシステムと実務向けの推奨スキル