Hermes AI アシスタント - インストール、設定、ワークフロー、およびトラブルシューティング

開発者向けHermesエージェントのインストールとクイックスタート

目次

Hermes Agent は、ローカルマシンや低コストのVPS上で稼働する、モデル非依存の自己ホスト型AIアシスタントです。ターミナルおよびメッセージングインターフェースを通じて動作し、反復的なタスクを再利用可能なスキルに変換することで、時間とともに性能を向上させます。

その機能性は、ローカルLLM、検索、メモリ、ルーティング、および観測性を統合した cohesive なローカルインフラストラクチャを構築する別の自己ホスト型アシスタントスタックである OpenClaw と非常に類似しています。多くの開発者は、2026年4月にAnthropicがOpenClawのClaudeサブスクリプションアクセスをブロックした後にHermesを見つけました。Hermesが、プロバイダーへの依存なしで永続的な自己ホスト型自動化を望むユーザーにとって自然な選択となった理由については、 OpenClawの台頭と衰退のタイムライン を参照してください。

Hermesを取り巻く自己ホスト型アシスタント、検索、およびローカルインフラストラクチャのより広範な概要が必要な場合は、 AIシステムの概要 で、Hermesが解決しようとしている問題とこれらのトピックを結びつけることができます。具体的な採用データ(GitHubスター数、OpenRouterの每日トークンボリューム、PyPIダウンロード数、CVE履歴、Redditコミュニティのセンチメントなど)については、 OpenClaw vs Hermes Agent: スター数、ダウンロード数 & 2026年の利用状況 で、Hermesが19の代替ツールと比較してどのようであるかを、測定可能なすべての指標に基づいて追跡できます。

デプロイメントのトレードオフとランタイムの選択については、 2026年のLLMホスティング:ローカル、自己ホスト型&クラウドインフラストラクチャの比較 がホスティングのマップを提供し、 2026年のLLMパフォーマンス:ベンチマーク、ボトルネック&最適化 がHermesの実行後のスループットとレイテンシの側面をカバーしています。Ollamaなどのローカルランタイム上の QwenGemma をHermesにルーチン的に接続する場合、 QwenとGemmaのためのエージェント型LLM推論パラメータ で、マルチステップツール使用のための温度とペナルティプリセットを統合してください。シェルのコマンド(hermes gateway, hermes memory, hermes doctor, スラッシュショートカットなど)のコンパクトなマップが必要な場合は、 Hermes Agent CLIチートシート を使用してください。メインのエントリポイントがモバイルでのメッセージングである場合は、 Hermesの音声コントロールをスマートフォンから で、ボイススタックとプラットフォーム固有のセットアップを使用してください。

peronal-ai-assistant on laptop

私の偏りのある意見:Hermesは、時折開くタブとしてではなく、インフラストラクチャとして扱うときに最も興味深いです。サービスとして実行され、安定したホームディレクトリを持つようになると、プロンプトは「チャット」のように見えず、「運用(ops)」のように見えてきます。

Hermes Agentとは何か、そしてなぜそれが重要なのか

Hermes Agentは、Nous Researchによって構築されたオープンソースのAIエージェントです。永続的に稼働し、ツール(ターミナル、ファイル、Webなど)を使用し、スキルおよびメモリシステムを通じて自身の動作を時間とともに改善するように設計されています。

このガイドの他のすべてを形成する2つの設計選択を説明する価値があります。

第一に、Hermesは単一のモデルプロバイダーにロックされません。公式のセットアップフローは複数のプロバイダーおよび任意のOpenAI互換エンドポイントをサポートし、切り替えはコードの編集ではなく hermes model コマンドによって行われます。

第二に、Hermesは「会話」と「実行」の間で明確な線を引きます。エージェントは一日中話すことができますが、行動が必要な場合は、明示的なツールと構成可能な実行バックエンドを通じてそれを行います。これが、安全性、再現性、およびトラブルシューティングが存在する場所です。

コストとライセンスは、爽快なほど退屈です。Hermes Agent自体は、MITライセンスの下でのフリーソフトウェアです。ホスト型モデルを使用する場合、継続的なコストはプロバイダーが請求する金額になります。ローカルモデルを実行する場合、API料金を完全に回避できます。

Hermesのセットアップが外部ツールレイヤーを通じてClaudeを使用している場合、 このAnthropicのサブスクリプション変更 は、APIベースの課金がいまや期待される経路である理由についての有用な参照です。

Hermes Agentのインストール

Hermesには、Linux、macOS、およびWSL2のための高速なインストールパスがあります。公式ドキュメントは意図的にシンプルに保たれています。

LinuxでのHermesのインストール

sudo apt-get update
sudo apt-get upgrade
sudo apt-get curl git
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

インストール後、シェルをリロードし、CLIを開始します。

source ~/.bashrc   # または source ~/.zshrc
hermes

インストーラーは単なる薄いラッパーではありません。インストールガイドによると、依存関係、リポジトリ、仮想環境、および hermes コマンドを設定し、最初にチャット準備状態に達するまでサポートします。

WindowsおよびAndroidに関する注意点

ネイティブWindowsはサポートされていません。ドキュメントではWSL2を推奨し、その中でHermesを実行することを推奨しています。

Androidの場合、HermesはTermuxのインストールパスをサポートしています。Termuxを検出し、それに応じて依存関係および環境設定を適応させるように設計されています。

クイックスタート

最も速い最初の実行は文字通り hermes を実行するだけですが、意味のあるクイックスタートには、使用するモデルプロバイダーと有効にするツールという2つの追加の決定が必要です。

プロバイダーとモデルの選択

Hermesは3つの補完的なエントリポイントを公開します:

  • hermes model でプロバイダーとデフォルトモデルを選択
  • hermes tools でツールセットの有効化または無効化
  • hermes setup で主要な構成領域全体にわたって対話式ウィザードを実行

最小限のフローは以下のようになります:

hermes model
hermes tools
hermes

実際にサポートされているものに関して、公式のクイックスタートは範囲の広いプロバイダーをリストし、HermesがOpenAI互換APIと連携することを呼び出しています。これは、ホスト型サービスと自己ホスト型エンドポイントの両方を含むため、重要です。

ツールの実行を早期に証明する

Hermes围绕习惯构建之前、環境でツール使用が機能するかを確認する価値があります。クイックスタートでは、最初の機能としてターミナルの使用を明示的に提案しています。

実際には、小さな「スモークテスト」プロンプトは2つの役割を果たします:ターミナルツールをチェックし、パーミッションプロンプトを検証します。

プロンプトの例:

ディスク使用量と5つの最大のディレクトリを表示してください。

Hermesがターミナルツールを実行できない場合は、トラブルシューティングに進んでください。ターミナルバックエンドの誤設定は最も一般的な原因の一つであり、設定を見ると修正方法が通常明らかになります。

拡張する構成

Hermesは、ステートをどこに保存し、構成をどのように解決するかを理解する人を褒めます。これもまた、多くの「昨日は動いていた」問題が生まれる場所です。

構成とステートの保存場所

Hermesは設定とステートを ~/.hermes の下に保存します。公式の構成ガイドは、設定のための config.yaml、秘密情報のための .env、OAuth認証情報のための auth.json、アイデンティティのための SOUL.md、およびメモリ、スキル、cron、セッション、ログのためのフォルダを含むレイアウトを文書化しています。

これは2つの理由で重要です。

  • デバッグは機械的になります。どこを見ればよいかが正確に分かるため。
  • バックアップは簡単になります。ディレクトリ1つが、関心のあるエージェントステートの大部分をキャプチャーするため。

構成の優先順位と config.yaml から秘密情報を除外する

Hermesは優先順位順で構成を解決します。最上部にはCLIの上書き、次に config.yaml、次に .env、最下部にはビルトインのデフォルトがあります。

良い詳細は、 hermes config set が値を正しいファイルにルーティングすることです:APIキーは .env へ、非秘密の設定は config.yaml へ。

hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx

Hermesはまた、 config.yaml 内の ${VAR_NAME} 構文による環境変数の置換をサポートします。これは、特定の値を環境内に保持しつつ、構造化された構成内で参照したい場合に便利です。

サンドボックスと実行バックエンド

Hermesは、シェルコマンドが実際にどこで実行されるかを定義する複数のターミナルバックエンドをサポートします。構成ガイドは、local、docker、ssh、modal、daytona、および singularity をリストしています。

意見的ですが、布教的ではない考え方は以下の通りです:

  • local は最も速くシンプルですが、隔離されていません
  • docker は実用的な安全性と再現性のレイヤーです
  • ssh は、チャットデバイスと計算ボックスを分離するクリーンな方法です
  • modal と daytona は「サーバーレスだが十分に永続的」なワークフローに適合します
  • singularity はHPCフレンドリーなオプションです

最小限のDockerバックエンドの例:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
  docker_volumes:
    - "/home/user/projects:/workspace/projects"
  docker_forward_env:
    - "GITHUB_TOKEN"

ドキュメントでは、Dockerバックエンドのセキュリティ強化(機能のドロップや特権エスカレーションの無効化など)についても説明しています。

スキル、メモリ、およびプロファイル

Hermesには、価値を複利で増やす2つの関連するメカニズムがあります。

スキルは手続き型メモリです。Hermesは自身のスキルを作成、更新、削除でき、複雑なタスクの完了後にアプローチをスキルとして保存するように提案できます。

ビルトインメモリは ~/.hermes の下の MEMORY.md および USER.md などのファイルとして保存され、Hermesはより深い想起のために外部メモリプロバイダーも使用できます。メモリのドキュメントは複数のプロバイダープラグインをリストし、メモリプロバイダーガイドは対話式セットアップフローを文書化しています。メモリアーキテクチャがどのように機能するか(フローズンスナップショット、文字数制限、8つの外部プロバイダー、および有界メモリ背後の哲学)の完全な技術的分解については、 Hermes Agentメモリシステム:永続的なAIメモリが実際にどのように機能するか を参照してください。

同じマシン上で複数の独立したエージェントが必要な場合、Hermesプロファイルは隔離を提供します。各プロファイルは、独自の構成、秘密情報、メモリ、セッション、スキル、cronジョブ、およびゲートウェイステートを持つ独自のディレクトリを取得します。

役割別(エンジニア、研究者、オペレーター、およびエグゼクティブワークフロー)に、本番環境でどのスキルがよく機能するかを深く見るには、 本番環境セットアップのためのHermes AIアシスタントスキル を参照してください。 SKILL.md ファイル自体(YAMLメタデータ、プログレッシブディスクロージャーレベル、条件付き可視性、およびハブインストール)の作成またはデバッグに備える準備ができたら、 Hermes Agentスキルオーサリング — SKILL.md構造とベストプラクティス を使用してください。

典型的なワークフロー

Hermesを維持するエージェントとして扱う場合、ワークフローはサービスエンジニアリングのように見えてきます。

安定したベースライン

腐敗しにくいベースラインは以下の通りです:

  1. CLIでインストールし、最初のチャットを実行します。
  2. hermes model でプロバイダーとモデルを選択し、コストを確認します。
  3. ツールセットを構成し、ターミナル実行がローカルかサンドボックス化されているかを決定します。
  4. デフォルトをしばらく使用してから、 SOUL.md を少し変更します。アイデンティティの変更は、システムプロンプトの「スロット1」であるため、人々が予想するよりも重要です。

複利で増える日常使用

HermesにはWeb UIではなくターミナルUIがあり、スラッシュコマンド、再開可能なセッション、ストリーミングツール出力を備えた長時間セッションのために設計されています。

実際には、有用なリズムは以下の通りです:

  • プロジェクト用に名付けられたセッションで作業を実行
  • コンテキストが大きくなりすぎたら圧縮
  • Hermesが反復的なルーチンをスキルに変えるようにする
  • ツール実行が監査可能になるように、「聞く」と「行動する」の間の精神的な境界を保つ

24時間アクセスのためのメッセージングゲートウェイ

メッセージングゲートウェイは、Hermesをターミナルアプリではなくアシスタントのように感じさせる部分です。ドキュメントでは、複数のプラットフォームに接続し、セッションを処理し、cronジョブを実行し、メッセージを配信する単一のプロセスとして説明されています。

セットアップは hermes gateway setup を介して呼び出され、ゲートウェイはフォアグラウンドまたはユーザーサービスとして実行できます。CLIリファレンスは、 runinstallstartstopstatusrestart などのゲートウェイサブコマンドを文書化しています。

マルチエージェントのバックログと制御されたスケジューリングについては、 自己ホスト型LLMワークフローのためのHermes AgentでのKanban を参照してください。これは、ディスパッチャーの制限、依存関係チェーン、およびcronベースのバッチ処理をカバーしています。

ツールを使用するボットのセキュリティは重要です。ゲートウェイのドキュメントは、特定のプラットフォームのためのアクセス許可リストと、ワンタイムペアリングコードを発行し、 hermes pairing approve による承認を必要とするDMペアリングフローを説明しています。

問題のないアップデート

Hermesのアップデートはファーストクラスのコマンドです。アップデートガイドは hermes update、構成マイグレーションチェック、および hermes doctorhermes gateway status を含む小さなアップデート後の検証ルーチンを文書化しています。

hermes update
hermes doctor
hermes gateway status

トラブルシューティングと診断

ほとんどのHermesの失敗は神秘ではありません。人々がモデルレイヤーのみをチェックし、ランタイムレイヤーを無視するため、神秘的に見えます。

迅速なトリアージコマンド

CLIリファレンスは、3つのコマンドをコアループとして明示的に位置づけています:

  • 対話式診断のための hermes doctor
  • クイック概要のための hermes status
  • 共有可能で編集されたセットアップサマリーのための hermes dump

ログについては、 hermes logs~/.hermes/logs の下に保存されたファイルをテールします。

hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f

一般的なインストール失敗

FAQおよびトラブルシューティングガイドは、Pythonのバージョン問題、uvが見つからないこと、およびsudoインストールとユーザーインストールを混合することによるパーミッション問題など、いくつかの再発する問題とその修正をリストしています。

これらのエラーに遭遇した場合、ドキュメントはPythonのアップグレード、uvのインストール、およびsudoなしでのHermesの再インストールなどの特定の修正手順を提供しています。

プロバイダーとモデルの問題

APIキーが機能しない場合、FAQでは構成を確認し、 hermes model を再実行するか、 hermes config set を介してキーを直接設定することを推奨しています。また、一般的な落とし穴として、キーはプロバイダー固有であることを呼び出しています。

「モデルが見つかりません」の問題については、FAQは hermes model を使用して有効な識別子を選択することを指し、構成およびセッションごとの上書きの両方を示しています。

レート制限とコンテキスト長の問題もカバーされています。FAQでは、429エラーを待つ、プロバイダーまたはモデルを切り替える、および圧縮または新しいセッションを介してコンテキスト圧力を減らすことを提案しています。

ターミナルバックエンドとゲートウェイの問題

ターミナルコマンドがすぐに失敗する場合、構成ガイドには「一般的なターミナルバックエンドの問題」セクションが含まれ、Dockerが実行されていないことやSSH変数の欠落など、バックエンドごとの典型的な原因を指しています。また、サンドボックス構成が疑問視される場合、ローカルにフォールバックすることは有効なデバッグ動作であることを指摘しています。

ゲートウェイの問題については、メッセージングガイドはアクセス許可リストとペアリングを安全なデフォルトとして強調しており、多くの「ボットが沈黙している」入事が実際には認証が機能しているものであることを意味しています。

参考文献

購読する

システム、インフラ、AIエンジニアリングの新記事をお届けします。