SelfHosting

LLMウィキは、古い事実が依然として妥当に見えるようになり、矛盾が磨き上げられ、生成された要約が元々の情報源から逸脱した際に失敗します。

Syncthingは、あなたが管理するデバイス間でファイルを同期し続けるため、クラウドロックインを回避する自己ホスト型ナレッジインフラにおいて最も実用的なツールの一つとなっています。

2026年、AIハードウェアの状況は大きく変化しました。NVIDIA、AMD、Intelの各社が、ローカル環境で大型言語モデル（LLM）やAI推論ワークロードを実行できるGPUを必要とする開発者を獲得するため、激しい競争を繰り広げています。

ヘッドレスサーバーで Hermes エージェントを実行し、別のマシンのデスクトップクライアントから接続するには、2つのサーバープロセスと1つのクライアント接続が必要です。

Linux サーバー上の Docker Compose は、ブート時に起動し、シャットダウン時にクリーンに停止し、手動介入なしで再起動に耐えられるべきです。

UbuntuにDockerをインストールする方法：APT、Snap、Rootless — 2026年版完全ガイド

Ubuntu に Docker をインストールするのは本来シンプルであるはずですが、実際には複数の「Docker 関連」の選択肢が同じコマンド名を巡って競合しており、それぞれ異なるパッケージ構成、アップグレード動作、セキュリティへの影響を持っています。

Ubuntu APTのトラブルシューティング：壊れたパッケージ、ホールド、GPGエラーの修正

長期間稼働している Ubuntu マシンでは、APT のエラーはよく発生します。これらは通常、リリースアップグレード、サードパーティリポジトリの変更、PPA の削除、手動インストールされた .deb ファイル、または中断されたパッケージインストールの後に現れます。

メモリはアシスタントを反応型から永続型へと変えますが、同時に多くのシステムが静かに劣化してしまう箇所でもあります。調査では、短期的メモリと長期的メモリの二分法是では現代のエージェントメモリには不十分であると指摘されています。OpenAIやLangGraphのSDKは、よりシンプルな構成、つまりワーキングメモリ、永続的な状態、および検索による取得（リトリーブ）へと焦点を移しています。

OpenClaw対Hermesエージェント：スター数、ダウンロード数、および2026年の利用状況

オープンソースのAIエージェントフレームワークは、GitHub上でその人気を急速に高めています。セルフホスト型AIシステムのエコシステムの中核をなす2つのプロジェクト、OpenClawとHermes Agentは、他を大きく引き離し、残りのライバルたちは遠い3位の座を争う状況になっています。

16GB GPUにおけるQwen 3.6 27Bおよび35B MTPと標準モデルの比較

RTX 4080（16 GB VRAM）環境で、Qwen 3.6 27Bおよび35Bにおける推論デコーディング（マルチトークン予測、MTP）のパフォーマンスをテストしました。

llama.cpp ラーターモードは、llama-server における数年間で最も有用な変更の一つです。これにより、ローカルLLM運用者は、Ollamaで期待されるようなモデル管理体験に近いものをようやく手に入れることができました。同時に、llama-server を使い続ける価値がある生のパフォーマンスと低レベルの制御も維持されています。

このページは、エージェント型LLM推論チューニングの実用的なリファレンス（temperature、top_p、top_k、ペナルティ、およびマルチステップやツール多用なワークフローにおけるそれらの相互作用）です。

より広範なLLMパフォーマンスエンジニアリングハブと併せて参照し、明確なLLMホスティングとサービングの概要と組み合わせることで、モデルがリソース不足に陥った際にはスループットとスケジューリングが依然として支配的ですが、不安定なサンプリングはGPUが処理を終える前にリトライと出力トークンを消費してしまうことがわかります。

このページでは以下をまとめます：

スマートフォンからテキストでヘルメスエージェントとチャットすることはすでに可能でしょう。今、あなたはエージェントと直接会話し、音声で返信を受け取りたいと考えています。これは通常、正しい選択です。特にHermesを永続的な自己ホスト型アシスタントとして使用している場合には顕著です。小さな画面で長いプロンプトをタイプするのは、時間がかかり、誤りも生じやすいものです。

Hermes AgentにはKanbanスタイルのボードとHermes Gatewayが標準で搭載されていますが、一度に多数のタスクがディスパッチされると、セルフホスト型のLLMが過負荷状態に陥る可能性があります。

Hermesエージェントスキル作成 — SKILL.mdの構造とベストプラクティス

Hermes Agentは、スキルを反復可能なワークフローを教えるデフォルトの方法として扱います。公式ドキュメントでは、それらはオープンな agentskills.io 仕様に準拠したオンデマンドのナレッジドキュメントとして説明されており、**プログレッシブディスクロージャー（段階的開示）**を通じて読み込まれます。これにより、モデルはまず小さなインデックスを見て、タスクが実際に必要とする場合にのみ完全な指示を取得します。

Hermes Agent CLI チートシート — コマンド、フラグ、およびスラッシュショートカット

Nous Research の Hermes Agent は、モデル非依存でツールを使用できるアシスタントであり、ローカルまたは VPS で実行できます。

SelfHosting

LLM Wikiの保守：ドリフト、矛盾、およびレビュー

セルフホスト型ナレッジシステム向けのSyncthingファイル同期

2026年のAI用GPU：NVIDIA、AMD、Intelの比較

Hermes Agent：ヘッドレスサーバー＋リモートデスクトップの設定

systemdでDocker ComposeをLinuxサービスとして実行する

UbuntuにDockerをインストールする方法：APT、Snap、Rootless — 2026年版完全ガイド

Ubuntu APTのトラブルシューティング：壊れたパッケージ、ホールド、GPGエラーの修正

AIアシスタントにおけるメモリシステム

OpenClaw対Hermesエージェント：スター数、ダウンロード数、および2026年の利用状況

16GB GPUにおけるQwen 3.6 27Bおよび35B MTPと標準モデルの比較

llama.cppルータモデルをすべてアンロードする

QwenおよびGemmaにおけるエージェンティックLLM推論パラメータの参照

スマートフォンからのヘルメス音声コントロール

セルフホスト型LLMワークフローにおけるHermesエージェントの看板

Hermesエージェントスキル作成 — SKILL.mdの構造とベストプラクティス

Hermes Agent CLI チートシート — コマンド、フラグ、およびスラッシュショートカット