自律型 AI エージェントの OSS は 2025 年から急速に種類が増え、2026 年 4 月時点でも Claude Code、Aider、OpenHands、SWE-agent、そして本記事で取り上げる Hermes Agent など、選択肢が乱立しています。どれも「自律的にタスクを進める」「長時間稼働する」と謳っており、一次情報を読むだけでは自分のユースケースに合うかを判断するのは容易ではありません。
特に Hermes Agent はリポジトリのスター数が約 9.9 万(2026 年 4 月時点の概算)という急激な伸びを見せており、「self-improving(自己改善)」というキャッチコピーも目を引きます。しかし、スター数や標語だけでは「他のエージェントと何が違うのか」「自分の目的に合うのか」は判断できません。
この記事は、Hermes Agent を初めて知ったエンジニアが 試す前に採用可否を判断するための材料 を提供することを目的としています。機能の網羅的な紹介ではなく、Hermes Agent 固有の設計思想、アーキテクチャ上の特徴、そして類似 OSS との使い分けに重点を置きます。
記載する情報はすべて公式 README、Hermes Agent 公式ドキュメント、および GitHub リポジトリ に基づくドキュメントベースの情報です。該当箇所には出典リンクを併記しているため、さらに踏み込んで確認したい場合はリンク先を参照してください。
Hermes Agentとは?Nous Researchが提供する自己学習型 OSS エージェント
Hermes Agent は、米国の AI 研究組織 Nous Research が公開している OSS の自律型 AI エージェントです。公式 GitHub リポジトリ では "The agent that grows with you"(あなたと共に成長するエージェント)というキャッチコピーで紹介されています。
特徴的なのは、単に LLM をツール呼び出しでラップしたエージェントではなく、エージェント自身が使用する中で記憶を整理し、スキル(再利用可能な手順)を自律的に生成して蓄積していく 仕組みを持つ点です。Nous Research はこれを "built-in learning loop(組み込みの学習ループ)" と呼んでいます。
Nous Researchとの位置づけ
Nous Research は独自の LLM シリーズ「Hermes」や推論ランタイム、分散学習基盤「Psyche」、ユーザー向け UI「Nous Portal」などを公開している研究組織です。Hermes Agent はその名のとおり Hermes モデル群の応用実装として位置づけられており、Nous Portal や自前の Hermes モデルと組み合わせて使うことも、後述のとおり OpenAI / Anthropic などの外部プロバイダを差し替えて使うことも可能です。
基本スペック(2026年4月時点)
| 項目 | 値 |
|---|---|
| リポジトリ | NousResearch/hermes-agent |
| ライセンス | MIT |
| 主要言語 | Python 87.2% / TypeScript 8.4% |
| 最新リリース | v0.10.0(2026-04-16) |
| スター数 | 約 99,900(概算) |
| フォーク数 | 約 14,200(概算) |
| 公式ドキュメント | hermes-agent.nousresearch.com/docs |
スター数・フォーク数は調査時点の概算値です。正確な値が必要な場合は gh api /repos/NousResearch/hermes-agent 等で取得してください。ライセンスが MIT であるため、商用利用を含めて比較的柔軟に採用を検討できる点も押さえておきたいポイントです。
Hermes Agentの特徴|「閉じた学習ループ」が他のOSSエージェントと違う
Hermes Agent の最大の差別ポイントは、冒頭でも触れた 閉じた学習ループ(closed learning loop) です。公式サイトでは「使い続けるほど能力が上がる自律エージェント」と表現されており、これを支える要素が 4 つ組み合わさっていることを README で明示しています(出典: README)。
- Agent-curated memory with periodic nudges — エージェント自身がメモリを整理し、定期的にユーザーへリマインドを行う
- Autonomous skill creation after complex tasks — 複雑なタスクを解いた後、再利用可能なスキルを自律生成する
- Skill self-improvement during use — 使用中にスキル自体をエージェントが改善する
- FTS5 cross-session recall with LLM summarization — SQLite の FTS5 による全文検索と LLM 要約を組み合わせ、過去セッションを横断的に想起する
これらは「単機能」として個別に存在するのではなく、記憶 → スキル化 → 再利用 → 改善 というループを閉じさせる形で設計されています。多くの AI エージェント OSS が「記憶」と「ツール呼び出し」を別個に持つのに対し、Hermes Agent は両者を学習ループとして接続している点が他と一線を画します。
Agent-curated memoryとスキル自動生成
Hermes Agent のスキルは、一般的なプラグインのように人間が事前に定義するだけでなく、エージェント自身がタスク完了後に生成する 点が特徴です。公式ドキュメントによれば、スキルは ~/.hermes/skills/ に "on-demand knowledge documents" として保存され、以下のような条件で自律生成が発火します(出典: 公式ドキュメント)。
- 5 回以上のツール呼び出しを伴う複雑タスクを完了したとき
- 試行錯誤の末に解決策を発見したとき
- ユーザーから修正指摘を受けたとき
- 非自明なワークフローを発見したとき
生成されるスキルは agentskills.io のオープン標準フォーマットに準拠しており、SKILL.md という YAML フロントマター付き Markdown として表現されます。README に掲載されている代表的なフォーマット例は以下のとおりです(出典: README。改変せず引用)。
---
name: skill-name
description: 説明
version: 1.0.0
platforms: [macos, linux]
metadata:
hermes:
tags: [category]
category: devops
requires_toolsets: [terminal]
---
この形式に準拠しているため、エージェントが生成したスキルを人間がレビュー・修正し、他のエージェントや他ユーザーと共有する という運用も可能です。hermes skills browse / search / install コマンドを使えば、ハブ経由で公式・コミュニティ配布のスキルを取得できます。
15以上のプラットフォーム対応メッセージングゲートウェイ
もう一つの特徴が 単一ゲートウェイプロセスで 15 以上のメッセージングプラットフォームを扱える ことです。README では以下のような対応先が挙げられています(出典: README)。
- Telegram / Discord / Slack / WhatsApp / Signal / Matrix / Mattermost
- Email / SMS
- DingTalk(釘釘)/ Feishu(飛書)/ WeCom(企業微信)/ BlueBubbles
- Home Assistant(IoT 連携)
起動は hermes gateway 一発で、プロファイルごとに独立した Gateway プロセスを立ち上げる設計です。CLI で対話するだけでなく、自分宛ての Telegram bot 的に使う、チームの Slack チャンネルに常駐させる、といった運用パターンを同じバイナリで切り替えられる 点は、他の多くのコーディングエージェント OSS にはない価値です。
6種類のターミナルバックエンド
Hermes Agent の実行環境(シェルコマンドを動かす先)は、用途に応じて切り替えられます。
| バックエンド | 用途 |
|---|---|
| local | ローカルシェルで直接実行(信頼済みユーザー向け) |
| Docker | コンテナ分離でサンドボックス化 |
| SSH | リモートホスト上で実行 |
| Daytona | Daytona の開発環境上で実行 |
| Singularity | HPC 環境向け |
| Modal | サーバーレス GPU 基盤 |
個人 PC からの利用ならローカル、業務利用でサンドボックスを効かせたいなら Docker、HPC クラスタや Modal のサーバーレス GPU での長時間タスクにも対応可能、というように 利用シーンごとに実行基盤を差し替えられる設計 になっています。
MCP連携と対応LLMプロバイダの広さ
Hermes Agent は Model Context Protocol(MCP) のクライアントとして動作し、任意の MCP サーバーを接続することでツールを拡張できます。公式の記述では「MCP サーバーに接続し、ツールをフィルタして安全に Hermes を拡張する」と明言されており(出典: README)、既存の MCP エコシステムをそのまま取り込める点も強みです。
LLM プロバイダは特定ベンダーに縛られず、Nous Portal、OpenRouter(200+ モデル)、OpenAI、Anthropic(Claude)、Hugging Face、NVIDIA NIM、Xiaomi MiMo、z.ai GLM、Kimi・Moonshot、MiniMax、自前エンドポイントなどから選択可能です(出典: README)。モデル乗り換えや、研究用途での自前モデル接続にも耐える設計と言えます。
Hermes Agentのアーキテクチャ概要|AIAgentを核とする3エントリポイント構成
ここからは、Hermes Agent の採否を判断する上で重要なアーキテクチャを整理します。詳細は 公式ドキュメント の Developer Guide を参照してください。
3つのエントリポイントと単一AIAgent
Hermes Agent の実行系は、単一の AIAgent クラスを 3 つのエントリポイントが共有する 構造です。エントリポイントの違いは「誰から入力を受け取るか」だけで、エージェント本体のロジックは一つに集約されています。
| エントリ | 役割 | 対応先 |
|---|---|---|
CLI(cli.py) | インタラクティブターミナル UI | ユーザーが直接対話する |
Gateway(gateway/run.py) | メッセージングプラットフォーム統合 | Telegram / Discord / Slack など |
ACP(acp_adapter/) | IDE 統合 | VS Code / Zed / JetBrains など |
公式ドキュメントでは「プラットフォームの差異はエントリポイント側に閉じ込められ、AIAgent 本体には持ち込まれない」と説明されています(出典: 公式ドキュメント)。この設計により、CLI で動いたスキルが Telegram bot としてもそのまま動作することが保証されやすく、運用環境の切り替えコストが小さい ことが期待できます。
セッション永続化とSQLite+FTS5
セッション・メモリは SQLite に永続化され、全文検索には FTS5 が使われます。ここに先述の LLM 要約を組み合わせることで、長期にわたるセッション横断の想起を実現しています。プロファイル単位で HERMES_HOME・設定・メモリ・セッション・Gateway PID が独立する設計のため、複数プロファイルを並行稼働させることも可能 です(出典: 公式ドキュメント)。
プラグイン・拡張ポイント
Hermes Agent は拡張ポイントを明確に切り分けています。
- プラグイン:
~/.hermes/plugins/(ユーザー)/.hermes/plugins/(プロジェクト)/ pip entry points - メモリプロバイダ:
plugins/memory/(1 つのみ有効) - コンテキストエンジン:
plugins/context_engine/(デフォルトはロッシー要約、置き換え可能) - スキル: バンドル + 公式オプション + ハブ(agentskills.io 経由)
- MCP: サーバー接続の追加により、実質的に任意のツールを拡張可能
メモリやコンテキストエンジンが プラグインとして差し替え可能 である点は注目に値します。たとえば独自の長期記憶実装や、社内情報を含めたコンテキスト最適化エンジンを差し込みたい場合にも、コア側を改変せず拡張できる構造になっています。
セキュリティ境界
自律エージェントをプロダクション環境に近い形で運用するうえで避けて通れないのがセキュリティです。Hermes Agent は以下の境界を設けています(出典: README / 公式ドキュメント)。
- 危険コマンド検出:
rm -rfなどの破壊的コマンドを検出し、承認フローに載せる - ゲートウェイ認可: allowlist と DM ペアリングによりメッセージング経由の利用者を制限
- コンテナ分離: Docker バックエンドなどの実行サンドボックスを標準で提供
- クレデンシャル管理: Credential Files / 環境変数パススルーでシークレットを中央管理
- プラットフォーム間セッション隔離: 異なるメッセージングプラットフォームのセッションを論理的に分離
これらの機能が揃っていることから、Hermes Agent は 研究・実験用途に留まらず、小規模チームのプロダクション運用も視野に入れた設計 になっていると判断できます。
Hermes Agentの使い方|インストールから最初のコマンドまで
ここまでの内容を踏まえて採用候補として検討する場合、次に知りたいのは「どう試すか」です。本節では README・公式ドキュメントの記述に沿って、インストールと主要コマンドだけを整理します。動作検証は行っていないため、各コマンドの実行結果や最新の挙動は一次情報で確認してください。
インストール(curlワンライナー)
README 記載のインストールスクリプトは以下のとおりです(出典: README。改変せず引用)。
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
対応 OS は Linux / macOS / WSL2 / Termux と公式で案内されており、Python 3.11 以降および uv(Python パッケージマネージャ)が依存として必要です。curl 経由のスクリプト実行になるため、本番環境や共有マシンに導入する場合はスクリプトの内容を一度レビューしてから実行することが推奨 されます。
主要CLIコマンド
README で案内されている代表的なコマンドは次の通りです。
| コマンド | 役割 |
|---|---|
hermes | インタラクティブ CLI を起動 |
hermes setup | 初期セットアップウィザード |
hermes model | LLM プロバイダ・モデルの選択 |
hermes tools | ツール設定 |
hermes gateway | メッセージングゲートウェイ起動 |
hermes skills browse / search / install | スキルハブ操作 |
初回は hermes setup でプロバイダや API キーを登録し、hermes model で使いたいモデルを選択、hermes で対話開始、という流れが基本です。Telegram や Slack で運用したい場合は別途 hermes gateway を常駐させる形になります。
LLMプロバイダ・モデルの選び方
前述のとおり Hermes Agent はプロバイダ非依存ですが、運用観点で以下のトレードオフを考慮する必要があります。
- 自前モデル(Hermes / Nous Portal) — Nous Research のモデルと相性が良く、研究用途や同社エコシステム内で使う場合に有利
- OpenAI / Anthropic — 信頼性が高く、コード生成・長文推論の実績が豊富。コストは高め
- OpenRouter — 200+ モデルに横断アクセスできるため、ベンチマークやコスト最適化に有利
- OSS / 自前エンドポイント — プライバシー要件が厳しい環境で有効。ただし応答品質・ツール呼び出し精度は要検証
どのプロバイダを選ぶかで Hermes Agent のエージェントとしての振る舞いが大きく変わる 点は、試す前に意識しておきたいポイントです。
類似OSSとの比較|OpenHands・Aider・SWE-agentとの使い分け
ここまで読んで「Hermes Agent はわかった。ただ OpenHands や Aider と何が違うのか」という問いが残るはずです。本節では 3 つの代表的な類似 OSS との差分を整理し、どんな場面でどれを選ぶべきか を言語化します。
OpenHandsとの比較(GUI/エンタープライズ vs 学習ループ)
All-Hands-AI/OpenHands は汎用 AI 開発プラットフォーム(旧 OpenDevin)で、Web GUI・クラウド版・エンタープライズ版を持つ点が最大の特徴です。
| 項目 | OpenHands | Hermes Agent |
|---|---|---|
| 一言要約 | 汎用 AI 開発プラットフォーム(旧 OpenDevin) | 自律学習型 AI エージェント |
| スター(概算) | 約 71.5k | 約 99.9k |
| UI | Web GUI(React)/ CLI / SDK / クラウド版 / エンタープライズ版 | CLI 中心 + 15+ メッセージングゲートウェイ |
| 得意領域 | チーム開発向けのサンドボックス実行、ブラウザ操作、Slack / Jira / Linear 等との統合 | 長時間稼働型のパーソナルエージェント、学習ループ |
| 差別ポイント | GUI とエンタープライズ配備が充実 | メモリ + スキル自動生成の学習ループ が固有。メッセージングプラットフォーム統合の種類は Hermes の方が多い |
GUI が前提で、複数開発者がクラウド版や Web UI で使う形を取りたいなら OpenHands、CLI とメッセージングで常駐させ、使うほどに賢くなる学習ループが欲しいなら Hermes Agent という棲み分けになります。
Aiderとの比較(コーディング特化 vs 汎用自律)
Aider-AI/aider は、ターミナル上で LLM とペアプロできるコーディング特化のツールです。
| 項目 | Aider | Hermes Agent |
|---|---|---|
| 一言要約 | ターミナルで LLM とペアプロできるコーディング支援 | 自律学習型 AI エージェント |
| スター(概算) | 約 43.5k | 約 99.9k |
| UI | ターミナル内ペアプロ(CLI) | CLI + メッセージング + IDE アダプタ |
| 得意領域 | Git ネイティブな差分ワークフロー、コードベースマッピング | プラットフォーム横断のパーソナルエージェント化、スキル蓄積 |
| 差別ポイント | Human-in-the-loop と Git 連携 が強み。コーディング特化 | 学習ループと複数プラットフォーム対応。コーディング以外の用途も想定 |
明確なコーディング用途(Git 差分を逐次確認しながらコミットを積む)なら Aider が軽量で扱いやすく、コーディングに限らず「パーソナル AI アシスタント」「Slack 常駐 bot」「業務自動化」を同じエージェントで扱いたいなら Hermes Agent が適します。
SWE-agentとの比較(研究特化 vs プロダクション運用)
SWE-agent/SWE-agent は GitHub Issue 自動修正や SWE-bench、CTF などの研究用途で有名なエージェントです。
| 項目 | SWE-agent | Hermes Agent |
|---|---|---|
| 一言要約 | GitHub Issue 自動修正に特化した研究用エージェント | 汎用自律エージェント |
| スター(概算) | 約 19k | 約 99.9k |
| UI | CLI / YAML 設定 | CLI / ゲートウェイ / IDE |
| 得意領域 | SWE-bench スコアの最大化、CTF、競技プログラミング | 日常運用型のアシスタント、学習ループ |
| 差別ポイント | 研究向けのシンプル・ハック可能 な設計 | プロダクション運用を意識したゲートウェイ・セキュリティ |
ベンチマーク攻略や研究プロトタイプとしての「素材」が欲しいなら SWE-agent、社内業務や個人の長時間アシスタントとして運用したいなら Hermes Agent が向いています。
採用判断フローチャート(簡易)
採用可否を最短で判断するための質問を 3 つに絞ります。
- GUI やクラウド/エンタープライズ版での配備が必要か? → YES なら OpenHands が有力
- 用途はコーディング支援に特化しているか? → YES なら Aider が軽量で扱いやすい
- ベンチマーク攻略や研究プロトタイプが主目的か? → YES なら SWE-agent が適合
上記 3 つがいずれも NO で、「使うほどに賢くなる学習ループ」「CLI とメッセージングの両対応」「プロダクション運用を意識したセキュリティ境界」 を重視する場合に Hermes Agent が最有力候補となります。
Hermes Agentのユースケースと導入時の注意点
ここまでで挙げた特徴・アーキテクチャ・比較結果を踏まえ、実際の採用判断に使えるユースケースマップと注意点を整理します。公式に明示された「推奨ユースケース」セクションは確認できなかったため、以下は機能とアーキテクチャから推定される想定用途です。
向いているユースケース
- 長時間稼働のパーソナルアシスタント:学習ループが生きる。使い続けるほどスキルとメモリが蓄積される
- 個人・小チームの Slack / Telegram チャットボット化:ゲートウェイ機能が標準で揃っている
- 複数プラットフォーム横断の業務オペレーション自動化:組み込み cron + メッセージングで日次ジョブを各プラットフォームに配信できる
- 手順の蓄積とチーム共有が必要な繰り返し作業:スキルが agentskills.io のオープン標準に準拠しているため、チーム内での共有・再利用が現実的
- 研究用途:Hermes モデル系列・Tinker-Atropos(RL 訓練サブモジュール)との統合により、LLM 研究のハーネスとしても使える
向いていないユースケース
- 純粋なコーディング支援のみ:Git 連携と差分ワークフローに特化した Aider の方が軽量・高速
- GUI ありきのチーム運用・エンタープライズ配備:Web GUI と SaaS 版を持つ OpenHands の方が親和性が高い
- SWE-bench や CTF 等のベンチマーク攻略:シンプルさが利点の SWE-agent が扱いやすい
導入前のチェックポイント
- ライセンス:MIT のため商用利用・改変は比較的柔軟。ただし、依存ライブラリ(Honcho、各 MCP サーバー、LLM プロバイダ SDK 等)のライセンスも別途確認が必要です
- セキュリティ:curl ワンライナーのインストールスクリプトは内容をレビューしてから実行する。本番用途では Docker バックエンドでのサンドボックス化を前提に設計する
- モデル選定とコスト:学習ループの性質上、継続的に LLM を呼び出す設計のため、API 利用コストが累積しやすい。トークン消費のモニタリング体制は必須
- 運用体制:ゲートウェイを常駐させる場合、プロセス監視・ログ監視・シークレット管理の運用設計を事前に検討する
- 学習ループが生み出すアーティファクト:自律生成されたスキルをレビュー対象に含める運用(スキルの Git 管理、レビュー、削除方針)を決めておくと、ブラックボックス化を防げる
まとめ|Hermes Agentを試すべきエンジニア像
ここまで、Hermes Agent の概要、学習ループという固有の特徴、3 エントリポイント共有のアーキテクチャ、類似 OSS との使い分けを見てきました。最後に、この記事の結論として「どんなエンジニアが試す価値があるか」を言い切ります。
- 試すべき:長時間稼働のパーソナルアシスタント、または複数プラットフォーム横断の業務自動化を OSS で実現したいエンジニア。特に「使うほどに賢くなる」学習ループを重視し、メモリ・スキル・コンテキストエンジンをプラグインで差し替えられる柔軟性を求める場合
- 見送りを検討:純粋なコーディング支援が目的(→ Aider)、Web GUI やエンタープライズ配備が前提(→ OpenHands)、SWE-bench 等のベンチマーク攻略が目的(→ SWE-agent)
Hermes Agent は「万能エージェント」を目指しているわけではなく、「長期間走らせて蓄積する」「複数プラットフォームから同一エージェントにアクセスする」という運用モデル に最適化されています。このモデルに合致する用途であれば、2026 年 4 月時点で OSS として有力な選択肢のひとつと言えます。
次の一歩として、公式 GitHub リポジトリ の README と Hermes Agent 公式ドキュメント を確認し、コミュニティの動向は Nous Research Discord で追うのが王道の入り口です。スキルのエコシステムに興味があれば agentskills.io も併せてご確認ください。



