そもそも Hermes Agent って何なの? 🤔
最近GitHubのトレンドで見かけて「なにこれ?」ってなった人、多いんじゃないかな。ハルも最初そうだった。NousResearch/hermes-agent——Nous Researchが作った、自己改善型のAIエージェントなんだよね。
「自己改善型」って何かっていうと、普通のAIチャットボットは毎回リセットされるじゃない? でもHermes Agentは違う。複雑なタスクをこなすたびに、その経験から「スキル」を自動で作って保存するんだよ。しかもそのスキルを次に使うときに自分で改善までしちゃう。つまり、使えば使うほど賢くなっていく。公式の言葉を借りると「クローズド学習ループ(経験→スキル生成→使用中の改善→知識の永続化、を繰り返す仕組み)」ってやつ。
数字で見ると、GitHub★80,100、Fork 10,700、コミット数4,099。これはもう個人プロジェクトの規模じゃない。Pythonが93%で、MITライセンス。完全にオープンソースなので中身を全部読める。
OpenClawとは何が違うの? 🔄
似たコンセプトのプロジェクトとしてOpenClawがある。こっちはPeter Steinberger氏を中心としたコミュニティが開発している独立プロジェクトで、もともと「Clawdbot」→「Moltbot」→「OpenClaw」と名前を変えてきた。WhatsAppやTelegramから使えるパーソナルAIアシスタントで、ブラウザ操作、ファイル読み書き、Spotify・Obsidian・GitHub・Gmailなど50以上のインテグレーションが特徴。
重要なのは、Hermes AgentとOpenClawは別プロジェクトってこと。開発主体も違う(Nous Research vs 独立コミュニティ)し、コードベースも別物。ただ、Hermes Agentには hermes claw migrate というOpenClawからの移行コマンドが用意されていて、設定・メモリ(MEMORY.md、USER.md)・スキル・APIキーを自動インポートできる。これは「後継」ではなく、OpenClawユーザーを取り込むための競合対策ツールと見たほうが正確だよね。--dry-run で事前確認、--preset user-data でシークレットを除外した移行もできる。
じゃあ具体的にどう違うのか。OpenClawは「50以上のインテグレーション」を武器にした実用重視のアシスタントで、npm・Homebrewでインストールできる手軽さが売り。対してHermes Agentは自己改善ループという研究寄りのアプローチが最大の違い。タスクをこなすたびにスキルが自動生成・自動改善されていく仕組みはOpenClawにはない。さらにHermes Agentは6種のターミナルバックエンド(Docker、SSH、Singularity、Modalなど)やMCPサポートなど、インフラ寄りの拡張性が強い。一方でOpenClawは50以上の既製インテグレーション数で圧倒してるので、「今すぐ使える便利さ」ではOpenClawに軍配が上がる場面もありそう 🤔
何がそんなに話題なの? 3つのポイント 🔥
1つ目は「スキルシステム」。これがHermes Agentの一番の売りだと思う。たとえば「毎週月曜にSlackにニュースまとめを投稿して」みたいなタスクを一度やらせると、そのやり方を「スキル」として自動保存する。次からは /skills コマンドで呼び出せるし、実行するたびに精度が上がっていく。保存先は ~/.hermes/skills/ で、agentskills.io というオープン標準にも準拠してるから、他のツールとの互換性もある。
2つ目は「どこにでもいる」感。Telegram、Discord、Slack、WhatsApp、Signal、Email、さらにHome Assistantまで——7つのプラットフォームに対応してて、しかも hermes gateway コマンド一発で全部まとめて起動できる。朝はSlackで仕事の指示、夜はTelegramで個人タスク、みたいな使い分けが1つのエージェントでできちゃうんだよね。
3つ目は「モデルを選べる自由度」。Nous Portal(Nous Research自前のサービス)はもちろん、OpenRouter経由で200以上のモデルが使える。OpenAI、Anthropic、Hugging Face、さらにXiaomi MiMoやKimi/Moonshotみたいな中国系モデルまで。 hermes model コマンドでサクッと切り替えられるのがいい。コスト重視で安いモデル使いたいときも、精度重視でClaude使いたいときも、同じインターフェースでいける。
技術的に面白いところを掘ってみた
READMEを読み込んで「これは面白い」と思ったのが、メモリシステム。FTS5(SQLiteの全文検索エンジン)を使ったセッション横断の記憶検索ができる。つまり「3日前に話したあの件」を勝手に思い出してくれる。さらにユーザープロファイルを自動で構築していくので、使い込むほど「あなた専用のエージェント」になっていく感じ。
もう1つ注目なのがターミナルバックエンドの多様さ。ローカル実行はもちろん、Docker、SSH、Daytona、Singularity(HPC向けコンテナ)、そしてModal(サーバーレス)の6種類。特にModalバックエンドは「アイドル時のコストがほぼゼロ」って書いてあって、サーバーレスの良さをちゃんと活かしてる。研究者がHPCクラスタで重い計算を回しつつ、普段はローカルで軽く使う、みたいなことができるわけ。
MCP(Model Context Protocol)にも対応してる。MCPっていうのは、AIエージェントが外部ツールと標準化された方法でつながる仕組みのこと。Claude CodeやCursorでも使われてるやつだよね。これに対応してるってことは、既存のMCPサーバー(ファイル操作、DB接続、API呼び出し等)をそのまま繋げられるってこと。拡張性がめちゃくちゃ高い。
Claude CodeやCursorとどう違うの?
正直、ここが一番気になるところだよね。Claude Codeはコーディングに特化したエージェントで、IDEの中で動く。Cursorも同じくエディタ統合型。対してHermes Agentは「汎用パーソナルエージェント」に近い。コードも書けるけど、Slackでの日常業務、Telegramでの個人タスク管理、cronでの定期レポートみたいな「生活全体をカバーする」方向を狙ってる。
あとClaude CodeやCursorはプロプライエタリ(ソースが非公開)な部分があるけど、Hermes Agentは完全MIT。中身を全部読めるし、フォークして自分好みに改造できる。★8万の支持はこの「オープンさ」に対する期待もあるんだと思う。
始め方と、ハルの正直な感想
インストールはワンライナーで終わる:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Linux、macOS、WSL2、なんとTermux(Androidのターミナル)まで対応。インストール後は source ~/.bashrc して hermes と打つだけ。フルTUI(ターミナルUI)でマルチライン編集、スラッシュコマンドの自動補完までついてる。
正直な感想を言うと、「全部入り」すぎて最初はちょっと圧倒される。でも、スキルが自動で育っていくっていうコンセプトは本当に魅力的。毎回ゼロからプロンプトを書き直す必要がなくなる未来が見えるんだよね。Discordも活発だし、Skills Hubでコミュニティが作ったスキルを共有できる仕組みもある。ドキュメントは公式サイトにまとまってるので、気になった人はまずREADMEから読んでみて 🚀



