AI エージェントが自律的に Web アプリの脆弱性を発見・検証する OSS「Strix」が、2026 年に入り GitHub Trending の常連となっています。SAST の誤検知に悩まされ、手動ペンテストの外注コストにも頭を抱えるエンジニアにとって、自律 AI ペンテスト OSS は魅力的な選択肢に見えるはずです。
一方で、同じカテゴリには PentAGI(vxcontrol/pentagi) や CAI(aliasrobotics/cai) といった競合 OSS も並んでおり、「どれを採用すべきか」の判断は簡単ではありません。特に本番運用を前提にすると、CI/CD 統合の完成度・ライセンス・LLM 費用・法的責任など、判断材料が多岐にわたります。
本記事では、usestrix/strix の README と公式ドキュメントを一次情報として、Strix の全体像と類似 OSS との違いを整理します。実行や動作検証は行わず、公開情報のみを根拠に、初見エンジニアが「自プロジェクトに採用すべきか」を判断できる材料を提示することが目的です。
想定する読者は、Docker・CI/CD・API キー管理などのモダン運用は経験済みで、AI エージェント型のセキュリティテストへの移行を検討しているエンジニア・情シス・SRE・セキュリティ担当です。読み終えた後に、PoC 実行・公式ドキュメント精読・経営層への提案のいずれかに進める状態を目指します。
Strix とは何か(OSS のポジションと基本情報)
Strix は、自律 AI エージェントが実際の攻撃者と同じ手法でアプリケーションを侵害し、脆弱性を発見・検証するオープンソースのペネトレーションテストツールです。開発元である usestrix/strix の公式リポジトリと、公式サイト strix.ai では「Autonomous Security for the AI Era」を掲げており、静的解析(SAST)の誤検知や手動ペンテストの工数を根本から見直すことを狙っています。
リポジトリの基本情報
執筆時点での GitHub リポジトリの基本情報は以下の通りです(GitHub API 取得値)。
項目 | 値 |
|---|---|
リポジトリ | |
説明 | Open-source AI penetration testing tool to find and fix your app's vulnerabilities. |
実装言語 | Python |
ライセンス | Apache-2.0 |
GitHub Stars | 36,243 |
Forks | 3,673 |
アーカイブ | false(アクティブに開発中) |
フォークリポジトリ | false(オリジナル) |
可視性 | public |
最終コミット | 2026-07-03 |
archived が false かつ fork が false であり、最終コミットも本記事執筆の直前まで行われています。放棄されたリポジトリや個人フォーク版ではなく、オリジナルの本流としてメンテナンスされている点は、意思決定の前提として押さえておきたい情報です。
Strix が解決する課題
Strix が想定する解決対象は、README で以下のように整理されています。
- SAST(静的解析)の誤検知の多さ — 実際には悪用できない箇所まで警告するため、開発チームが疲弊する
- 手動ペンテストの工数とコスト — 外注はスポット的な検査になりがちで、リリースサイクルに追随できない
- 単体ツールでは埋まらない検知範囲 — DAST・SAST・IAST を単体で運用しても、業務ロジックの欠陥までは踏み込めない
これらの課題に対して、Strix は「自律 AI ハッカーが実際に攻撃を試み、動作する PoC(Proof of Concept)まで生成する」というアプローチを取ります。誤検知の切り分けや、開発者が「本当に修正すべき優先度」を判断するコストを下げることを目的としています。
Strix のアーキテクチャと構成要素
Strix の技術的な特徴は、単一の LLM プロンプトではなく、複数の AI エージェントが協働して攻撃タスクを分担する点にあります。README ではこれを「Graph of Agents」と呼んでおり、内部に本物のペンテストツール群を装備していることが強調されています。
Graph of Agents(マルチエージェント構成)
Graph of Agents は、以下の 3 つの特性を持つとされています(README より)。
- Distributed Pentesting: 偵察・エクスプロイト・侵入後の各フェーズを、専門化された AI エージェントが分担
- Scalable Security Testing: 複数ターゲットへの並列実行に対応
- Dynamic Coordination: エージェント間で発見物を共有し、脆弱性を連鎖させたレッドチーム的な攻撃シナリオを組み立てる
単一エージェントの巨大プロンプトで完結させず、役割分担と発見物の共有によって攻撃チェーンを構築する構造は、業務ロジック欠陥や複合脆弱性の検出を狙う設計と読み取れます。
装備しているペンテストツール群
Strix は LLM に「攻撃を考える」役割だけでなく、実際のペンテストツールを操作する能力を持たせています。README には以下のツール群が挙げられています。
ツール | 内容 |
|---|---|
HTTP Interception Proxy | Caido ベースの HTTP リクエスト/レスポンス改ざん・解析 |
Browser Exploitation | XSS・CSRF・クリックジャッキング・認証バイパスを自動ブラウザで検証 |
Shell & Command Execution | エクスプロイト開発・侵入後動作のための対話ターミナル |
Custom Exploit Runtime | Python サンドボックス上での PoC 生成・実行 |
Reconnaissance & OSINT | 攻撃面マッピング・サブドメイン列挙・フィンガープリンティング |
Static & Dynamic Code Analysis | SAST + DAST 両対応 |
Vulnerability Knowledge Base | CVSS スコア・OWASP 分類つきの発見管理 |
謝辞欄では Caido(HTTP プロキシ基盤)・Nuclei(脆弱性スキャン)・Playwright(ブラウザ自動化)・LiteLLM(LLM プロバイダ抽象化)などが基盤 OSS として明記されており、既存の実績ある OSS を組み合わせて構築されている点も判断材料になります。
検出対象の脆弱性カテゴリ
README では、Strix がカバーする脆弱性カテゴリとして以下が列挙されています。
- Broken Access Control: IDOR、権限昇格、認証バイパス
- Injection: SQL・NoSQL・OS コマンド・SSTI
- Server-Side: SSRF・XXE・安全でないデシリアライズ・RCE
- Client-Side: XSS 全種、prototype pollution、CSRF
- Business Logic Flaws: レース条件、決済操作、ワークフロー迂回
- Authentication & Session: JWT 攻撃、セッション固定、クレデンシャルスタッフィング
- Infrastructure & Cloud: 誤設定、露出サービス、クラウドセキュリティ
- API Security: 認証欠陥、mass assignment、レートリミット迂回
OWASP Top 10 全域をカバーする設計であり、単純な既知パターンマッチだけでなく、業務ロジック欠陥を対象に含めている点は、AI エージェント型ならではの守備範囲と言えます。
Strix が想定するユースケース
Strix は「開発者ファーストの CLI ツール」として設計されており、README では代表的なユースケースとして、アプリケーションセキュリティテスト・迅速なペンテスト・バグバウンティ自動化・CI/CD 統合が挙げられています。
基本的な CLI 利用
Strix のインストールは公式サイト経由のインストールスクリプトが提供されています(README より抜粋、改変なし)。
curl -sSL https://strix.ai/install | bash
環境変数で LLM とキーを指定した後、--target オプションで対象を指定して実行します(README より抜粋、改変なし)。
export STRIX_LLM="openai/gpt-5.4"
export LLM_API_KEY="your-api-key"
strix --target ./app-directory
--target にはローカルディレクトリのほか、GitHub のリポジトリ URL や稼働中の URL を指定でき、複数の対象を並べることも可能です。詳細な CLI オプションや実行モードは 公式ドキュメント(docs.strix.ai) に整理されています。
CI/CD への組み込み(GitHub Actions)
Strix の特徴として、GitHub Actions を用いた CI/CD 統合が README で一級市民として扱われている点が挙げられます。プルリクエスト差分のみをスキャンする設計になっており、以下のような点が公式ドキュメントで示されています。
- Pull Request イベントで起動し、変更差分の範囲のみをスキャン対象にする
- 差分解決のために
fetch-depth: 0でチェックアウトする必要がある - ヘッドレスモード(
-n/--non-interactive)と組み合わせ、脆弱性を発見した場合は非ゼロ終了で CI を失敗させることができる
同種の OSS の多くが「手元で単発実行するツール」の色合いが強い中で、CI/CD に組み込む前提の設計とサンプルが公式に提示されている点は、Strix の実務適用イメージを描きやすくしている要因です。CI/CD 統合の実装ガイドは 公式ドキュメント(docs.strix.ai) を参照するのが確実です。
ヘッドレスモードと差分スコープ
CI/CD 実行を意識した機能として、公式ドキュメント上では以下のオプションが整理されています。
--scope-mode diff --diff-base <base>: 特定のブランチ・コミットとの差分のみをスキャン範囲に絞る-n/--non-interactive: 対話 TUI を無効化するヘッドレスモード--instruction/--instruction-file: 認証情報・スコープ制限・除外対象などを自然言語で追加指示
これらの組み合わせにより、PR ごとに差分だけを自律 AI で検査し、脆弱性が見つかったら CI を止める、といった開発ワークフロー統合が構築可能な設計になっています。
類似 OSS との違い(PentAGI・CAI との比較)
意思決定を進めるうえで、同カテゴリの主要 OSS との比較は避けて通れません。ここでは Strix と、代表的な類似 OSS である PentAGI および CAI との差分を整理します。
PentAGI との違い
vxcontrol/pentagi は「完全自律 AI エージェント群による複雑なペンテストタスクの実行」を掲げる Go 実装の OSS です。GitHub Stars は約 18,117 で、Searcher / Coder / Installer / Pentester の 4 つの専門サブエージェントを中央コーディネーターが束ねる構造を取っています。
Strix との主な違いは以下の 3 点です。
- 実装言語: PentAGI は Go、Strix は Python
- エージェント構成: PentAGI は 4 種類の役割を明示的に定義した固定構成、Strix は Graph of Agents による動的な協働
- 開発者統合: PentAGI は Web UI + Docker サンドボックスが中心。Strix は CLI と GitHub Actions ネイティブサンプルを前面に打ち出しており、PR 差分スキャンや自動修正 PR(クラウド版)を含む「開発ワークフローへの組み込み」を強く意識している
セキュリティチーム主導で Web UI から操作する運用を想定するなら PentAGI が親和的で、開発者主導で PR 単位に自動化を組み込みたいなら Strix が親和的、と読み分けられます。
CAI との違い
aliasrobotics/cai は「Cybersecurity AI (CAI) — the framework for AI Security」を掲げる Python 実装のフレームワークです。GitHub Stars は約 9,364 で、300+ の LLM プロバイダに対応することと、air-gapped 環境(外部通信を許さないローカル LLM 前提)での運用を売りにしています。
Strix との主な違いは以下の 4 点です。
- 位置づけ: CAI は「自作エージェントを組み立てるためのフレームワーク」、Strix は「すぐ動く CLI ツール + プラットフォーム」
- LLM 対応の思想: CAI は 300+ モデル・Ollama 含むローカル LLM 前提を前面に押し出す。Strix も LiteLLM 経由で多数のプロバイダに対応するが、air-gapped よりもクラウド LLM を前提とする使い勝手を優先している
- 対象領域: CAI は攻撃 + 防御の両方を扱うフレームワーク、Strix は攻撃側(ペネトレーションテスト)に特化
- ライセンス構成: Strix が Apache-2.0 の単一ライセンスであるのに対し、CAI は MIT(一部)+ Alias Robotics 独自の研究用ライセンスというデュアル構成を採用している。
src/cai/agents/配下(OpenAI 由来のopenai-agents-pythonを改変した部分)は MIT だが、src/caiのコア部分(フレームワーク本体)は研究・学術用途に限定され、商用・本番利用には Alias Robotics との別途商用ライセンス契約が必要になる(CAI 公式 LICENSE)。「Apache-2.0 系」の寛容型ライセンスではない点は、本番導入の稟議で必ず確認すべき論点です
ライセンス面は特に重要で、CAI をプロダクション用途で採用する場合はコア部分の商用ライセンス取得を事前に済ませておく必要があります。外部通信を許さない環境で自社独自のエージェントを組み上げる必要があるなら CAI、まず動く CLI で自プロジェクトに刺してみたいなら Strix、という判断軸になります。
比較表
3 つの OSS を同じ軸で並べると次のようになります。
観点 | Strix | PentAGI | CAI |
|---|---|---|---|
GitHub Stars | 36,243 | 約 18,117 | 約 9,364 |
実装言語 | Python | Go | Python |
ライセンス | Apache-2.0 | MIT | MIT(一部)+独自ライセンス(コア部分は研究・学術用途限定、商用利用は別途契約が必要) |
主要 UX | CLI + GitHub Actions | Web UI + Docker | フレームワーク(自作組立) |
CI/CD 統合 | ネイティブ(Actions サンプル同梱) | 手動組み込み | 手動組み込み |
自動修正 PR | クラウド版で提供 | なし | なし(自作) |
ローカル LLM | 対応(LiteLLM 経由) | 対応 | 前面に押し出す(300+ モデル) |
SaaS 版 | あり(app.strix.ai) | なし | なし |
Strix・PentAGI の Stars 数値は本記事執筆時点の GitHub API 取得値です。CAI は README およびリポジトリページ記載値です。
Strix を選ぶべき判断軸
比較を踏まえ、どの状況で Strix が最適解になり、どの状況では他 OSS を検討すべきかを整理します。
開発者ワークフロー統合を最優先する場合 → Strix
以下のいずれかに強く該当するなら、Strix が第一候補になります。
- GitHub Actions で PR 単位に自動ペンテストを回したい
- プルリクエスト差分のみをスキャン対象にして CI 時間を圧縮したい
- 発見された脆弱性を PoC 付きで受け取り、開発者が優先度判断しやすい形で運用したい
- 将来的にはクラウド版 app.strix.ai の自動修正 PR まで視野に入れたい
いわゆる DevSecOps を「開発者側」から進めるチームにとって、Strix の設計は追い風になります。
完全 air-gapped / ローカル LLM 前提の場合 → CAI 検討
外部の LLM プロバイダに一切データを渡せない、あるいは自社のエージェント構成をゼロから組み立てたいなら、フレームワーク志向で 300+ モデル対応を売りにする CAI の方が親和的です。Strix も LiteLLM 経由でセルフホスト LLM に接続できますが、CAI ほど air-gapped を前提にした情報整備は進んでいません。
ただし前述の通り、CAI のコア部分は研究・学術用途に限定され、商用利用には Alias Robotics との別途商用ライセンス契約が必要です。本番運用を前提とする場合は、事前にライセンス条件を確認し、必要な契約手続きを済ませておくことが必須になります。ライセンス面のオーバーヘッドを回避したい、あるいは手戻りリスクを抑えたい場合は、単一ライセンス(Apache-2.0)で完結する Strix の方が導入判断はシンプルです。
Web UI 中心の運用や Go 実装環境を好む場合 → PentAGI 検討
セキュリティチームがブラウザから操作する運用スタイルを取りたい、あるいは Python ではなく Go 実装のツールに揃えたい場合は PentAGI が候補になります。ただし CI/CD 連携や PR 差分スキャンは手動組み立てになるため、開発者主導のワークフロー統合を望む場合は Strix より工数がかかります。
SaaS 版とセルフホストの選択
Strix には OSS 版に加え、SaaS の app.strix.ai とエンタープライズ向けの案内が用意されています。公式サイトの記載によれば、エンタープライズ版では SSO(SAML/OIDC)、SOC 2 / ISO 27001 / PCI DSS 対応レポート、VPC・セルフホスト、BYOK などが提供対象として整理されています。まず OSS 版で PoC を回し、稟議通過や継続運用を見据えて SaaS 版 / エンタープライズ版に切り替える、という段階的な導入も想定できます。
導入時の前提と注意点
意思決定の最終フェーズとして、Strix を実際に導入する場合の前提条件と注意点を整理します。ここで挙げる項目は稟議や社内合意を得るうえで必須の判断材料です。
動作前提(Docker・LLM API キー・推奨モデル)
README および 公式ドキュメント(docs.strix.ai) の記載を整理すると、動作前提は以下の通りです。
- LLM API キー: OpenAI / Anthropic / Google Vertex AI / AWS Bedrock / Azure OpenAI / OpenRouter / Novita AI / セルフホスト(ローカル)に対応。LiteLLM を経由するため、環境変数で切り替え可能
- 推奨モデル(README 記載): OpenAI GPT-5.4(
openai/gpt-5.4)、Anthropic Claude Sonnet 4.6(anthropic/claude-sonnet-4-6)、Google Gemini 3 Pro Preview(vertex_ai/gemini-3-pro-preview) - サンドボックス: Python サンドボックスや Caido ベースのプロキシなどを内包しているため、Docker 環境での実行が実質的な前提になります
LLM 費用は実行対象・スキャン深度・選択モデルによって変動します。README 上では固定金額の記載はなく、費用感の見積もりは自プロジェクトでの PoC 実行を通じて把握することが推奨されるアプローチです。
ライセンスと商用利用(Apache-2.0)
Strix は Apache-2.0 ライセンスで公開されています。Apache-2.0 は商用利用・改変・再配布・特許ライセンスの明示を認める寛容型ライセンスで、同ライセンス採用の他 OSS 同様、商用プロダクトへの組み込みが可能です。ただし、著作権表示と NOTICE ファイルの保持義務があるため、社内利用にとどまらず外部配布を伴う場合はライセンス条項の遵守を確認してください。
比較対象の 3 OSS のライセンス構成を並べると、判断のしやすさに差があります。
- Strix: Apache-2.0 の単一ライセンス。商用・本番利用ともに追加契約は不要
- PentAGI: MIT の単一ライセンス。同じく商用利用しやすい寛容型
- CAI: MIT(
src/cai/agents/配下)+ Alias Robotics 独自の研究用ライセンス(src/caiのコア部分は研究・学術用途に限定)のデュアル構成。商用・本番利用には Alias Robotics との別途商用ライセンス契約が必要(CAI 公式 LICENSE)
稟議通過や継続運用を見据えたときに、ライセンス条件を一度で確認できる Strix と PentAGI に対して、CAI は追加契約のリードタイムを見込む必要があります。導入計画の初期段階でこの差を把握しておくと、後工程での手戻りを避けられます。
倫理・法的責任(README WARNING の要点)
Strix の README には明示的な WARNING セクションがあり、以下の点が強調されています。
- 所有または明示的な許可を得たアプリケーションに対してのみテストを実行すること
- 利用に伴う倫理的・法的責任は利用者側にあること
- 攻撃対象の同意なくスキャンを実行することは、多くの国・地域で違法行為に該当し得ること
CI/CD へ組み込む場合も、対象アプリのオーナーシップとテスト同意を明文化することが前提です。特に外部委託先が管理するインフラや、SaaS プロバイダが提供する API に対しては、事前の書面合意が必要になるケースがあります。導入前に法務・情シスとの整合を取ることを強く推奨します。
導入判断を最終確認する際は、usestrix/strix の README と 公式ドキュメント(docs.strix.ai) を一次情報として参照するのが確実です。
まとめ
Strix は、GitHub Stars 36,243・Apache-2.0 ライセンス・Python 実装のオープンソースで、自律 AI エージェントが実際の攻撃を試みて脆弱性を検出・PoC 生成するペネトレーションテストツールです。アーカイブされておらずフォーク元でもない本流リポジトリで、直近もアクティブに開発されていることが GitHub API のメタデータから確認できます。
意思決定の要点を整理すると次のようになります。
- 開発者ワークフロー統合(GitHub Actions で PR 単位に回したい)を最優先するなら Strix が第一候補
- 完全 air-gapped でローカル LLM 前提、あるいはフレームワークとして自作エージェントを組み立てたい場合は CAI を検討
- Web UI 中心の運用や Go 実装環境を好むなら PentAGI を検討
- OSS 版で PoC を回し、稟議通過後は SaaS 版・エンタープライズ版へ段階的に移行するのが現実的
導入の次アクションとしては、まず usestrix/strix の README と 公式ドキュメント(docs.strix.ai) を精読し、自プロジェクトの CI/CD で PR 差分スキャンの PoC を立てるところから始めるのがおすすめです。LLM 費用の実測と、対象アプリのテスト同意プロセスの整備を並行して進めれば、稟議通過に必要な材料が揃います。



