AI時代のシステム開発見積もりはどう変わる?発注者が押さえるべき評価基準を解説

「AIツールを活用するので、開発費を削減できます」——最近、複数の開発会社に見積もりを依頼すると、このような説明を受ける機会が増えてきました。GitHub CopilotやCursorといったAI Codingツールが普及し、開発現場での活用が広がっているのは事実です。
しかし、システム開発を外注する立場から見ると、この説明は判断しにくいのが正直なところです。「本当に安くなるのか?」「どの程度の削減が妥当なのか?」「AI活用を理由に、実際は割高な見積もりを出されていないか?」——こうした疑問を持ちながらも、技術的な詳細が分からなければ確認のしようがありません。
この困惑は当然です。AI Codingツールは確かに開発効率を高めますが、その効果は工程によって大きく異なります。「全体的に安くなる」というわけではなく、削減される部分と変わらない部分が明確に存在します。この構造を理解することが、見積もりを正しく評価するための第一歩です。
本記事では、AI Codingツールが具体的に何をどれだけ効率化するのか、開発工程のどこに影響があってどこには影響がないのかを整理します。そのうえで、「AI活用で安くなります」という提案を発注者が評価するための実践的なチェックリストをお伝えします。

目次
失敗しないためのシステム開発の考え方と開発パートナー選定チェックリスト

この資料でわかること
こんな方におすすめです
AI Codingツールとは何か、何を自動化するのか

GitHub Copilot・Cursorが担う「コーディング補助」の実態
GitHub CopilotやCursorは、エンジニアがコードを書く作業を補助するツールです。開発者がコードを書き始めると、AIが続きの候補を提示し、それをそのまま使うか修正するかを判断します。また、自然言語で「こういう機能を作りたい」と入力すると、それに対応するコードを自動生成することもできます。
具体的には、次のような作業を補助します。
- 定型的なコードの生成: データベースとのやり取り(データの取得・保存・更新・削除)や、ユーザー認証、ファイルの読み書きなど、パターンが決まっている処理の実装
- コードの補完: 関数の途中まで書くと、残りの部分を自動で提案
- コードの説明・翻訳: 既存のコードが何をしているか説明させたり、別のプログラミング言語に変換したり
- テストコードの生成: 実装したコードに対するテストコードを自動生成
これらのツールはあくまで「コーディング」という作業を補助するものです。システム全体の設計、要件定義、業務フローの整理、クライアントとのコミュニケーションには直接関与しません。
AI Codingツールが自動化できること・できないこと
対応可能(効率化される作業) |
対応不可(変わらない作業) |
|---|---|
定型的なコード実装(CRUD処理等) |
要件定義・業務フローの整理 |
ボイラープレートコードの生成 |
システム設計・アーキテクチャ設計 |
コード補完・候補提示 |
複雑なビジネスロジックの設計 |
テストコードの一部生成 |
レガシーシステムの調査・把握 |
コードのリファクタリング支援 |
プロジェクト管理・進捗管理 |
ドキュメントコメントの生成 |
クライアントとの仕様調整 |
この「できること・できないこと」の区別が、見積もり評価の核心です。
開発工程のどの部分が変わり、どの部分は変わらないのか

システム開発は複数の工程から成り立っています。それぞれの工程にAI Codingツールがどう影響するかを見ていきます。
要件定義・設計フェーズ - AI Codingツールの影響は限定的
要件定義は、「何を作るか」を決める工程です。発注者のビジネス課題を聞き取り、必要な機能・画面・データの流れを整理します。このフェーズでの主な作業は、関係者との会議、業務フローの整理、ドキュメント作成です。
設計フェーズは、要件定義を受けて「どう作るか」を決める工程です。システム全体の構成(アーキテクチャ)、データベースの設計、画面の設計を行います。
これらのフェーズは、AI Codingツールの恩恵をほとんど受けません。理由は単純で、コードを書く作業がほとんど発生しないからです。コーディング補助ツールは、あくまでコードを書く作業を補助するものです。「何を作るか」「どう設計するか」という判断は、依然としてエンジニアの経験と専門知識に依存します。
コーディングフェーズ - 工数削減の実態と限界
コーディングフェーズ(実装フェーズ)こそ、AI Codingツールが最も効果を発揮する工程です。
複数の企業での導入事例では、コーディング工数の10〜30%程度が削減されたという報告が見られます。日立製作所の評価では「コーディングと単体テストの領域で平均10〜20%、ケースによっては30%の生産性向上効果が得られている」とされています(出典: Microsoft Customer Stories, 2024年)。
ただし、この削減効果は案件の性質によって大きく異なります。
効果が高いケース:
- 新規Webアプリケーション開発(標準的なCRUD処理が多い)
- ゼロから始めるプロジェクトで、定型的な処理が多い場合
- TypeScript・Python・JavaScriptなどメジャーな言語での開発
効果が限定的なケース:
- 既存の複雑なシステムへの機能追加・改修
- 独自のビジネスロジックが複雑に絡み合っている部分
- レガシーシステムとの連携(古い技術・独自仕様)
- ニッチな技術スタックや社内独自フレームワークを使う場合
一方、注意すべきデータもあります。AI安全研究機関のMETRが2025年に実施したランダム化比較試験では、大規模なオープンソースプロジェクトに精通した経験豊富な開発者16名を対象に調査した結果、AIコーディングツールを使用した開発者は使用しない場合と比べて19%遅くなったという結果が出ました(METR, 2025年7月)。興味深いのは、開発者自身は「20%速くなった」と感じていた点です。
これは「AIツールを使うと必ず速くなる」というわけではないことを示しています。特に自分が熟知しているコードベースでは、AIへの指示出しやAIの出力を確認する時間がかえってオーバーヘッドになる場合があります。
テスト・品質保証フェーズ - むしろ重要性が増す場合も
テストフェーズは、実装したシステムが仕様通りに動くか確認する工程です。
AIが生成したコードは一見正しく見えても、微妙なバグや想定外の動作を含む場合があります。特に、AIは「それっぽいコード」を生成するのが得意ですが、自社固有のビジネスルールや例外ケースを正確に反映できているかどうかは、人間がテストで確認する必要があります。
そのため、AI Codingツールの活用が進むほど、テスト工程の重要性は高まる、あるいは変わらないというのが現場での実感です。「AIが書いたから大丈夫」という過信は禁物です。
コーディング工数削減の「実態」と「限界」

効果が高いケース - 新規開発・標準的な機能
AI Codingツールの恩恵を受けやすいのは、以下のような案件です。
- 新規Webサービス・アプリの開発: ゼロから作るため、定型的なコードが多い。ユーザー認証、商品一覧・詳細ページ、カート・決済機能など、同様の機能を過去に多くの開発者が実装しており、AIの学習データが豊富
- 管理画面・ダッシュボードの開発: データの一覧表示・検索・編集・削除といった、パターンが決まった操作の実装
こうした案件では、20〜30%程度のコーディング工数削減が期待できる場合があります。ただし、コーディングが全体工数の40〜50%程度(Sun Asterisk, システム開発の工程比率)とすれば、全体では20%×40〜50%=8〜15%程度の見積もり削減が現実的な範囲です。
効果が限定的なケース - 複雑なビジネスロジックとレガシー連携
一方、次のようなケースでは削減効果が限定的になります。
- 複雑な業務ロジック: 「この条件の場合はA、ただしB社の場合はC、さらに月末なら特例でD」といった、自社固有の複雑なルールが絡み合うビジネスロジックは、AIが正確にコード化するのが難しい。実装した後の確認・修正にむしろ工数がかかる場合も
- レガシーシステムとの連携: 古い技術(数十年前の言語・フレームワーク)や、ドキュメントが整っていない独自仕様のシステムと連携する場合、AIは助けにならないことが多い。むしろ既存システムの調査・把握に多くの工数がかかる
- セキュリティが厳しい領域: 金融・医療・個人情報を扱うシステムでは、AIが生成したコードのセキュリティ検証に通常以上の手間が必要
「AIで87%削減」といった数字をどう読むか
「AIツール活用でプロジェクト工数を87%削減」といった数字を見かけることがあります。これは事実ですが、文脈を理解することが重要です。
87%という削減率を実現したケース(トランスコスモスの「VibeOpsメソッド」)は、従来15.5人日の案件を1.5人日で完了させたものです。ただし、これは「定型的なWebサイト制作」に近い案件で、かつ厳格な品質管理プロセスを伴っています。すべてのシステム開発案件でこのような削減が実現するわけではありません。
「AI活用」の提案を受けた際は、その削減率がどのような案件・工程で達成されたものなのかを確認することが重要です。
発注者が見積もりを評価する際の新しい視点
従来の見積もり評価と何が変わったか
従来のシステム開発見積もりは、主に「工数(人月・人日)×単価」で計算されていました。発注者の評価ポイントも、工数の根拠(機能ごとの工数内訳)と単価の妥当性でした。
AI Codingツールが普及した現在、これに加えて「AI活用の効果がどの工程にどの程度反映されているか」という視点が必要になりました。
「AI活用」の提案で確認すべき4つのポイント
ポイント1: 削減される工程が具体的に示されているか
「AI活用で工数削減」という説明に対して、「具体的にどの工程の工数を何%削減する計画ですか?」と確認しましょう。コーディング工程での削減であれば根拠のある提案ですが、「全体的に削減できます」という説明は曖昧で、根拠として不十分です。
ポイント2: 削減されない部分も説明されているか
誠実な開発会社は、AI Codingツールの限界についても説明します。「要件定義・設計フェーズはAIの影響を受けないため、この部分の工数は変わりません」「御社の業務ロジックが複雑なため、コーディング工数の削減効果は限定的です」といった説明があるかどうかが、信頼性の指標です。
ポイント3: AIツールの費用の扱いが明示されているか
GitHub Copilot(月額$10〜19/人)やCursor(月額$20/人)などのツール費用は、開発費用に含まれているのか別途請求なのかを確認しましょう。多くの場合、ツール費用は開発者の費用に含んで計上されますが、明確にしておくべきです。
ポイント4: 案件の性質を考慮しているか
前述の通り、AI Codingツールの効果は案件の性質によって大きく変わります。新規開発か既存システムの改修か、ビジネスロジックの複雑さ、レガシーシステムとの連携有無——これらを考慮した上での工数削減率を提示しているかを確認しましょう。
複数社見積もり比較時の注意点
「AI活用で安くなります」という会社と「AIを活用しない」という会社の見積もりを比較する場合、単純な金額比較では適切な判断ができません。
AI活用の開発会社の見積もりが安い場合でも、それがテスト工程や設計工程の手抜きによるものであれば、後工程でのトラブルリスクが高まります。反対に、AI Codingツールを活用していない場合でも、経験豊富なエンジニアによる丁寧な開発が必ずしも割高とは限りません。
比較する際は、各社の見積もりが工程別に内訳を示しているかを確認し、全体金額だけでなく工程ごとの工数・単価を比較することが重要です。
「AI活用で安くします」という提案をどう評価するか
信頼できる「AI活用見積もり」の特徴
次のような提案は、誠実さと専門性の高さを示しています。
- 工程別の工数内訳が明示されている: 「要件定義: 5日、設計: 10日、コーディング: 20日(AI活用で従来比20%削減)、テスト: 10日」のように、工程ごとの工数が示されている
- 削減根拠が具体的: 「弊社では月次で開発効率を計測しており、類似案件での実績として、新規Webアプリ開発のコーディング工数を平均15%削減しています」のような実績に基づく根拠
- 限界についても正直に話す: 「御社のシステムが既存の基幹システムと連携する部分は、AI Codingツールの効果が限定的です。この部分については工数削減を見込んでいません」
- AIツール費用の扱いが明確: ツール費用の扱いについて明示している
注意すべき「AI活用見積もり」のパターン
逆に、次のようなパターンには注意が必要です。
- 根拠のない大幅削減: 「AI活用で費用を50%削減できます」と言いながら、その根拠(どの工程で、どういう根拠で)を示せない
- AI活用をアピールしながら工数が変わらない: AIツールを使うと言いながら、見積もり金額が他社と比べて高い。ツール費用が二重計上されている可能性
- テスト工程が極端に少ない: コーディング工数は削減されているが、テスト工数も比例して削減されている。品質保証が不十分なリスクがある
- AI活用の実績が示されない: 「最新のAIを使います」とだけ言って、具体的な活用実績・社内体制・ツール名が不明
秋霜堂株式会社のAI Coding活用における考え方
秋霜堂株式会社では、GitHub CopilotやCursorなどのAI Codingツールを開発現場で活用しています。その中で実感しているのは、「効果がある部分」と「効果が限定的な部分」の区別です。
標準的な新規Webアプリケーション開発のコーディング工程では、定型処理を中心に一定の工数削減ができています。一方、要件定義・設計フェーズはAIツールの影響をほとんど受けず、複雑なビジネスロジックやレガシーシステム連携部分も削減効果が限定的です。
そのため、見積もりにAI活用の効果を反映する際は、案件の性質を十分に分析した上で、削減できる部分に絞って適切に反映することが誠実な対応だと考えています。
AI時代の見積もり評価チェックリスト

「AI活用で安くなります」という提案を受けた際に、以下の項目を確認することで、提案の妥当性を判断できます。
見積もり内容の確認項目
チェック項目 |
確認ポイント |
|---|---|
1. 削減工程の明示 |
どの工程(コーディング等)で何%削減するか、具体的に説明されているか |
2. 工程別内訳 |
要件定義・設計・コーディング・テストそれぞれの工数が内訳として示されているか |
3. 削減の根拠 |
過去の類似案件での実績や、具体的な計測データがあるか |
4. 削減されない部分の説明 |
AI Codingツールの限界(設計・要件定義・複雑なビジネスロジック等)についても言及されているか |
5. ツール費用の扱い |
GitHub CopilotやCursorなどのツール費用の扱いが明示されているか |
6. 案件特性への言及 |
自社案件の特性(新規か改修か、ビジネスロジックの複雑さ、レガシー有無)を踏まえた説明があるか |
7. テスト工程の充実度 |
AIコード生成を前提とした場合でも、テスト工程の工数が適切に確保されているか |
8. AI活用実績の提示 |
自社でのAIツール活用実績や社内体制について具体的な情報があるか |
判断の目安
チェック項目のうち、1・2・4・7の4項目は特に重要です。これらが説明できない場合、提案の信頼性に疑問符がつきます。
また、AI活用を前提とした見積もりが他社より10〜15%程度安い場合は合理的な範囲です。20%以上安い場合は、工程の省略がないか確認が必要です。50%以上の大幅削減を謳う場合は、その根拠と対象工程を詳しく確認することをおすすめします。
AI Codingツールの普及は、システム開発の現場を確実に変えつつあります。ただしその変化は「全体的にコストが下がる」というものではなく、「特定の工程で効率化が進み、設計・品質保証の重要性は変わらない」というものです。
この構造を理解することで、「AI活用で安くします」という提案を適切に評価できるようになります。提案の内容を工程別に確認し、削減の根拠と限界について誠実に説明できる開発会社を選ぶことが、AI時代の発注者として大切な視点です。
失敗しないためのシステム開発の考え方と開発パートナー選定チェックリスト

この資料でわかること
こんな方におすすめです
作業時間削減
システム化を通して時間を生み出し、ビジネスの加速をサポートします。
システム開発が可能に









