業務委託エンジニアをKPIで評価する方法｜感覚評価から脱却する5つの定量指標と設計手順

●Contact

お問い合わせ

ご質問・ご相談など、まずはお気軽に
お問い合わせフォームより無料お問い合わせください。

エンジニア2026.05.26更新：2026.06.23

業務委託エンジニアをKPIで評価する方法｜感覚評価から脱却する5つの定量指標と設計手順

業務委託エンジニアの成果を感覚ではなく数字で評価したい発注企業向けに、KPI設計の5つの定量指標と4ステップの実務手順を解説します。契約継続・単価交渉・追加発注の意思決定を、社内に説明できる根拠で支える評価フレームワークが分かります。

石川瑞起

Representative Director

読了 30分/ 11,891 文字

業務委託エンジニアをKPIで評価する方法｜感覚評価から脱却する5つの定量指標と設計手順

「業務委託エンジニアに月70万円払っているが、本当に成果が出ているのか説明してほしい」——契約更新月が近づくと、経営層からこうした問いを投げかけられる開発マネージャーやプロダクトマネージャーは少なくありません。社内エンジニアであれば人事評価制度があり、上司の主観だけでなく目標管理（MBO）や360度評価で多面的に評価できます。しかし業務委託エンジニアには、こうした制度がそのまま使えません。

正社員と同じ評価制度を適用しようとすると、契約形態によっては偽装請負と判定されるリスクすらあります。一方で「なんとなくうまく回っている」という感覚評価のままでは、契約更新・単価交渉・追加発注といった重要な意思決定を、社内に説明できる根拠を持って行えません。経営層に「これが成果です」と数字で示せないことが、多くの発注担当者の悩みの種になっています。

この記事では、業務委託エンジニアの貢献度を定量的に評価するためのKPI設計を、発注企業の視点で整理します。契約形態ごとに評価可能な指標の違い、Four Keysを発注側向けに翻訳した5つの定量指標、自社に落とし込む4ステップの実務手順、そしてやってはいけない3つの失敗パターンまで、明日から使える形で解説します。

読み終えるころには、業務委託エンジニアの成果を「感覚」ではなく「数字に基づく根拠」で語れる状態を目指します。経営層への説明、本人との単価交渉、追加発注の意思決定に自信を持って臨めるよう、評価フレームワークの全体像を一緒に整理していきましょう。

Contents — 目次

なぜ業務委託エンジニアのKPI評価は難しいのか
業務委託エンジニアKPI評価の前提：契約形態別の評価可能範囲
業務委託エンジニアを評価する5つのKPI指標
KPI設計の実務手順：4ステップで自社に落とし込む
KPI評価でやってはいけない3つの失敗パターン
KPI評価を活用した意思決定の具体例
まとめ：感覚評価から数字に基づく意思決定へ

—Workee for Business / 発注者向け

Workee で
開発リソースを探す。

募集を出すだけで AI が相性の高いフリーランスエンジニアを提案。掲載・初期費用 0 円、成約まで完全成功報酬で始められます。

StyleAI マッチング型

Fee掲載 0 円・成功報酬

Service案件登録から契約まで

Post a job

Workee for Business

なぜ業務委託エンジニアのKPI評価は難しいのか

業務委託エンジニアの評価が難しいのは、発注担当者のスキル不足や努力不足が原因ではありません。正社員とは構造的に異なる前提があるため、社内の人事評価制度をそのまま流用できないという、制度設計上の難しさがあるのです。まずは「なぜ難しいのか」を構造的に整理することで、評価設計の出発点を明確にしましょう。

発注企業が抱える「評価できない」3つの構造的課題

業務委託エンジニアの評価を難しくしている要因は、大きく3つに整理できます。

1つ目は、労務管理権がないことです。 業務委託契約（準委任契約・請負契約）では、発注企業は受託者に対して指揮命令権を持ちません。これは法律上の取り決めで、発注者が業務委託エンジニアの勤怠・作業時間・作業順序を直接管理すると、偽装請負と判定されるリスクがあります（出典: 厚生労働省「労働者派遣・請負を適正に行うためのガイド」）。つまり「何時間働いたか」「何時に出社したか」という、社員評価で使う指標の多くがそのままでは使えません。

2つ目は、成果物の境界が曖昧なことです。 業務委託エンジニアは多くの場合、社内のエンジニアやプロダクトマネージャーと協働してプロダクトを作ります。出力されたコードや機能のうち「どこからどこまでが業務委託エンジニアの成果か」を切り分けるのは容易ではありません。GitHubのコミット履歴を見ても、ペアプログラミングやレビューを経て生まれた成果は、誰か一人の貢献として計上しづらいのが実情です。

3つ目は、プロジェクト型で短期評価が困難なことです。 業務委託は数ヶ月〜1年程度の契約で、社員評価のように半期・通期で振り返るサイクルが回りません。3ヶ月の契約期間中に評価サイクルを2回回そうとすると、評価のための工数がプロジェクトを圧迫します。短期間で意味のある評価をするには、評価指標そのものを「短期で測定可能なもの」に絞り込む必要があります。

感覚評価のリスク（過大支出・優秀人材の離脱・社内説明責任）

「うまく回っているから良しとしよう」という感覚評価は、一見コストがかからず合理的に見えますが、実は3つの大きなリスクを抱えています。

過大支出のリスク：成果が出ていないのに継続している契約、あるいは市場相場より割高な単価のまま放置している契約があっても、定量評価がなければ気づけません。月70万円の契約が3名分あれば、年間2,520万円の支出です。市場感に対して20%割高だった場合、年間500万円以上の余分な支出が発生していることになります。

優秀人材の離脱リスク：定量評価がないと、優秀な業務委託エンジニアにも凡庸な評価しか伝えられません。「あなたのこの成果が、こういう数字で組織に貢献しています」というフィードバックがないと、優秀な人材ほど「自分の貢献が見えていない発注企業」から離れていきます。代替の業務委託エンジニアを採用し直すコストは、相場で月単価10〜20万円のアップを伴うこともあります。

社内説明責任のリスク：もっとも切実なのは、経営層や財務部門に対して「この外注費の妥当性」を説明できないことです。「成果は出ています」と言うだけでは、コスト削減圧力の前では説得力を持ちません。次の予算編成で外注予算を確保するためにも、定量的な成果報告は不可欠です。

業務委託エンジニアKPI評価の前提：契約形態別の評価可能範囲

KPI設計に入る前に、必ず押さえておくべき前提があります。それは「契約形態によって、評価指標にしてよいものとしてはいけないものが異なる」という事実です。この前提を無視してKPIを設計すると、偽装請負リスクを抱え込むことになります。

準委任契約で評価できる指標／できない指標

準委任契約は、業務の遂行そのものを目的とする契約で、エンジニア領域では最も多く使われる契約形態です。準委任契約には「履行割合型」と「成果完成型」の2種類があり、いずれも受任者には善管注意義務（民法第644条）と報告義務（民法第645条）が課されます（出典: Workship ENTERPRISE「準委任契約の成果物責任とは？」）。

評価できる指標は、業務遂行の質に関するものです。たとえば、合意したスコープに対する進捗報告の正確性、定例ミーティングでの提案の妥当性、引き渡されたドキュメントの完成度などです。これらは善管注意義務の履行状況を測るものとして、契約上も整合性があります。

評価しにくい指標は、勤怠や作業時間そのもの、作業の進め方を細かく管理する類のものです。「何時から何時まで作業したか」「どのチケットから着手するか」を発注者が指示・評価するのは、指揮命令と見なされるリスクがあります。

請負契約での評価ポイント（成果物ベース）

請負契約は、特定の成果物の完成を目的とする契約で、受託者は契約不適合責任（旧・瑕疵担保責任）を負います。請負契約での評価は、シンプルに「合意した成果物が、合意した品質基準を満たして納品されたか」に集約されます。

評価指標として有効なのは、納期遵守率、検収一発合格率、納品後の不具合発生件数（契約不適合に該当するもの）、ドキュメント・テスト成果物の完備状況です。請負契約ではプロセスではなく「結果」を評価するため、業務委託エンジニアの作業時間や進め方は評価対象になりません。

ただし、請負契約は完成リスクを受託者が負うため、単価が高くなる傾向があります。発注前に「本当にスコープを固定できるか」を慎重に検討する必要があります。

偽装請負を避けるためのKPI設定上の注意

厚生労働省のガイドラインによれば、請負契約・準委任契約であっても、発注者と労働者の間に指揮命令関係があると認められる場合は偽装請負と判定されます（出典: 厚生労働省「労働者派遣・請負を適正に行うためのガイド」）。

KPI設定で特に注意すべきは、以下の3点です。

第一に、個人単位ではなく成果単位で評価することです。「Aさんは何時間働いたか」を評価するのではなく、「合意したスコープのうち何%が完了したか」「品質基準を満たした成果物が何件納品されたか」を評価軸にします。

第二に、業務委託エンジニア本人ではなく受託会社（または個人事業主としての契約相手）に対して評価を伝えることです。SES契約や法人格を持つフリーランスとの契約では、評価のフィードバックは「個人への人事評価」ではなく「契約相手への業務報告」として位置づけます。

第三に、作業の進め方を細かく指示・評価する設計を避けることです。たとえば「毎朝9時のスタンドアップに必ず参加すること」「タスクは必ずチケット番号順に処理すること」のような業務遂行プロセスへの指示は、指揮命令と判定されるリスクがあります。一方、「週次でアウトプット報告を行うこと」「合意した品質基準を満たすこと」といった成果に対する合意は問題ありません。

法的に微妙な判断が必要な場合は、社内法務または労務領域の弁護士への確認をおすすめします。

業務委託エンジニアを評価する5つのKPI指標

ここからが記事の核心です。発注企業が業務委託エンジニアを評価する際に、実務的に使える5つのKPI指標を紹介します。これらの指標は、開発生産性の国際標準である「Four Keys」（DORAが提唱する4つの指標）を発注側向けに翻訳し、業務委託特有の貢献を加えた構成になっています。

Four Keysのエリート水準（デプロイ頻度が1日複数回・リードタイムが1時間未満・変更失敗率5%以下・平均復旧時間1時間未満）は、開発生産性の国際的なベンチマークとされています（出典: Octopus Deploy「Understanding The 4 DORA Metrics And Top Findings From 2024/25 DORA Report」）。ただし、これは外資系大規模IT企業も含めた世界水準であるため、中小・中堅企業ではより現実的な目標値を設定する必要があります。

KPI1：デプロイ頻度・リードタイム（開発スピードの可視化）

デプロイ頻度は、コードが本番環境に届く回数を表す指標です。週に何回リリースできているかを見ます。リードタイムは、コードの変更が始まってから本番環境に届くまでにかかる時間を表します。プルリクエストの作成からマージ・デプロイまでの所要時間と捉えると分かりやすいでしょう。

業務委託エンジニアにとってのこの指標の意味は、「変更を小さく分割し、安全に・頻繁にリリースできているか」という開発スタイルそのものを表します。大きな機能を一気にリリースするスタイルは、レビュー負荷も障害リスクも高くなりがちです。

数値目標の参考値：中小企業の業務委託エンジニア活用シーンでの実務的な目安は、デプロイ頻度が週1回以上、リードタイムが2〜3日以内に収まっていれば「健全」と判断できます。Four Keysのエリート水準（1日複数回・1時間未満）は、CI/CDが高度に自動化された組織を前提とした水準であるため、自社の自動化レベルに応じて目標値を調整しましょう。

測定方法：GitHub・GitLabなどのバージョン管理ツールに記録されたコミット履歴・プルリクエスト履歴・デプロイ履歴から自動集計できます。Findy Team+ などの可視化ツールを使えば、業務委託エンジニア個人ではなく「プロジェクト全体のスピード」として測定可能です。

KPI2：変更失敗率・平均復旧時間（品質と安定性）

変更失敗率は、本番にリリースした変更のうち、何%が障害・不具合・ロールバックを引き起こしたかを示します。平均復旧時間（MTTR: Mean Time To Recovery）は、本番障害が発生してから復旧するまでにかかった平均時間です。

この指標の意味は、「スピードを出した結果、品質が犠牲になっていないか」を確認することです。デプロイ頻度だけ上げても、そのたびに障害が増えるようでは意味がありません。スピードと品質はトレードオフではなく、両立してこそ価値が出ます。

数値目標の参考値：中小企業の現実的な目安として、変更失敗率10〜15%以下、MTTR数時間以内であれば許容範囲と考えられます。Four Keysのエリート水準（失敗率5%以下、MTTR1時間以内）は、十分な監視体制とロールバック自動化を前提とした水準であるため、まずは「徐々に下げていく」改善傾向を見る運用が現実的です。

測定方法：障害管理ツール（PagerDuty・Sentry・Datadog等）の記録、または社内の障害対応ログから集計します。これらのツールがない場合は、Slackの障害対応チャンネルやNotionのインシデント記録から手動集計しても構いません。

KPI3：チケット消化率・予実差異（コミットメント達成度）

チケット消化率は、スプリント開始時に「やる」と合意したチケットのうち、期間内に完了した割合です。予実差異は、見積もり工数と実工数の乖離率を表します。

この指標の意味は、「業務委託エンジニアが、自分の能力を正確に把握し、現実的な計画を立てて、それを完遂できているか」を測ることです。常に未達であれば見積もりが楽観的すぎるか、想定外のブロッカーが多発しているかのどちらかです。常に大幅超過であれば、見積もりが保守的すぎてキャパシティを使い切れていない可能性があります。

数値目標の参考値：チケット消化率80〜95%、予実差異±20%以内であれば健全な計画精度といえます。100%消化を強要すると、計画段階で過度に保守的な見積もりが行われ、結果的に投入工数あたりの成果が下がるため、80%以上で良しとする運用がおすすめです。

測定方法：Jira・Linear・Notion・GitHub Projectsなどのチケット管理ツールから集計します。スプリント単位で集計できる仕組みを整えておくと、評価工数を最小化できます。

KPI4：コードレビュー貢献度・ドキュメント整備度（チーム貢献）

ここから「個人の成果」だけでなく「チームへの貢献」を測る指標に移ります。コードレビュー貢献度は、業務委託エンジニアが他メンバーのプルリクエストに対して行ったレビューコメントの件数・質を表します。ドキュメント整備度は、設計書・運用ドキュメント・READMEなどの整備に対する貢献度です。

この指標の意味は、「業務委託エンジニアがチームの一員として知識共有・品質向上に貢献しているか」を確認することです。優秀な業務委託エンジニアほど、自分が抜けても困らないように知識を残します。逆に、ドキュメントを残さず属人化を進める業務委託エンジニアは、契約終了後に大きな技術負債を残します。

数値目標の参考値：週あたりレビュー件数3〜5件、四半期あたり主要ドキュメント1〜2件の更新があれば健全な貢献といえます。ただし、契約スコープに「ドキュメント整備」を明示的に含めていない場合は、これを必達指標にすると契約スコープ違反のリスクがあるため、参考指標として扱います。

測定方法：GitHubのレビューコメント数、Notion・Confluenceの更新履歴から集計可能です。

KPI5：仕様提案・改善提案件数（付加価値貢献）

最後の指標は、業務委託エンジニアの「言われたことをやる以上の付加価値」を測ります。仕様提案・改善提案件数は、要件定義・設計レビュー・運用改善において、業務委託エンジニア側から能動的に出された提案の件数・採用件数です。

この指標は、業務委託エンジニアを「外部リソース」ではなく「専門家」として活用できているかを測る指標です。月単価70万円のシニアエンジニアと月単価40万円のジュニアエンジニアの違いは、コードを書くスピードだけでなく「経験に基づく提案ができるか」という点にあります。提案がゼロの状態が続くなら、その単価設定そのものを見直す必要があるかもしれません。

数値目標の参考値：月1〜2件以上の提案、四半期で1件以上の採用提案があれば、付加価値が出ていると評価できます。

測定方法：定例ミーティングの議事録、改善提案のチケット起票数から集計します。社内に「業務委託エンジニアからの提案ログ」を残す習慣をつけると、評価時に振り返りやすくなります。

KPI設計の実務手順：4ステップで自社に落とし込む

5つのKPI指標を理解したら、次は自社に落とし込む手順です。すべての指標を一度に導入する必要はありません。プロジェクトの目標と契約形態に応じて、優先順位をつけて段階的に導入しましょう。

ステップ1：プロジェクト目標から逆算してKPIを選ぶ

まず、業務委託エンジニアに何を期待しているかを、プロジェクト目標として言語化します。たとえば「3ヶ月後にβ版を出す」「既存システムの性能を50%改善する」「保守運用を安定化させる」など、プロジェクトのゴールはプロジェクトごとに異なります。

ゴールに応じて重点KPIが変わります。

プロジェクト目標	重点KPI
新規プロダクト立ち上げ（スピード重視）	KPI1（デプロイ頻度・リードタイム）、KPI3（チケット消化率）
既存システム改善（品質重視）	KPI2（変更失敗率・MTTR）、KPI4（ドキュメント整備度）
専門領域の助言・設計支援	KPI5（仕様提案・改善提案件数）、KPI4（コードレビュー貢献度）
保守運用（安定性重視）	KPI2（変更失敗率・MTTR）、KPI4（ドキュメント整備度）

すべてのKPIを5つ並列で運用しようとせず、重点2〜3指標を選び、残りは参考指標として軽く確認する運用にすると、評価工数を抑えられます。

ステップ2：契約書・SLAに評価基準を明文化する

選定したKPIは、契約書または別紙SLA（サービスレベルアグリーメント）に明文化します。口約束で評価基準を運用すると、契約更新時に「そんな話は聞いていない」というトラブルになります。

契約書・SLAに記載すべき要素は次のとおりです。

対象KPI（例: デプロイ頻度・チケット消化率）
目標値（例: デプロイ頻度週1回以上、チケット消化率 80%以上）
測定方法（例: GitHub履歴から自動集計、Jiraから手動集計）
測定期間（例: 月次・四半期）
未達時の取り扱い（例: 業務改善ミーティングの実施、契約更新時の協議）

特に重要なのは、「未達時の取り扱い」を即時契約解除ではなく協議事項に位置づけることです。即時契約解除条項を入れると、KPIが業務委託エンジニアにとって過度なプレッシャーになり、安全策ばかりを取る行動を誘発します。詳細はのちほどの「やってはいけない3つの失敗パターン」で説明します。

ステップ3：月次レビューミーティングで合意形成する

契約書に書いただけでは運用は回りません。月次のレビューミーティングを設定し、業務委託エンジニアと一緒に数値を確認します。

このミーティングのポイントは、「評価する側／される側」という構図ではなく、「一緒に振り返るパートナー」という構図を作ることです。指揮命令と見なされるリスクを避けつつ、率直なフィードバックを引き出すための場づくりが大切です。

具体的な議事進行例は次のとおりです。

数値共有（5分）：今月のKPI測定値を共有する
背景の確認（10分）：数値の背景にあるイベント（連休・障害対応・スコープ追加など）を確認する
改善アクションの合意（10分）：双方が合意できる改善アクションを決める
次月のフォーカス確認（5分）：来月の重点KPIを再確認する

このミーティングの議事録は、契約更新時の意思決定の根拠資料として保管しておきます。

ステップ4：契約更新・単価交渉の判断基準として運用する

3〜6ヶ月分のKPI測定データが蓄積されたら、契約更新・単価交渉の判断基準として活用します。次の章で具体的な意思決定例を見ていきますが、ここで強調しておきたいのは、KPIは「機械的に判断するため」ではなく「説明可能な判断をするため」のツールであるという点です。

KPIが目標未達でも、その背景に「経営側のスコープ追加」「他チームの遅延」など発注側の責任要因があれば、業務委託エンジニアの責任ではありません。KPIは判断の「材料」であり、「結論」ではないことを意識して運用しましょう。

KPI評価でやってはいけない3つの失敗パターン

KPIを導入する企業の多くが陥る失敗パターンを、3つ紹介します。これを先に知っておくことで、運用設計の段階で罠を避けられます。

失敗1：コード行数・コミット数を主要KPIにする

「コード行数」「コミット数」を主要KPIにするのは、典型的な失敗パターンです。これらの指標は測定が簡単で一見定量的に見えますが、業務委託エンジニアの貢献を測る指標としては機能しません。

理由は明確で、コード行数を増やしたいなら、冗長な書き方をすればいくらでも増やせるからです。優秀なエンジニアは多くの場合、より少ないコードで同じ機能を実現します。コード行数を主要KPIにすると、品質を犠牲にして行数を稼ぐ行動を誘発しかねません。

コミット数も同様です。意味のあるコミットを大きく作るエンジニアと、細かく分割しすぎるエンジニアの違いを、コミット数だけでは判別できません。

代わりに、本記事で紹介したFour Keys系の指標（デプロイ頻度・リードタイム・変更失敗率・MTTR）を使うことで、「速く・安全に届けられているか」という本質的な貢献を測れます。

失敗2：個人KPIだけで評価しチーム貢献を見落とす

「業務委託エンジニアA氏の個人成果はどうか」だけを評価する設計も、失敗しやすいパターンです。

なぜなら、ソフトウェア開発は本質的にチーム活動だからです。優秀なエンジニアほど、他メンバーのレビュー・サポート・ペアプログラミングに時間を使い、結果として「自分のコミット数」は減ることもあります。個人成果だけ見ると、こうした「縁の下の力持ち」型のエンジニアの貢献が見えなくなります。

対策として、KPI4（コードレビュー貢献度・ドキュメント整備度）とKPI5（仕様提案・改善提案件数）といったチーム貢献系の指標を必ず含めること、そしてプロジェクト全体のKPI（チーム全体のデプロイ頻度・チケット消化率）を業務委託エンジニアの貢献度評価と切り分けて把握することが有効です。

失敗3：KPI未達=即契約解除という運用にする

最後の失敗パターンは、KPIを「契約解除のトリガー」として運用することです。「3ヶ月連続でチケット消化率が80%を下回ったら契約解除」のような硬直的な運用は、3つの問題を引き起こします。

第一に、業務委託エンジニアが安全策ばかり取るようになることです。未達を避けるために、見積もりを保守的にし、難易度の高いタスクから逃げ、結果として組織全体の生産性が下がります。

第二に、KPI改ざんのインセンティブが生まれることです。たとえばチケットを意図的に小さく分割して消化率を上げる、形式的なドキュメントだけ大量に作るなど、数字を稼ぐための行動が増えます。

第三に、信頼関係が損なわれることです。業務委託エンジニアは「監視されている」と感じ、能動的な提案や率直な懸念表明が減ります。これは長期的に組織にとって大きな損失です。

代わりに、KPI未達を改善対話のトリガーとして位置づけましょう。未達が続いた場合は、まず「なぜ未達になったか」を業務委託エンジニアと一緒に分析し、改善アクションを合意します。それでも改善が見られない場合に、契約条件の変更・スコープの見直し・契約終了といった判断材料に使う、というのが健全な運用です。

KPI評価を活用した意思決定の具体例

最後に、KPI測定データを「実際にどう意思決定に使うか」を具体的な3つのシーンで見ていきます。経営層への報告イメージを掴むためにご活用ください。

シーン1：契約更新の判断（継続／条件変更／終了）

業務委託エンジニアA氏（月70万円・準委任契約）の3ヶ月分のKPIが以下だったとします。

KPI	目標値	実績（3ヶ月平均）	判定
デプロイ頻度	週1回以上	週2.3回	◎
変更失敗率	15%以下	8%	◎
チケット消化率	80%以上	92%	◎
コードレビュー貢献度	週3件以上	週4.5件	◎
仕様提案件数	月1件以上	月2.7件	◎

このような数値であれば「継続」の判断材料が十分にあります。経営層への報告も、「全KPIで目標を上回り、年間840万円の発注に対して期待を上回る成果」と説明できます。

逆に、デプロイ頻度・チケット消化率は達成しているが、変更失敗率が25%（目標15%）で品質面に課題がある場合は、「条件変更」の判断材料になります。次の契約期間ではテストカバレッジ目標を追加する、ドキュメントレビューの工程を増やすなどのスコープ調整で改善を試みます。

複数指標が継続的に未達で、改善対話を経ても変化がない場合は、「終了」の判断材料になります。この場合も、KPI測定データが意思決定の根拠になっていることが重要です。「なんとなく合わなかったから」ではなく、「これらの数値が改善されなかったため」と説明可能な形にすることで、契約終了が双方にとって納得感のあるものになります。

シーン2：単価交渉の根拠提示

業務委託エンジニアB氏（月50万円・準委任契約）から、契約更新時に月60万円への単価アップ要請があったとします。

このとき、KPIデータがあれば交渉が建設的になります。たとえば、B氏のKPIが「デプロイ頻度週1.5回・変更失敗率12%・仕様提案月3件」であり、市場相場の月60万円エンジニアと比較して遜色ない、あるいは上回る水準であれば、単価アップの妥当性を経営層に説明できます。

逆に、KPIが目標を下回っている、あるいは横ばいの状況であれば、「現単価のまま継続」「KPI改善後に再協議」といった代替案を、根拠を持って提示できます。単価交渉は感情的な押し引きになりがちですが、KPIという共通言語があれば、双方が納得しやすい結論に至りやすくなります。

シーン3：追加発注・スコープ拡大の意思決定

現在1名の業務委託エンジニアで開発を進めているプロジェクトで、「2名追加して開発を加速したい」という要望が出たとします。

このとき、現在のKPIデータが追加発注の妥当性を判断する材料になります。たとえば、現在のチケット消化率が常に95%以上で「やりたいが手が足りていない」状態であれば、追加発注の費用対効果が見込めます。逆に、チケット消化率が80%前後で「キャパシティに余裕がある」状態なら、まずは既存メンバーで何を変えればさらに成果が出るかを検討する方が先かもしれません。

また、追加するエンジニアの単価設定も、既存メンバーのKPI水準と単価のバランスから逆算できます。「既存メンバーがこのKPI水準で月60万円なので、同等の貢献を期待する追加エンジニアも月60万円程度が妥当」という相場感の社内基準ができていきます。

まとめ：感覚評価から数字に基づく意思決定へ

ここまで、業務委託エンジニアをKPIで評価するための考え方と実務手順を見てきました。要点を整理すると次のようになります。

業務委託エンジニアの評価は、正社員とは別の前提で設計する必要があります。労務管理権がない・成果物の境界が曖昧・プロジェクト型で短期評価が困難という3つの構造的課題を踏まえ、契約形態（準委任・請負）ごとに評価可能な指標を選びましょう
5つのKPI（デプロイ頻度・リードタイム／変更失敗率・MTTR／チケット消化率・予実差異／コードレビュー貢献度・ドキュメント整備度／仕様提案・改善提案件数）を、プロジェクト目標から逆算して選び、契約書・SLAに明文化することで、評価基準を双方の合意事項にできます
KPIは契約解除のトリガーではなく改善対話のトリガーとして運用することで、業務委託エンジニアとの信頼関係を保ちつつ、契約継続・単価交渉・追加発注の意思決定を数字に基づく根拠で支えられます
コード行数・コミット数だけを主要KPIにする、個人KPIだけで評価する、KPI未達=即契約解除にするという3つの失敗パターンは、いずれも本来測りたい価値からずれた行動を誘発するため、避けましょう

ここまでで、業務委託エンジニアKPI評価の全体像と5つの指標を理解いただけたと思います。一方で、実際に明日から運用を始めるには、自社の契約書テンプレートにどう書き込むか、評価シートのフォーマットをどうするか、業界・契約形態別の数値目標の参考値はどこから取るかといった、より具体的な実装情報が必要になります。

業務委託エンジニアの評価設計を本格的に進めたい発注企業の担当者向けに、契約書への落とし込み文例、評価シートのテンプレート、業界別KPI目標値の参考データを含む実務資料を外部エンジニア活用のROI・コスト試算ガイドとしてお役立ち資料に用意しています。本記事で得た全体像と組み合わせて活用いただくことで、契約更新・単価交渉・追加発注の意思決定を、経営層への説明責任を果たせる形で支えられるはずです。

—Workee for Business / 発注者向け

Workee で
開発リソースを探す。

募集を出すだけで AI が相性の高いフリーランスエンジニアを提案。掲載・初期費用 0 円、成約まで完全成功報酬で始められます。

StyleAI マッチング型

Fee掲載 0 円・成功報酬

Service案件登録から契約まで

Post a job

Workee for Business

よくある質問

業務委託エンジニアのKPI評価を始めるとき、最初に導入すべき指標はどれですか？: プロジェクトの目標に合わせて重点2〜3指標を選ぶのが最短ルートです。新規開発ならKPI1（デプロイ頻度・リードタイム）とKPI3（チケット消化率）、品質改善・保守運用ならKPI2（変更失敗率・MTTR）とKPI4（ドキュメント整備度）から始め、慣れてから残りを参考指標に加えてください。
KPI評価の基準を契約書に書くと偽装請負になりますか？: 成果・品質基準をSLAに明文化すること自体は問題ありません。偽装請負リスクが生じるのは「作業時間の管理」「タスクの着手順序の指示」など業務遂行プロセスへの介入です。「週1回以上デプロイすること」「チケット消化率80%以上」のように成果指標を合意する形であれば、法的リスクなく活用できます。
KPIを業務委託エンジニアに伝えるとき、関係を壊さないためにどう伝えればよいですか？: 評価するのではなく「一緒に振り返るパートナー」として月次レビューを設計するのが有効です。数値を共有した後、背景（連休・障害・スコープ追加など）を確認してから改善アクションを双方で合意する形にすることで、指揮命令と取られるリスクを避けながら率直なフィードバックを引き出せます。
KPIが継続的に未達の場合、契約解除以外にどんな対応が取れますか？: まず未達の背景を分析し、発注側の責任要因（スコープ追加・他チームの遅延など）があれば評価から除外します。改善アクションを合意しても変化がない場合は、スコープの見直し・契約単価の調整・担当領域の変更といった段階的な対応を取ります。即時解除を契約条件にすると逆に安全策行動を誘発するため避けてください。
測定ツールが整っていない小規模チームでも、KPI評価は運用できますか？: GitHubの履歴とSlack・Notionの記録があれば最低限の測定は可能です。デプロイ頻度はマージ数、チケット消化率はスプリント完了チケット数、改善提案件数は議事録から手動集計できます。専用ツールなしで重点2指標だけ計測するところから始め、評価習慣が定着してから自動化するのが現実的です。

—About the Author / 執筆者

ブログの種類から探す

01Useful

お役立ちブログ

業務にすぐ使える工夫、導入の考え方、チーム運営のヒント。実務の現場から生まれた知見をお届け。

02Tech Blog

技術ブログ

日々の実装で出会った技術的トピック。TypeScript、Next.js、クラウド、LLMまわりの実践的メモ。

03Work Blog

事例ブログ

導入事例と開発プロセスの振り返り。課題設定から設計・運用までの流れを事例ごとに公開。

04Introduction

Workee フリーランス向けブログ

フリーランス／副業エンジニア向けの実務ノウハウ。案件選び、契約、税務など働き方を支える情報。

●Ebook

お役立ち資料集

秋霜堂のサービス紹介資料や、
お役立ち資料を無料でダウンロードいただけます。

●Contact

お問い合わせ

ご質問・ご相談など、まずはお気軽に
お問い合わせフォームより無料お問い合わせください。

●Ebook

お役立ち資料集

秋霜堂のサービス紹介資料や、
お役立ち資料を無料でダウンロードいただけます。

●Contact

お問い合わせ

ご質問・ご相談など、まずはお気軽に
お問い合わせフォームより無料お問い合わせください。

エンジニア2026.05.26更新：2026.06.23

業務委託エンジニアをKPIで評価する方法｜感覚評価から脱却する5つの定量指標と設計手順

石川瑞起

Representative Director

読了 30分/ 11,891 文字

Contents — 目次

なぜ業務委託エンジニアのKPI評価は難しいのか
業務委託エンジニアKPI評価の前提：契約形態別の評価可能範囲
業務委託エンジニアを評価する5つのKPI指標
KPI設計の実務手順：4ステップで自社に落とし込む
KPI評価でやってはいけない3つの失敗パターン
KPI評価を活用した意思決定の具体例
まとめ：感覚評価から数字に基づく意思決定へ

—Workee for Business / 発注者向け

Workee で
開発リソースを探す。

募集を出すだけで AI が相性の高いフリーランスエンジニアを提案。掲載・初期費用 0 円、成約まで完全成功報酬で始められます。

StyleAI マッチング型

Fee掲載 0 円・成功報酬

Service案件登録から契約まで

Post a job

Workee for Business

なぜ業務委託エンジニアのKPI評価は難しいのか

発注企業が抱える「評価できない」3つの構造的課題

業務委託エンジニアの評価を難しくしている要因は、大きく3つに整理できます。

感覚評価のリスク（過大支出・優秀人材の離脱・社内説明責任）

「うまく回っているから良しとしよう」という感覚評価は、一見コストがかからず合理的に見えますが、実は3つの大きなリスクを抱えています。

業務委託エンジニアKPI評価の前提：契約形態別の評価可能範囲

準委任契約で評価できる指標／できない指標

請負契約での評価ポイント（成果物ベース）

偽装請負を避けるためのKPI設定上の注意

KPI設定で特に注意すべきは、以下の3点です。

法的に微妙な判断が必要な場合は、社内法務または労務領域の弁護士への確認をおすすめします。

業務委託エンジニアを評価する5つのKPI指標

KPI1：デプロイ頻度・リードタイム（開発スピードの可視化）

KPI2：変更失敗率・平均復旧時間（品質と安定性）

KPI3：チケット消化率・予実差異（コミットメント達成度）

KPI4：コードレビュー貢献度・ドキュメント整備度（チーム貢献）

測定方法：GitHubのレビューコメント数、Notion・Confluenceの更新履歴から集計可能です。

KPI5：仕様提案・改善提案件数（付加価値貢献）

数値目標の参考値：月1〜2件以上の提案、四半期で1件以上の採用提案があれば、付加価値が出ていると評価できます。

KPI設計の実務手順：4ステップで自社に落とし込む

ステップ1：プロジェクト目標から逆算してKPIを選ぶ

ゴールに応じて重点KPIが変わります。

プロジェクト目標	重点KPI
新規プロダクト立ち上げ（スピード重視）	KPI1（デプロイ頻度・リードタイム）、KPI3（チケット消化率）
既存システム改善（品質重視）	KPI2（変更失敗率・MTTR）、KPI4（ドキュメント整備度）
専門領域の助言・設計支援	KPI5（仕様提案・改善提案件数）、KPI4（コードレビュー貢献度）
保守運用（安定性重視）	KPI2（変更失敗率・MTTR）、KPI4（ドキュメント整備度）

すべてのKPIを5つ並列で運用しようとせず、重点2〜3指標を選び、残りは参考指標として軽く確認する運用にすると、評価工数を抑えられます。

ステップ2：契約書・SLAに評価基準を明文化する

契約書・SLAに記載すべき要素は次のとおりです。

対象KPI（例: デプロイ頻度・チケット消化率）
目標値（例: デプロイ頻度週1回以上、チケット消化率 80%以上）
測定方法（例: GitHub履歴から自動集計、Jiraから手動集計）
測定期間（例: 月次・四半期）
未達時の取り扱い（例: 業務改善ミーティングの実施、契約更新時の協議）

ステップ3：月次レビューミーティングで合意形成する

契約書に書いただけでは運用は回りません。月次のレビューミーティングを設定し、業務委託エンジニアと一緒に数値を確認します。

具体的な議事進行例は次のとおりです。

数値共有（5分）：今月のKPI測定値を共有する
背景の確認（10分）：数値の背景にあるイベント（連休・障害対応・スコープ追加など）を確認する
改善アクションの合意（10分）：双方が合意できる改善アクションを決める
次月のフォーカス確認（5分）：来月の重点KPIを再確認する

このミーティングの議事録は、契約更新時の意思決定の根拠資料として保管しておきます。

ステップ4：契約更新・単価交渉の判断基準として運用する

KPI評価でやってはいけない3つの失敗パターン

KPIを導入する企業の多くが陥る失敗パターンを、3つ紹介します。これを先に知っておくことで、運用設計の段階で罠を避けられます。

失敗1：コード行数・コミット数を主要KPIにする

失敗2：個人KPIだけで評価しチーム貢献を見落とす

「業務委託エンジニアA氏の個人成果はどうか」だけを評価する設計も、失敗しやすいパターンです。

失敗3：KPI未達=即契約解除という運用にする

KPI評価を活用した意思決定の具体例

シーン1：契約更新の判断（継続／条件変更／終了）

業務委託エンジニアA氏（月70万円・準委任契約）の3ヶ月分のKPIが以下だったとします。

KPI	目標値	実績（3ヶ月平均）	判定
デプロイ頻度	週1回以上	週2.3回	◎
変更失敗率	15%以下	8%	◎
チケット消化率	80%以上	92%	◎
コードレビュー貢献度	週3件以上	週4.5件	◎
仕様提案件数	月1件以上	月2.7件	◎

シーン2：単価交渉の根拠提示

業務委託エンジニアB氏（月50万円・準委任契約）から、契約更新時に月60万円への単価アップ要請があったとします。

シーン3：追加発注・スコープ拡大の意思決定

現在1名の業務委託エンジニアで開発を進めているプロジェクトで、「2名追加して開発を加速したい」という要望が出たとします。

まとめ：感覚評価から数字に基づく意思決定へ

ここまで、業務委託エンジニアをKPIで評価するための考え方と実務手順を見てきました。要点を整理すると次のようになります。

業務委託エンジニアの評価は、正社員とは別の前提で設計する必要があります。労務管理権がない・成果物の境界が曖昧・プロジェクト型で短期評価が困難という3つの構造的課題を踏まえ、契約形態（準委任・請負）ごとに評価可能な指標を選びましょう
5つのKPI（デプロイ頻度・リードタイム／変更失敗率・MTTR／チケット消化率・予実差異／コードレビュー貢献度・ドキュメント整備度／仕様提案・改善提案件数）を、プロジェクト目標から逆算して選び、契約書・SLAに明文化することで、評価基準を双方の合意事項にできます
KPIは契約解除のトリガーではなく改善対話のトリガーとして運用することで、業務委託エンジニアとの信頼関係を保ちつつ、契約継続・単価交渉・追加発注の意思決定を数字に基づく根拠で支えられます
コード行数・コミット数だけを主要KPIにする、個人KPIだけで評価する、KPI未達=即契約解除にするという3つの失敗パターンは、いずれも本来測りたい価値からずれた行動を誘発するため、避けましょう

—Workee for Business / 発注者向け

Workee で
開発リソースを探す。

募集を出すだけで AI が相性の高いフリーランスエンジニアを提案。掲載・初期費用 0 円、成約まで完全成功報酬で始められます。

StyleAI マッチング型

Fee掲載 0 円・成功報酬

Service案件登録から契約まで

Post a job

Workee for Business

よくある質問

業務委託エンジニアのKPI評価を始めるとき、最初に導入すべき指標はどれですか？: プロジェクトの目標に合わせて重点2〜3指標を選ぶのが最短ルートです。新規開発ならKPI1（デプロイ頻度・リードタイム）とKPI3（チケット消化率）、品質改善・保守運用ならKPI2（変更失敗率・MTTR）とKPI4（ドキュメント整備度）から始め、慣れてから残りを参考指標に加えてください。
KPI評価の基準を契約書に書くと偽装請負になりますか？: 成果・品質基準をSLAに明文化すること自体は問題ありません。偽装請負リスクが生じるのは「作業時間の管理」「タスクの着手順序の指示」など業務遂行プロセスへの介入です。「週1回以上デプロイすること」「チケット消化率80%以上」のように成果指標を合意する形であれば、法的リスクなく活用できます。
KPIを業務委託エンジニアに伝えるとき、関係を壊さないためにどう伝えればよいですか？: 評価するのではなく「一緒に振り返るパートナー」として月次レビューを設計するのが有効です。数値を共有した後、背景（連休・障害・スコープ追加など）を確認してから改善アクションを双方で合意する形にすることで、指揮命令と取られるリスクを避けながら率直なフィードバックを引き出せます。
KPIが継続的に未達の場合、契約解除以外にどんな対応が取れますか？: まず未達の背景を分析し、発注側の責任要因（スコープ追加・他チームの遅延など）があれば評価から除外します。改善アクションを合意しても変化がない場合は、スコープの見直し・契約単価の調整・担当領域の変更といった段階的な対応を取ります。即時解除を契約条件にすると逆に安全策行動を誘発するため避けてください。
測定ツールが整っていない小規模チームでも、KPI評価は運用できますか？: GitHubの履歴とSlack・Notionの記録があれば最低限の測定は可能です。デプロイ頻度はマージ数、チケット消化率はスプリント完了チケット数、改善提案件数は議事録から手動集計できます。専用ツールなしで重点2指標だけ計測するところから始め、評価習慣が定着してから自動化するのが現実的です。

—About the Author / 執筆者

ブログの種類から探す

01Useful

お役立ちブログ

業務にすぐ使える工夫、導入の考え方、チーム運営のヒント。実務の現場から生まれた知見をお届け。

02Tech Blog

技術ブログ

日々の実装で出会った技術的トピック。TypeScript、Next.js、クラウド、LLMまわりの実践的メモ。

03Work Blog

事例ブログ

導入事例と開発プロセスの振り返り。課題設定から設計・運用までの流れを事例ごとに公開。

04Introduction

Workee フリーランス向けブログ

フリーランス／副業エンジニア向けの実務ノウハウ。案件選び、契約、税務など働き方を支える情報。

●Ebook

お役立ち資料集

秋霜堂のサービス紹介資料や、
お役立ち資料を無料でダウンロードいただけます。

●Contact

お問い合わせ

ご質問・ご相談など、まずはお気軽に
お問い合わせフォームより無料お問い合わせください。