「深夜に本番環境のアラートが鳴り、開発メンバーが手探りで障害対応に追われる」「ユーザーが増えるたびにパフォーマンス問題が再発し、運用が一部のメンバーに属人化している」——プロダクトの成長に運用体制が追いつかず、こうした課題に直面している開発責任者は少なくありません。経営からは「運用を安定させてほしい」と言われるものの、信頼性を専門に担うSRE(サイト信頼性エンジニア)を正社員で採用しようとすると、採用市場ではほとんど採れないのが実情です。
そこで現実的な選択肢として浮上するのが、業務委託(フリーランス・副業)によるSREの確保です。ただ、いざ発注しようとすると、別の壁にぶつかります。「そもそもSREに何を任せればいいのか、役割の輪郭がはっきりしない」「自動化や信頼性向上のような成果は目に見えにくく、何をもって成功とするのか測れない」「24時間の信頼性を外部の人に背負わせて、責任の空白や偽装請負のような問題が起きないか心配だ」。こうした不安が重なり、発注の一歩を踏み出せないまま時間だけが過ぎてしまうケースが多いのです。
SREは比較的新しい職種であり、社内に経験者がいない企業では「任せる範囲」と「社内に残す責任」の線引きそのものが難しく感じられます。しかし、この線引きを発注前に整理できれば、業務委託SREは運用安定化の強力な戦力になります。逆に、役割定義が曖昧なまま発注すると「期待した成果が出ない」「責任の所在が不明確で障害時に混乱する」といったミスマッチが起こりやすくなります。
本記事では、業務委託でSREを確保しようとしている発注者の視点に立ち、SREの役割の解像度を上げたうえで、任せられる業務と社内に残すべき責任の線引き、成果の測り方、24時間運用に伴う契約・法的リスクの回避策、そして確保先と発注を成功させる進め方までを、発注前に整理すべき要件として順に解説します。
SRE人材を業務委託で確保する企業が増えている背景
まず、なぜ今「SREを業務委託で確保する」という選択肢が現実的になっているのか、発注者が置かれている状況と市場環境を整理します。自社だけが運用に苦しんでいるわけではなく、業務委託でのSRE確保は多くの企業が取り得る正当な選択肢になっています。
正社員SREが採用できない理由と運用属人化の悪循環
SREは、サービスの信頼性をエンジニアリングの手法で高める専門職です。クラウドインフラ・自動化・監視・ソフトウェア開発の知識を横断的に求められるため、対応できる人材の母数がそもそも限られています。加えて、SREという職種を設置するのは資金力のある事業会社が中心で、急成長中のスタートアップや中小SaaS企業が正社員として採用しようとしても、待遇面でも知名度の面でも競り負けやすいのが現実です。
採用できないまま運用負荷だけが増えると、開発チームの一部メンバーが運用対応を兼務し続けることになります。すると、運用ノウハウがその人に集中して属人化し、その人が障害対応に追われて開発が止まり、リリースが遅れてさらにユーザーからの不満や障害が増える——という悪循環に陥ります。深夜のアラート対応で疲弊し、開発も運用も中途半端になる状態は、まさにこの悪循環の典型です。
この悪循環を断ち切るには、信頼性を専門に担う人材を確保するしかありません。正社員採用が難しい以上、業務委託でその役割を補うのは合理的な打開策といえます。
業務委託SREの市場相場と稼働形態の概観
業務委託SREの市場は、ここ数年で確実に広がっています。中規模のSaaSスタートアップや事業会社でもSRE職を設置する動きが進み、それに伴ってフリーランス・副業のSRE案件も増加しています。
単価相場の目安として、エン・ジャパンが運営するフリーランススタートの定点調査では、2025年12月度のSRE職の平均単価は約93.5万円(月額・フルタイム想定)と報告されています(エン・ジャパン『フリーランススタート』定点調査レポート 2026年1月9日)。フリーランスエンジニア全体の月額平均単価が約78.3万円である中で、SREは高水準の部類に入ります。ただし同調査では、SREの単価は高水準から調整方向(やや低下傾向)にあるとも報告されており、相場は時期によって変動する点に留意してください。
稼働形態も多様化しています。フルタイム(週5日)相当の常時稼働だけでなく、週3日・週2日といった部分稼働の案件も多く流通しており、副業・スポットでの参画もしやすくなっています。実際、フリーランススタートの案件データでは週3日稼働のSRE案件が一定数を占めています(エン・ジャパン『フリーランススタート』定点調査レポート)。リモート前提の案件も一般的です。
つまり「フルタイムで丸ごと運用を任せる」だけでなく、「週2〜3日で監視設計や自動化の仕組みづくりを依頼する」「アドバイザー的にSLO設計や運用改善を支援してもらう」といった軽い関わり方も選べます。自社の課題の大きさと予算に応じて稼働形態を選べることが、業務委託でのSRE確保を現実的な選択肢にしている要因です。
そもそもSREとは何か|インフラエンジニア・DevOpsとの違いと役割

業務委託で任せる範囲を決める前に、まず「SREが担う領域」の解像度を上げておく必要があります。ここを曖昧にしたまま発注すると、本当はインフラ構築を頼みたかったのにSREを探していた、あるいはその逆、といったミスマッチが起こります。
SREの定義と中核概念
SRE(Site Reliability Engineering/サイト信頼性エンジニアリング)とは、サービスの信頼性(落ちない・遅くならない・安定して使える状態)を、ソフトウェアエンジニアリングの手法で高めていく考え方とその担い手を指します。もともとGoogleが提唱した方法論で、「運用を手作業で頑張る」のではなく「運用の問題をコードと仕組みで解決する」点に特徴があります。
発注前に押さえておきたい中核概念は次の3つです。
- SLI/SLO(信頼性目標): SLI(Service Level Indicator)はサービスの状態を表す指標(例: リクエスト成功率、応答時間)で、SLO(Service Level Objective)はその目標値(例: 「成功率99.9%を維持する」)です。SREは「どこまでの信頼性を目指すか」を数値で定め、その達成に向けて改善します。
- エラーバジェット: SLOを「100%は目指さない」という発想で運用する考え方です。例えばSLOが99.9%なら、残り0.1%は「許容できる失敗の予算」とみなします。この予算が残っていれば新機能のリリースに挑戦でき、使い切ったら信頼性改善を優先する、という形で開発スピードと安定性のバランスを取ります。
- トイル削減: トイルとは、手作業で繰り返し発生する運用作業(手動デプロイ、手動でのサーバー設定、定型的な障害一次対応など)のことです。SREはこのトイルを自動化やツール化で減らし、人が本質的な改善に時間を使えるようにします。
これらの概念を理解しておくと、後述する「成果の測り方」や「任せる範囲」の議論が具体的にイメージできるようになります。
SREとインフラエンジニア・DevOpsの違い
「SRE」「インフラエンジニア」「DevOps」は重なる部分が多く、混同されがちです。発注の方向性を間違えないために、ざっくりとした違いを整理します。
観点 | SRE | インフラエンジニア | DevOps |
|---|---|---|---|
主な目的 | サービスの信頼性を仕組みで高める | サーバー・ネットワーク等の基盤を構築・運用する | 開発と運用を連携させ、リリースを速く安全にする |
中心的な活動 | SLO設計、監視・自動化、トイル削減、ポストモーテム | サーバー構築、ネットワーク設計、ミドルウェア設定 | CI/CDパイプライン整備、開発と運用の文化・プロセス改善 |
成果の測り方 | SLO達成率、MTTR、トイル削減量など | 構築物の完成・安定稼働 | リリース頻度、リードタイムなど |
位置づけ | 「信頼性」を軸にした考え方・役割 | 基盤を扱う職種 | 組織の文化・プラクティス(職種というより方法論) |
おおまかに言えば、インフラエンジニアが「動く基盤をつくる」のに対し、SREは「その基盤の上でサービスが安定して動き続けることを、数値目標と自動化で担保する」役割です。DevOpsは開発と運用をつなぐ文化・プラクティスを指し、SREはそのDevOpsの考え方を信頼性という具体的な目標で実装したもの、と捉えると整理しやすいでしょう。
なお、混同されやすいインフラの外注全般については、インフラエンジニアを外注するにはも参考にしてください。
自社の課題がインフラ構築・運用かSREかを見極めるチェック観点
自社が本当に必要としているのがSREなのか、それともインフラエンジニアなのかを見極めるために、次の観点でチェックしてみてください。
- サーバーやネットワークの新規構築・移行が主な課題なら、まずはインフラエンジニアの領域です。
- 基盤はすでにあるが「障害が頻発する」「運用が手作業で属人化している」「どこまで安定していれば良いのか目標がない」のが課題なら、SREの領域です。
- 「リリースのたびに手作業が多く時間がかかる」「開発と運用が分断している」が課題なら、SREとDevOpsの両方にまたがります。
自社の課題が「基盤を作ること」なのか「すでにある基盤の信頼性を高め、運用を仕組み化すること」なのかをはっきりさせると、業務委託で探すべき人材像がぶれません。
業務委託のSREに任せられる業務と、社内に残すべき責任

ここからが本記事の核心です。「業務委託SREに何をどこまで任せ、何を社内に残すのか」という線引きこそ、発注前に最も整理すべきポイントです。任せる範囲と残す責任を明確にできれば、発注要件を言語化でき、発注後のミスマッチも防げます。
業務委託SREに任せやすい業務
業務委託SREは、専門スキルが必要で、かつ成果物や進め方を比較的切り出しやすい以下のような業務を任せるのに向いています。
- 監視・アラート設計: 何を監視し、どういう条件でアラートを上げるかの設計と整備。過剰なアラートを減らし、本当に対応すべき事象だけを通知する仕組みづくり。
- SLI/SLOの設計支援: サービスにとって重要な指標を洗い出し、適切なSLOの数値を提案・設計する支援。
- IaC(Infrastructure as Code)化・自動化: 手作業のインフラ設定やデプロイをコード化し、再現性と安全性を高める。
- トイル削減・運用自動化: 繰り返し発生する手作業を洗い出し、スクリプトやツールで自動化する。
- ポストモーテム(障害の振り返り)支援: 障害が起きた後に原因と再発防止策を整理し、仕組みとして定着させる支援。
- オンコール体制・障害対応プロセスの設計: 誰がどう一次対応し、どうエスカレーションするかの仕組みづくり。
これらは「専門知識と外部の経験」が活きる領域であり、社内にノウハウがない企業ほど業務委託で補う価値が大きい部分です。障害対応・オンコール体制の作り方そのものについては、外部エンジニアの障害対応・オンコール体制の作り方で詳しく扱っています。
社内に残すべき責任・意思決定
一方で、以下のような「事業判断を伴う最終責任」や「権限管理」は、安易に外部へ丸投げせず社内に残すのが原則です。
- 信頼性目標の最終決定: 「どこまでの信頼性を目指すか(SLOの最終的な数値)」は、コストと事業上の優先度を天秤にかける経営・事業判断です。業務委託SREには設計を支援してもらいつつ、最終決定は社内で行います。
- 本番環境の権限管理: 本番環境への最終的なアクセス権限の付与・剥奪、機密データへのアクセス管理は、セキュリティ上、社内に責任を残すべきです。委託SREには必要最小限の権限を業務範囲に応じて付与します。
- 重大障害時の最終的な指揮・対外対応: 大規模障害でユーザーへの告知や事業判断が必要な場面では、最終的な意思決定者は社内側にいる必要があります。委託SREは技術的な復旧を主導しても、対外説明や事業判断の責任主体にはしません。
- 事業・プロダクトの優先順位付け: 「信頼性改善と新機能開発のどちらを優先するか」といった判断は事業戦略に直結するため、社内に残します。
この線引きの考え方は、SREに限らず社内エンジニアと外注の役割分担全般に通じます。あわせて社内エンジニアと外注の役割分担も参照すると、線引きの基準を整理しやすくなります。
稼働形態別の任せ方の違い
任せる範囲は、稼働形態によっても変わってきます。自社の課題の大きさと予算に応じて、適した形態を選んでください。
- フルタイム委託型(週4〜5日): 運用の中核を継続的に担ってもらう形態。監視・自動化から日々の運用改善、オンコール参加まで幅広く任せられます。社内に運用の担い手がいない場合に向きますが、その分コストは高く、特定個人への依存が生じやすい点に注意が必要です。
- スポット・アドバイザー型(週1〜2日/単発): SLO設計や監視設計、運用改善の方針づくりなど「仕組みを作る」部分をスポットで依頼する形態。社内に実装できるメンバーがいて、専門的な設計や方針だけ外部の知見を借りたい場合に適します。コストを抑えやすい一方、日々の運用や緊急対応は社内で回す前提になります。
- オンコール参加型: 夜間・休日の障害一次対応の当番に加わってもらう形態。即応性が求められるため後述する偽装請負リスクとの兼ね合いが重要で、対応範囲・連絡手段・指揮系統を契約と運用ルールで明確にしておく必要があります。
役割定義と成果の測り方|発注前に決めるべき要件
任せる範囲が見えてきたら、それを「役割定義」として言語化し、あわせて「成果をどう測るか」を決めます。SREの仕事は自動化や信頼性向上といった目に見えにくい成果が多いため、測り方を先に決めておくことが、発注に踏み切るための安心材料になります。
役割定義書に盛り込む項目
業務委託SREの役割定義書(依頼要件をまとめた文書)には、最低限以下の項目を盛り込むことをおすすめします。
- 責任範囲: 任せる業務(監視設計・自動化・SLO設計支援など)と、社内に残す責任(権限管理・最終決定など)を明文化する。
- 対象システム・対象範囲: どのサービス・どの環境(本番/ステージング等)を対象とするか。
- 稼働形態・稼働時間: 週何日・どの時間帯か。オンコール参加の有無と、参加する場合の対応時間帯・連絡手段。
- SLO・対応時間の前提: 対象サービスに求める信頼性目標と、障害発生時の対応開始までの目安時間。
- 成果指標とレポーティング: 何をもって成果とするか(次項)と、その報告頻度・報告形式(週次レポート、定例ミーティングなど)。
- 連携体制: 社内の誰が窓口になり、どのツール(チャット・チケット管理など)でやり取りするか。
特に「責任範囲」と「社内に残す責任」をセットで書くことが重要です。委託SREの裁量で進められる範囲と、社内承認が必要な範囲が曖昧だと、現場での判断に迷いが生じ、結果として後述する指揮命令の問題にもつながります。
SRE業務の成果をどう測るか
「自動化や信頼性向上は成果が見えにくい」という不安は、測定可能な指標をあらかじめ設計しておくことで解消できます。SRE業務で使われる代表的な指標は次のとおりです。
指標 | 意味 | 何を測れるか |
|---|---|---|
SLO達成率 | 設定した信頼性目標を達成できた割合 | サービスが目標どおり安定しているか |
MTTR(平均復旧時間) | 障害発生から復旧までの平均時間 | 障害対応の速さ・仕組みの改善度 |
インシデント件数・再発率 | 一定期間の障害発生数と、同種障害の再発割合 | 根本対策が効いているか |
トイル削減量 | 自動化により削減できた手作業の工数 | 運用効率化の進捗 |
アラート精度 | 通知されたアラートのうち実対応が必要だった割合 | 監視設計の質(過剰アラートの抑制) |
これらすべてを最初から完璧に測る必要はありません。まずは「障害対応に追われている」という現状課題に直結する指標(例: MTTR、インシデント再発率、トイル削減量)を2〜3個選び、委託開始前の現状値(ベースライン)を記録しておきます。そのうえで「3か月でMTTRをどれだけ短縮する」「主要な手作業を何件自動化する」といった目標を委託SREと合意すれば、成果の有無を客観的に判断できます。目に見えにくい仕事だからこそ、数値での合意が双方の安心につながります。
24時間運用を外部に任せる際の契約形態と偽装請負・責任リスクの回避

SREは信頼性を担う性質上、24時間の運用やオンコール(待機・緊急対応)が絡みやすく、ここに業務委託特有の落とし穴があります。即応性を求めるほど、指揮命令の関係が生じやすくなり、偽装請負のリスクが高まるためです。発注者が押さえておくべき契約形態と回避策を整理します。
準委任と請負の選び方
業務委託契約は、大きく「準委任契約」と「請負契約」に分かれます。SRE業務での向き不向きを理解しておきましょう。
- 準委任契約: 一定の業務を遂行すること自体に対して対価を払う契約です。「成果物の完成」を約束するのではなく、専門的な業務の遂行を委ねます。監視運用・SLO設計支援・継続的な運用改善・オンコール参加など、ゴールを固定しにくく継続的に関わるSRE業務の多くは準委任が馴染みます。
- 請負契約: 「成果物の完成」を約束し、その完成に対して対価を払う契約です。「監視基盤の構築」「特定の自動化スクリプトの納品」など、成果物が明確に切り出せる単発のプロジェクトには請負が向きます。
SREの継続的な運用支援は準委任、明確な納品物がある構築タスクは請負、と切り分けて考えるのが基本です。どちらの契約でも共通して重要なのが、次に述べる偽装請負の回避です。
オンコール・常駐性が偽装請負リスクを高める理由と回避策
偽装請負とは、形式上は業務委託契約でありながら、実態として発注者が委託先の担当者に直接指揮命令を行うなど、労働者派遣に近い状態になっていることを指します。これは労働者派遣法等に違反する違法な状態です(TMI総合法律事務所「偽装請負の判断基準と違反のリスク」)。
SRE業務が偽装請負リスクを高めやすいのは、24時間運用・オンコール・即応性という性質によります。緊急対応を求める場面では、つい「今すぐこの作業をやってほしい」「常駐して待機してほしい」「この時間に必ず対応して」と、発注者が委託SREの作業の進め方・時間・場所を直接指示しがちです。こうした直接の指揮命令や勤務時間・場所の拘束が積み重なると、実態として労働者派遣とみなされ、偽装請負と判断されるおそれがあります。
判断のポイントは「常駐の有無」そのものではなく、「誰が、どこまで業務遂行を指示し、勤務管理をしているか」にあります(マネーフォワード クラウド「発注者が下請に直接指示するのは違法?」)。偽装請負と判断されると、発注者・受注者双方に罰則が及ぶ可能性があるほか、委託先の担当者に対して直接雇用が成立したとみなされるリスクもあります。
回避のための実務的なポイントは次のとおりです。
- 業務の進め方は委託先の裁量に委ねる: 個別作業を逐一指示するのではなく、達成すべき業務範囲・目標(SLOや対応すべき事象の定義)を示し、具体的な進め方は委託SREに委ねる。
- 指揮命令は社内の管理者を経由する: 委託SREへの依頼は、契約上の業務範囲の中で、社内の責任者を通じて行う。発注者の現場担当が直接「個人」に細かい作業指示を出す形を避ける。
- 対応ルールを契約・運用ルールで先に決める: オンコールの対応時間帯・連絡手段・対応すべき事象の範囲・エスカレーション基準を、あらかじめ契約や運用ドキュメントで合意しておく。これにより「その場の直接指示」を減らせます。
- 勤務時間・場所を拘束しない: 「この時間にここで待機」という形ではなく、「定めた対応時間帯において、定義された事象が発生したら対応する」という業務遂行ベースの取り決めにする。
なお、ここでの説明は一般的な考え方の整理であり、個別の契約形態が偽装請負に当たるかどうかの最終判断は、契約内容と運用実態を踏まえて弁護士など専門家に確認することをおすすめします。
本番障害時の責任分界とエスカレーション設計
「責任の空白」を防ぐには、平常時だけでなく障害時の責任分界とエスカレーションの流れを事前に設計しておくことが欠かせません。
- 一次対応の範囲を明確にする: 委託SREがどこまでを自律的に対応し、どの段階で社内にエスカレーションするかを定義する。例えば「自動復旧で戻らない/影響範囲が拡大している場合は社内責任者に即時連絡」など。
- 最終的な意思決定者を社内に置く: 対外告知の要否、サービス縮退の判断、事業影響の判断は社内が最終決定する。委託SREは技術的復旧を主導しても、事業判断の責任主体にはしない。
- 連絡経路と権限を文書化する: 緊急時に誰へどの手段で連絡するか、委託SREが本番環境に対してどこまでの操作権限を持つかを明文化する。権限は業務範囲に必要な最小限に絞る。
これらを役割定義書と運用ルールに落とし込んでおけば、「いざ障害が起きたときに誰が何をするか分からない」という責任の空白を避けられます。
業務委託SREの確保先と、発注を成功させる進め方

役割定義・成果指標・契約リスクの整理ができたら、いよいよ確保先の選定と発注です。確保チャネルの特徴を理解し、トライアルや引き継ぎ設計でミスマッチを防ぐことで、発注の成功確率を高められます。
確保チャネル別の特徴
業務委託SREを確保する主なチャネルは次の3つです。それぞれ特徴が異なります。
- フリーランスエージェント: エージェントが企業と人材の間に立ち、要件に合うSREを紹介してくれます。スキルや稼働条件のマッチング・契約面のサポートを受けられるため、社内に外部人材活用のノウハウが少ない企業に向きます。マージンが発生する分コストはやや上がります。
- マッチングプラットフォーム: 企業が自ら案件を掲載し、登録しているフリーランス・副業人材と直接やり取りする形態です。週2〜3日や副業での参画など柔軟な稼働形態を探しやすく、コストを抑えやすい一方、要件定義や見極めを自社で行う必要があります。今回整理した役割定義・成果指標を準備しておくと、こうしたプラットフォームでのマッチング精度が大きく上がります。
- 開発会社・受託先への委託: SREやインフラ運用を手がける開発会社にチーム単位で委託する形態です。個人への依存を避けられ、属人化リスクを抑えられる一方、コストは個人委託より高くなる傾向があります。
自社の課題の大きさ(フルタイムの中核人材が必要か、設計だけ支援してほしいか)と、社内の見極め・要件定義のリソースに応じて選ぶのが基本です。
トライアル・引き継ぎ・オンボーディングで失敗を防ぐ進め方
最後に、発注を成功させるための進め方のポイントをまとめます。
- 小さく始めて見極める: いきなりフルタイムの長期契約を結ぶのではなく、スポットの設計支援や短期のトライアル期間から始めると、スキルや相性をリスク低く見極められます。
- ベースラインを共有する: 委託開始前に現状の課題・指標(MTTR、インシデント件数、主な手作業など)を共有し、何を改善したいかを言語化しておく。これが成果評価の基準になります。
- 属人化させない引き継ぎ設計: 委託SREが整備した監視設定・自動化スクリプト・運用手順は、必ずドキュメントやコードとして残してもらい、社内でも参照・運用できる状態にする。「その人がいないと回らない」状態を作らないことが、業務委託活用の長期的な成功条件です。
- 社内側の窓口を決める: 委託SREとのやり取りを担う社内責任者を明確にし、依頼や承認の経路を一本化する。これは偽装請負リスクの回避にも役立ちます。
これらを押さえれば、「発注したものの成果が出ない」「特定の委託先に依存してしまう」といった失敗を避けながら、業務委託SREを運用安定化の戦力にできます。
まとめ|業務委託SRE活用の判断ポイント
正社員SREが採用できない中で、業務委託によるSRE確保は運用安定化の現実的な選択肢です。発注に踏み出せない不安の多くは、「役割の輪郭が曖昧」「成果が測れない」「責任の空白や偽装請負が心配」という3点に集約されます。本記事で整理した要点を、発注前のチェックリストとして振り返ってください。
- 役割の解像度を上げる: 自社の課題が「インフラ構築」なのか「信頼性エンジニアリング(SLO運用・自動化・トイル削減)」なのかを見極め、SREに任せるべき領域を特定する。
- 任せる範囲と社内に残す責任を線引きする: 監視設計・自動化・SLO設計支援などは任せやすく、信頼性目標の最終決定・本番権限管理・重大障害時の事業判断は社内に残す。
- 役割定義と成果指標をセットで決める: 役割定義書に責任範囲・対象・稼働形態・SLOを明記し、MTTR・インシデント再発率・トイル削減量などの測定可能な指標で成果を測る。
- 契約形態と偽装請負リスクを設計する: 継続的な運用支援は準委任、明確な納品物は請負。オンコール・即応性が指揮命令を生みやすいため、対応ルール・連絡経路・権限・エスカレーションを事前に文書化する。
- 確保先を選び、小さく始める: エージェント・マッチングプラットフォーム・開発会社の特徴を踏まえ、トライアルやスポット支援から始めて見極め、引き継ぎ設計で属人化を防ぐ。
業務委託SREは「丸投げ」では機能しませんが、役割の線引きと責任設計を発注前に整理できれば、運用安定化の強力な戦力になります。まずは自社の課題を「インフラか、信頼性か」で切り分け、任せたい範囲と残すべき責任を書き出すところから始めてみてください。それが、発注先選定と社内合意形成への確かな第一歩になります。
よくある質問
- SREの業務委託にかかる費用の目安はどれくらいですか?
フリーランスSREの月額単価は2025年末時点で平均約93万円(フルタイム想定)ですが、週2〜3日のスポット稼働であれば稼働比率に応じて費用を抑えられます。まずは週2日程度の設計支援から始め、成果を見ながら稼働を拡大するのが費用対効果の高い進め方です。
- 社内にSRE経験者がいなくてもSLOを設定できますか?
SLO(信頼性目標の数値)の最終決定は社内の責任ですが、具体的な指標の選定と数値の提案は社内にSRE経験者がいなくても業務委託SREに支援してもらうことが可能です。まず「今の障害頻度とMTTRを計測・記録する」ことから始め、その実績値をベースラインにして委託SREと一緒にSLOを設計するのが現実的です。
- インフラエンジニアとSREのどちらに発注すればよいか判断できません。
「サーバーやネットワークの新規構築・移行が主な課題」であればインフラエンジニア、「基盤はあるが障害が頻発し運用が属人化している・信頼性目標がない」であればSREが適切です。両方の課題が混在する場合はSREを優先し、インフラ構築は範囲を絞って依頼要件に含める形で整理できます。
- オンコール対応を業務委託SREに依頼すると偽装請負になりますか?
対応ルールを契約・運用ドキュメントで事前に合意していれば偽装請負にはなりません。重要なのは「その場で個別作業を逐一指示せず、定めた対応時間帯に定義された事象が発生したら対応する」という業務遂行ベースの取り決めにして、進め方の裁量を委託SRE側に委ねることです。
- 業務委託SREへの発注前に最低限決めておくべきことは何ですか?
(1)任せる業務範囲と社内に残す責任の線引き、(2)稼働形態(週何日・オンコールの有無)、(3)成果を測る指標(MTTRやトイル削減量など)のベースライン記録、の3点です。この3点を言語化できれば、マッチングプラットフォームやエージェントへの要件提示と、発注後のミスマッチ防止の両方に役立ちます。



