「導入したときは精度が高くて満足していたAIが、最近どうも調子が悪い気がする」。AIを外部の開発会社に発注して導入した方から、こうした声をよく聞きます。現場からは「予測がよく外れる」「判定がおかしい」という報告が上がり、ユーザーからのクレームも少しずつ増えてきた。けれども、それが本当にAIの問題なのか、自社の使い方の問題なのか、判断がつかずモヤモヤしている――そんな状況ではないでしょうか。
やっかいなのは、AIの中身は開発会社に任せきりで、自社にデータサイエンティストがいないケースです。精度が下がっている気はするものの、それを裏づける数字の読み方が分からず、開発会社に連絡すべきかどうかも迷ってしまいます。仮に連絡したとして、何をどう伝えればいいのかも見当がつきません。
実は、この「運用後にAIの精度が下がっていく」という現象には、きちんとした名前があります。それが「モデルドリフト」です。これはAIの欠陥でも開発会社の手抜きでもなく、AIを運用していれば多かれ少なかれ必ず起きる、いわば自然な現象です。正体さえ分かれば、漠然とした不安は「次に何をすべきか」という具体的な行動に変えられます。
本記事では、AIを発注した側の担当者(非エンジニア)の目線に立って、モデルドリフトの仕組みから、発注者が現場で気づける精度劣化のサイン、再学習を開発会社に依頼するタイミングの判断基準、そして保守契約で確認しておくべきポイントまでを、専門用語をかみ砕きながら解説します。読み終えたときには、「自社のAIに今何が起きていて、開発会社に何を相談すればいいか」が整理できているはずです。
はじめての AI 導入ガイド――中小企業が失敗しないための7ステップ

この資料でわかること
AI導入を検討しているが「何から始めればよいか分からない」中小企業の意思決定者に対し、導入プロジェクトの全体像を一気通貫で提示し、「自社でも着手できる」という確信と具体的な行動計画を持ってもらうこと。
こんな方におすすめです
- AI導入を検討しているが、何から始めればよいか分からない
- ベンダーの選び方や費用感がつかめず、判断できない
- 社内でAI導入の稟議を通すための資料が必要
入力いただいたメールアドレスにPDFをお送りします。
モデルドリフトとは?AI運用後に精度が下がる現象

モデルドリフトとは、運用しているAI(機械学習モデル)の予測精度が、時間の経過とともに徐々に下がっていく現象のことです。「ドリフト(drift)」とは「漂流・ずれていくこと」を意味し、AIが学習した時点の前提と、実際にAIが使われる現実とのあいだに、少しずつズレが生じていく様子を表しています。
ここで押さえておきたい大事なポイントがあります。それは、AIは「学習を終えた瞬間が、精度のピーク」だということです。AIは過去のデータからパターンを学んで予測を行いますが、その学習が終わった後も世の中は動き続けます。顧客の好みは変わり、市場の状況は移り変わり、新しい商品やサービスが登場します。AIは学習したときの世界を前提に予測し続けるため、現実が変化するほど予測は外れやすくなっていきます。
つまり、運用後にAIの精度が下がること自体は「異常」ではなく、むしろ「当たり前」に起こることなのです。新車が走行距離を重ねればメンテナンスが必要になるのと同じように、AIも導入して終わりではなく、運用しながら手入れを続ける前提で考えるべきものです。「精度が下がってきた=失敗した・だまされた」と捉えるのではなく、「想定どおりメンテナンスのタイミングが来た」と捉え直すことが、発注者にとっての第一歩になります。
そして、この「メンテナンスのタイミングをどう見極め、開発会社に何を依頼するか」こそが、発注者が本当に知りたいことのはずです。次の章から、その判断材料を順番に整理していきます。
モデルドリフトが起こる2つの原因(データドリフトとコンセプトドリフト)
モデルドリフトはなぜ起きるのでしょうか。原因は大きく2つに分けられます。「データドリフト」と「コンセプトドリフト」です。専門的な分類ではありますが、発注者がこの2つの区別をざっくり理解しておくと、開発会社に相談するときに「うちで起きているのはこちらのタイプかもしれない」と当たりをつけられるようになります。
データドリフト:入力データの傾向が変わるケース
データドリフト(=AIに入ってくるデータの傾向そのものが変わること)とは、AIが受け取る入力データの分布が、学習時と運用時で変わってしまうことを指します。AIが扱う「材料」が変わってしまう、とイメージすると分かりやすいでしょう。
たとえば、ある店舗の需要予測AIが、これまで30〜40代の顧客データを中心に学習していたとします。ところが、新しいキャンペーンで若年層の来店が急増すると、AIが受け取るデータの顔ぶれが学習時と大きく変わります。AI自体の「予測のルール」は変わっていなくても、入ってくるデータが想定外になるため、予測が当たりにくくなります。
データドリフトの典型的なきっかけには、次のようなものがあります。
- 顧客層の変化(新規プロモーションによる客層の変化など)
- 季節性やトレンドの変化(季節商品の入れ替わり、流行の移り変わり)
- 新商品・新サービスの投入(過去になかった選択肢が増える)
- データ収集方法の変更(センサーの交換、入力フォームの仕様変更など)
コンセプトドリフト:正解そのものの基準が変わるケース
コンセプトドリフト(=AIが予測しようとしている「正解」の意味そのものが変わること)とは、入力データと「正解」との関係性が変わってしまうことを指します。データの材料は同じでも、何が正解かのルールが変わる、というケースです。
象徴的な事例として、アメリカの不動産企業Zillowが住宅価格を予測するAIで大きな損失を出した一件が知られています。同社のAIはコロナ禍前の住宅市場のデータで「この条件の家はこの価格」という関係を学習していましたが、コロナ後に住宅市場が急変し、過去に成り立っていた価格の法則が通用しなくなりました。AIは古い前提のまま価格を高く見積もり続け、結果として多数の住宅を割高で買い取ってしまい、価値の見直しで5億ドルを超える損失を計上したと報じられています(insideAI News)。これは、入力データの傾向ではなく「正解の基準」のほうが変わってしまった、コンセプトドリフトの代表例といえます。
身近な例で言えば、市場のルール変更や規制改正、ユーザーの価値観・行動の変化などが、コンセプトドリフトのきっかけになります。「以前は正解だった判断が、今は正解ではなくなった」という状況が起きていれば、コンセプトドリフトを疑う余地があります。
統計的な検知手法は「開発会社が使う指標」と捉えてよい
ドリフトを検知する技術として、KS検定やPSI(Population Stability Index)といった統計的な手法があります。これらはデータの分布がどれくらい変化したかを数値で測るためのものですが、発注者がこれらの中身を理解する必要はありません。
大切なのは、「こうした指標を使ってドリフトを監視・検知するのは開発会社の役割であり、発注者はその結果の報告を受け取って判断する立場にある」と整理しておくことです。専門用語そのものを覚えるより、「精度の劣化は数値で監視できる」という事実を知っておくほうが、開発会社との会話では役に立ちます。実際に発注者が現場で気づけるサインについては、次の章で具体的に見ていきます。
発注者が気づくべき精度劣化のサイン

ここが本記事の最も重要なポイントです。統計的な監視ダッシュボードを自分で読み解けなくても、発注者が現場で観測できる「精度劣化のサイン」はいくつもあります。これらを定点観測しておけば、「精度が下がった気がする」という曖昧な体感を、「これはサインだ」「これは別の要因だ」と切り分けられるようになります。
現場・ユーザー起点で気づくサイン
まず、数字を見なくても日々の業務のなかで感じ取れるサインがあります。
- AIの予測や判定に対する現場の違和感が増えた(「最近よく外れる」「以前と挙動が違う」という声)
- ユーザーからのクレームや問い合わせが増えた(チャットボットの回答がズレる、レコメンドが的外れになるなど)
- AIの出力を人が手作業で修正する場面が増えた(AIの結果をそのまま使えず、後から直す手間が増えている)
- 特定の場面・時期だけ明らかに挙動がおかしい(キャンペーン後、繁忙期だけ精度が落ちるなど)
こうした「現場の肌感覚」は、軽視されがちですが非常に有力なサインです。実際に毎日AIの出力に触れている担当者の違和感は、統計指標が異常を示すより早く問題を捉えていることも少なくありません。
数字・レポートで気づくサイン
開発会社から定期レポートを受け取っている場合や、社内のKPIを追っている場合は、次のような数字の動きにも注目してください。
- 予測の的中率・正答率といった精度指標が緩やかに低下している
- 特定のセグメント(顧客層・商品カテゴリ・地域など)だけ精度が悪い(全体では気づきにくいが、分けて見ると差が出る)
- AIの判断に紐づくビジネスKPI(売上、在庫回転、解約率など)がじわじわ悪化している
特に「特定のセグメントだけ精度が悪い」という兆候は、データドリフトのサインであることが多く、開発会社に伝えると原因の切り分けが進みやすくなります。
ドリフト以外の原因との切り分け
精度が下がったように見えても、その原因がモデルドリフトとは限りません。慌てて再学習を依頼する前に、次のような「別の要因」を疑っておくと無駄なコストを避けられます。
- システム障害・データ連携エラー:あるデータが急に欠損する、特定の入力が止まっている場合は、ドリフトではなく連携トラブルの可能性が高いです。「ある時点を境に突然おかしくなった」ならこちらを疑います。
- 使い方・運用の変化:現場での入力ルールが変わった、AIの使われ方が当初の想定とズレてきた、というケースもあります。
- 一時的なイレギュラー:大型キャンペーンや災害など、一過性のイベントで一時的に精度が下がっているだけの場合もあります。
切り分けの考え方として、「ある時点で急におかしくなった」のか「徐々におかしくなってきた」のかを見るのが有効です。急変はシステム障害やイレギュラー、緩やかな劣化はモデルドリフトを疑う、という大まかな目安を持っておくと、開発会社への相談内容を整理しやすくなります。
再学習を発注するタイミングと判断基準
精度劣化のサインに気づいたら、次に考えるのは「いつ、開発会社に再学習(AIを新しいデータで学習し直すこと)を依頼すべきか」です。多くの解説記事は「定期的に再学習しましょう」としか書いていませんが、発注者が本当に知りたいのは「自社の場合、今がそのタイミングなのか」という具体的な判断基準のはずです。ここでは意思決定のための考え方を整理します。
再学習を検討すべき判断軸
再学習にはコストがかかります。やみくもに依頼するのではなく、次の2つの軸で優先度を考えると判断しやすくなります。
- 業務影響度:その精度低下が、売上・コスト・顧客満足にどれくらい響いているか。価格予測や与信判断など、誤りが直接損失につながる用途は影響度が高く、優先的に対応すべきです。
- 精度低下の幅と継続性:低下が一時的なのか、継続的に右肩下がりなのか。緩やかでも継続的な低下は、ドリフトが進行しているサインであり、早めの対応が必要です。
この2軸を組み合わせ、「業務影響度が高く、かつ継続的に精度が下がっている」領域から優先して再学習を検討するのが基本的な考え方です。逆に、影響度が低く一時的な変動であれば、しばらく様子を見るという判断も合理的です。
業種・用途別の再学習サイクルの目安
どのくらいの頻度で再学習すべきかは、扱う対象が変化するスピードによって変わります。あくまで目安ですが、次のように考えると整理しやすいでしょう。
- 変化が速い領域(短サイクル):EC・小売の需要予測、金融の与信・不正検知、SNSやトレンドを扱うサービスなど。市場やユーザー行動の変化が速いため、短い周期での見直しが必要になりやすい領域です。
- 変化が緩やかな領域(長サイクル):製造設備の異常検知、定型書類の判定など、対象の性質が比較的安定している領域。比較的長い周期でも運用できる場合があります。
重要なのは、頻度を固定で決めつけるのではなく、前の章で挙げたサインを定点観測しながら、サイクルを見直していくことです。
開発会社に依頼するときに確認・指示すべきこと
実際に開発会社へ相談する際は、次のポイントを確認・依頼すると話がスムーズに進みます。
- 精度の診断を依頼する:「現在のAIの精度がどう推移しているか、ドリフトが起きていないか診断してほしい」と伝えます。発注者が原因を断定する必要はなく、診断そのものを依頼するのが現実的です。
- 再学習の費用と工程を確認する:再学習にどのくらいの費用・期間がかかるのか、見積もりを求めます。
- データの準備は誰が行うかを確認する:再学習には新しいデータが必要です。そのデータを自社が用意するのか、開発会社が収集・整備するのか、役割分担を明確にしておきましょう。
ここまでの内容を踏まえると、「精度が下がってから慌てて交渉する」のではなく、あらかじめ運用後の取り決めを契約で固めておくほうが、はるかに発注者の負担は軽くなります。次の章では、その契約面のポイントを見ていきます。
はじめての AI 導入ガイド――中小企業が失敗しないための7ステップ

この資料でわかること
AI導入を検討しているが「何から始めればよいか分からない」中小企業の意思決定者に対し、導入プロジェクトの全体像を一気通貫で提示し、「自社でも着手できる」という確信と具体的な行動計画を持ってもらうこと。
こんな方におすすめです
- AI導入を検討しているが、何から始めればよいか分からない
- ベンダーの選び方や費用感がつかめず、判断できない
- 社内でAI導入の稟議を通すための資料が必要
入力いただいたメールアドレスにPDFをお送りします。
モデルドリフト対策として保守契約に盛り込むべき条項
モデルドリフトは運用していれば必ず起きるものですから、その対処を「起きてから毎回交渉する」やり方では、費用も対応スピードも交渉のたびに不利になりがちです。そこでおすすめしたいのが、AIの運用・保守契約の段階で、ドリフト対策をあらかじめ取り決めておくことです。発注者として契約時に確認・盛り込んでおきたい項目を挙げます。
- 定期的な精度モニタリングの実施義務:開発会社が定期的にAIの精度を監視し、その結果を報告する義務を明記します。「気づいたら誰も見ていなかった」という事態を防ぎます。
- 精度が基準を下回った場合の再学習義務:あらかじめ合意した精度の基準(しきい値)を下回ったら、再学習などの対応を行う、という条件を定めておきます。
- 再学習費用の負担者の明記:再学習が発生したときの費用を、誰がどこまで負担するのかを契約で明確にします。これが曖昧だと、いざ精度が落ちたときに「誰の責任か」で揉める原因になります。
- 対応スピードの取り決め(SLA):精度劣化を検知してから、どのくらいの期間で対応に着手するかの目安を定めておくと安心です。
これらを契約に織り込んでおけば、運用後に精度が下がっても「契約に基づいて開発会社に対応を求める」という、明確な立場で動けるようになります。AIを「任せきり」にして不安を抱えるのではなく、契約で守りを固めておくことが、発注者にとっての賢い備えです。
なお、運用後の保守契約だけでなく、発注の前段階で「どの程度の精度を保証してもらうか」を取り決めておくことも重要です。発注前に合意すべき性能基準の決め方については、AI精度保証とは?発注者が契約前に合意すべき性能基準の決め方で詳しく解説しています。
よくある質問(モデルドリフトと再学習)
最後に、発注者の方から寄せられやすい疑問にまとめてお答えします。
Q1. データドリフトとコンセプトドリフトの違いは何ですか?
データドリフトは「AIに入ってくる入力データの傾向」が変わることで、コンセプトドリフトは「予測しようとしている正解の基準」そのものが変わることです。たとえば客層が変わるのがデータドリフト、市場のルールや価値観が変わって正解が変わるのがコンセプトドリフトです。どちらもAIの精度を下げる原因になりますが、対処を相談する際にどちらのタイプかを開発会社に伝えると、原因の切り分けがスムーズになります。
Q2. AIの精度劣化を検知する方法はありますか?
技術的にはKS検定やPSIといった統計手法でデータの変化を監視できますが、発注者がこれを自分で行う必要はありません。基本的には開発会社に精度モニタリングを依頼し、定期的に報告を受けるのが現実的です。あわせて、現場の違和感やクレームの増加といった日常のサインを定点観測しておくと、早期に異変に気づけます。
Q3. 再学習の費用は誰が負担するのですか?
これは契約内容次第であり、明確なルールがあるわけではありません。だからこそ、運用・保守契約を結ぶ段階で「再学習費用の負担者」をあらかじめ取り決めておくことが重要です。取り決めがないまま運用を始めると、いざ精度が落ちたときに費用負担をめぐって交渉が必要になり、対応も遅れがちになります。
Q4. 発注者(非エンジニア)がモデルドリフトに気づくサインは何ですか?
ダッシュボードを読めなくても気づけるサインはたくさんあります。代表的なのは、現場から「予測がよく外れる」という声が増える、ユーザーのクレームが増える、AIの出力を人が手直しする場面が増える、特定の顧客層や時期だけ挙動がおかしい、といったものです。これらはモデルドリフトの有力な兆候なので、見つけたら開発会社に診断を依頼するのが第一歩です。
まとめ|発注者が運用後に取るべき次の一歩
モデルドリフトとは、運用中のAIが時間とともに精度を落としていく自然な現象です。AIは学習を終えた瞬間が精度のピークで、現実が変化するほど予測はズレていきます。これは失敗ではなく、メンテナンスの前提として織り込んでおくべきものです。
最後に、発注者が運用後に取るべき行動を「やることリスト」として整理します。
- 精度劣化のサインを定点観測する:現場の違和感、クレームの増加、手直しの増加、特定セグメントの精度悪化などを日頃から見ておく。
- サインに気づいたら開発会社に「診断」を依頼する:原因を自分で断定せず、ドリフトが起きていないかの診断と、再学習の費用・工程の見積もりを求める。
- 再学習の優先度を業務影響度×精度低下幅で考える:影響が大きく継続的に下がっている領域から優先して対応する。
- 保守契約の再学習条項を確認する:モニタリング義務・再学習義務・費用負担・対応スピードが取り決められているかをチェックし、なければ見直しを相談する。
これらを押さえておけば、「精度が下がった気がする」という漠然とした不安は、「次に何をすべきか」という具体的な行動に変わります。
なお、モデルドリフトへの対処は、AI開発全体のなかでは「導入後の継続改善フェーズ」に位置づけられます。PoC(試作・検証)から本番運用、そして継続改善までを見据えてAI開発をどう段階的に発注すればよいかについては、AI開発ロードマップとは?PoCから本番まで段階発注する設計法もあわせてご覧ください。
生成AI(LLM)にもモデルドリフトは起きるのか(コラム)
ChatGPTのような生成AI(大規模言語モデル、LLM)を業務に取り入れる企業も増えています。こうしたLLMにも、モデルドリフトに似た問題は起こり得ます。たとえば、LLMには「知識のカットオフ(学習データがいつまでのものか)」があり、その後に起きた出来事は反映されません。世の中が変化するほど、回答が現実とズレていくという意味では、これもドリフトの一種と捉えられます。また、サービス側のモデル更新によって、同じ指示に対する出力の傾向が変わることもあります。生成AIを使う場合も、「一度導入したら永久に同じ品質が続くわけではない」という前提で、出力の品質を定期的に確認していく姿勢が大切です。
はじめての AI 導入ガイド――中小企業が失敗しないための7ステップ

この資料でわかること
AI導入を検討しているが「何から始めればよいか分からない」中小企業の意思決定者に対し、導入プロジェクトの全体像を一気通貫で提示し、「自社でも着手できる」という確信と具体的な行動計画を持ってもらうこと。
こんな方におすすめです
- AI導入を検討しているが、何から始めればよいか分からない
- ベンダーの選び方や費用感がつかめず、判断できない
- 社内でAI導入の稟議を通すための資料が必要
入力いただいたメールアドレスにPDFをお送りします。



