「AIエンジニアになるための学習ロードマップ」を探していると、論文・ブログ・チュートリアル・動画が無数にヒットします。生成AIのAPIは呼べるものの、アテンションの仕組みや学習ループ、エージェントの内部動作を自分の言葉で説明できない。そんなとき、何から手をつければよいのか判断できずに止まってしまうエンジニアは少なくありません。
教材が散在していること自体が、体系的な学び直しの最大の障害になっています。1つひとつの記事は良質でも、それらをどの順序で、どこまでの深さで学べばAIエンジニアリングを「使える」レベルに到達できるのかが見えないからです。
こうした課題に対し、GitHub で 25,000 を超えるスターを集めているのが、本記事で取り上げる無料のOSS学習教材「ai-engineering-from-scratch」です。線形代数の基礎から自律エージェント・本番運用までを、20 フェーズ・473 レッスンという1本の道筋として積み上げる構成になっています。
本記事では、このリポジトリが何をカバーするのか、学習設計の核となる「Build It → Use It → Ship It」という思想、フェーズ構成、そして類似の AI 学習 OSS との違いと選び方を、README と公式情報をもとに解説します。なお本記事は公式リポジトリと公式サイトのドキュメントに基づく調査であり、教材の実行・環境構築は行っていません。最終的に「自分はこの教材を採用すべきか」を判断する材料を提供することを目的としています。
ai-engineering-from-scratch とは|AIエンジニアリングを基礎から学ぶOSS
ai-engineering-from-scratch は、AI エンジニアリングを「ゼロから(from scratch)」体系的に学ぶための無料・オープンソースのカリキュラム教材です。リポジトリの説明文は「Learn it. Build it. Ship it for others.」と掲げられており、学んで、自分で作り、他者に届けるところまでを一連の流れとして設計しています。リポジトリの実体は GitHub の rohitg00/ai-engineering-from-scratch で公開されており、レッスンを読み物として閲覧できる 公式サイト も用意されています。
この教材が立脚する問題意識は、README 冒頭の次の引用に表れています。
Students using AI is at an all-time high (84%), but only 18% feel prepared to use it professionally.
(出典: rohitg00/ai-engineering-from-scratch README)
学生の 84% がすでに AI ツールを使っているにもかかわらず、それを職業的に使える準備ができていると感じるのは 18% に留まる、というギャップです。ai-engineering-from-scratch は、この「使っているが、使いこなせていない」隔たりを埋めることを狙った教材として位置づけられています。
基本スペック
採用判断の一次材料として、リポジトリの基本情報を整理します。数値は GitHub の公式メタデータ(2026 年 5 月時点)に基づきます。
項目 | 内容 |
|---|---|
リポジトリ | rohitg00/ai-engineering-from-scratch |
主要言語 | Python(カバー範囲は Python / TypeScript / Rust / Julia の 4 言語) |
ライセンス | MIT |
規模 | 20 フェーズ・473 レッスン・約 320 時間 |
スター数 | 25,181 |
フォーク数 | 4,085 |
最終更新 | 2026-05-27 |
費用 | 無料 |
スター 25,000 超という関心の高さに加え、最終更新が直近(2026 年 5 月 27 日)である点は、教材が放置されていないことを示す鮮度の指標になります。「何の教材で、どれくらいの規模で、今も動いているのか」という最初の判断材料は、この表でおおむね把握できます。
ai-engineering-from-scratch の学習設計|Build It → Use It → Ship It
ai-engineering-from-scratch の最大の特徴は、教材そのものより学習設計の思想にあります。コンセプトは、散在した論文・ブログ・デモではなく「1 本の背骨(spine)」として線形代数から自律エージェントまでを段階的に積み上げる、というものです。各レッスンは同じリズムで進み、毎回かならず手元に成果物が残るよう設計されています。
レッスンの構造と 6 つのビート
各レッスンは、README で次のように示される統一されたフォルダ構造を持ちます。
phases/<NN>-<phase-name>/<NN>-<lesson-name>/
├── code/ runnable implementations (Python, TypeScript, Rust, Julia)
├── docs/
│ └── en.md lesson narrative
└── outputs/ prompts, skills, agents, or MCP servers this lesson produces
(出典: rohitg00/ai-engineering-from-scratch README)
注目すべきは code/(実装)と docs/(解説)に加えて、outputs/ というフォルダが必ず存在する点です。これは各レッスンが生み出す再利用可能な成果物(プロンプト・スキル・エージェント・MCP サーバー)を格納する場所であり、後述する「毎レッスンが成果物を出す」設計の裏付けになっています。
各レッスンの中身は 6 つのビートで構成されます。MOTTO(標語)→ PROBLEM(解くべき問題)→ CONCEPT(概念)→ BUILD IT → USE IT → SHIP IT という流れです。この中核が BUILD IT と USE IT の分割です。
- BUILD IT: フレームワークを使わず、生の数式からアルゴリズムを自力で実装します。バックプロパゲーション、トークナイザ、アテンション、エージェントループなどを「自分の手で」組み立てる段階です。
- USE IT: 同じ処理を PyTorch や scikit-learn といった本番ライブラリで再現します。フレームワークが内部で何をしているのかを理解した状態で、はじめて実務的なツールを使う、という順序が徹底されています。
- SHIP IT: そのレッスンの学びを、プロンプト・スキル・エージェント・MCP サーバーといった再利用可能な成果物として書き出します。
「ライブラリを呼ぶ前に、その中身を自分で書く」という順序こそが、API は叩けるが内部を説明できないという冒頭の課題に正面から応える設計です。
「毎レッスンが成果物を出す」設計
多くの教材は「X を学びました、おめでとう」で終わりますが、ai-engineering-from-scratch は各レッスンが必ず再利用可能なツール(プロンプト・スキル・エージェント・MCP サーバー)を生成します。473 レッスンを進めれば、それと同じ数だけの成果物がポートフォリオとして手元に蓄積される計算です。
加えて、生成されたスキルは Claude や Cursor、Codex といったコーディングエージェントにインストールして使える形で配布される点も、近年の開発スタイルを意識した設計といえます。README には python3 scripts/install_skills.py でスキルを一括インストールできる旨が記載されています(本記事ではこの動作は検証していません)。学習が「知識の獲得」で完結せず、日々のツールに組み込まれる前提になっているのが特徴です。
20 フェーズ・473 レッスンの全体構成
ai-engineering-from-scratch は、数式(floor、土台)から始まりエージェント・本番運用(roof、屋根)に至るまでを 20 フェーズで積層します。自分の関心領域がカバーされているか、どこから入れるかを判断するために、README の "Contents" に基づくフェーズ一覧を示します。
フェーズ一覧
Phase | 名称 | レッスン数 |
|---|---|---|
0 | Setup & Tooling | 12 |
1 | Math Foundations | 22 |
2 | ML Fundamentals | 18 |
3 | Deep Learning Core | 13 |
4 | Computer Vision | 28 |
5 | NLP: Foundations to Advanced | 29 |
6 | Speech & Audio | 17 |
7 | Transformers Deep Dive | 14 |
8 | Generative AI | 14 |
9 | Reinforcement Learning | 12 |
10 | LLMs from Scratch | 22 |
11 | LLM Engineering | 17 |
12 | Multimodal AI | 25 |
13 | Tools & Protocols | 23 |
14 | Agent Engineering | 42 |
15 | Autonomous Systems | 22 |
16 | Multi-Agent & Swarms | 25 |
17 | Infrastructure & Production | 28 |
18 | Ethics, Safety & Alignment | 30 |
19 | Capstone Projects | 55 |
線形代数・微積分などの数学基礎(Phase 1)に始まり、古典的な機械学習・深層学習・コンピュータビジョン・NLP・音声・強化学習を経て、LLM の自作(Phase 10)、エージェント工学(Phase 14、42 レッスン)、マルチエージェント、本番インフラ、倫理・安全性、そして 55 レッスンの集大成(Phase 19 Capstone)へと積み上がります。LLM が全体の 1 フェーズとして位置づけられている点に、この教材の網羅性が表れています。
どこから始めるか
473 レッスンすべてを順に進める必要はありません。README の "Where to start" では、背景別に推奨開始フェーズと所要時間の目安が示されています。
- プログラミング・AI ともに未経験: Phase 0 から(約 306 時間)
- Python は書けるが ML は未経験: Phase 1 から(約 270 時間)
- ML は知っているが深層学習は未経験: Phase 3 から(約 200 時間)
- 深層学習は分かり、LLM/エージェントを学びたい: Phase 10 から(約 100 時間)
- シニアでエージェント工学だけ学びたい: Phase 14 から(約 60 時間)
さらに、自分のレベルを自動判定したい場合のために /find-your-level という組み込みスキルが用意されています。README によれば、10 問の配置クイズに答えると開始フェーズが判定され、時間見積もり付きの個別学習パスが生成される仕組みです。「どこから入ればよいか分からない」という入口の迷いを、教材側が吸収しようとしている点は実務エンジニアにとって扱いやすい設計といえます。
類似の AI 学習 OSS との違いと選び方
「from scratch」を掲げる AI 学習教材は他にも有力なものが存在します。採用判断のためには、それらとの違いを把握することが欠かせません。ここでは代表的な 3 つの OSS と比較します(スター数は 2026 年 5 月時点の GitHub メタデータに基づく実測値です)。
リポジトリ | スター | 範囲・特徴 | ai-engineering-from-scratch との差分 |
|---|---|---|---|
約 111,500 | 21 レッスンの生成 AI アプリ構築入門 | 生成 AI 活用の「入口」に特化。本教材は数学基礎から本番運用までの全域を扱う | |
約 96,400 | 書籍付属コード。LLM を PyTorch で自作することに深掘り特化 | LLM 単一テーマの深さ。本教材は LLM を 20 フェーズ中の 1 つとして横断的に扱う | |
約 79,700 | LLM ロードマップ + Colab ノートブック | LLM 領域・Colab 前提。本教材はローカル実行・4 言語・毎レッスン成果物を持つ |
この 3 つはいずれもスター数で ai-engineering-from-scratch を上回りますが、扱う範囲と思想が異なります。網羅範囲で並べると、生成 AI 入門(microsoft)< LLM 領域(mlabonne)< LLM 深掘り(rasbt)< 数学から本番運用までの全域(ai-engineering-from-scratch)という関係になります。
ai-engineering-from-scratch 固有の独自性は、すでに述べた「BUILD IT(生の数式で自作)→ USE IT(本番ライブラリ)→ SHIP IT(再利用可能な成果物)」の 3 段構成と、成果物がコーディングエージェントのスキルとして配布される点にあります。
選び方の指針
裏返せば、目的次第では他教材の方が適している場合もあります。判断の目安は次のとおりです。
- LLM の内部実装だけを深く理解したい → rasbt/LLMs-from-scratch(書籍と連動した深掘り)
- まず生成 AI アプリを動かして全体像をつかみたい → microsoft/generative-ai-for-beginners(短期間の入門)
- LLM のロードマップと Colab で手早く回したい → mlabonne/llm-course
- 数学基礎から AI エンジニアリング全域を、自分の手で体系的に積み上げたい → ai-engineering-from-scratch
「広く・深く・自分で実装しながら」を求めるなら ai-engineering-from-scratch、「特定領域を短期間で」なら他の 3 つ、という切り分けが現実的です。
メンテナンス状況とライセンス|採用前に確認すべき点
学習教材を本格的に採用するなら、その教材が継続的に保守されているかは無視できない論点です。473 レッスンという規模は、裏を返せば維持コストが大きいことを意味します。ここでは健全性の根拠を整理します。
メンテナンスの健全性
まず鮮度の面では、最終更新が 2026 年 5 月 27 日と直近であり、リポジトリはアーカイブされていません。スター 25,181・フォーク 4,085 という数字は、利用者と貢献の母集団がある程度の規模で存在することを示します。
仕組みの面でも、README によれば品質を保つための CI が組まれています。GitHub Actions が PR ごとに全レッスンのカタログ(catalog.json)を再生成し、内容が古くなっていればビルドを失敗させる構成です。加えて、レッスンが満たすべき不変条件をチェックする audit_lessons.py や、Python コードの構文チェックを行う仕組みも用意されています。473 レッスンという規模を人手だけで一貫させるのは困難なため、自動チェックで整合性を担保する設計が取られていると読み取れます。
貢献体制についても、CONTRIBUTING・FORKING・ROADMAP・行動規範(CODE_OF_CONDUCT)といったドキュメントが整備されています。今後の方針や貢献の手順を確認したい場合は、ROADMAP や CONTRIBUTING が起点になります。
一方で、運営面では注意も必要です。README によれば、このプロジェクトはスポンサーシップによって維持されています。資金提供の継続性が長期的な保守の前提になっている点は、採用前に認識しておきたいリスク要因です。また、README 内には「7.5K stars」という過去の数値が残っている箇所があります。本記事で採用している最新の正確なスター数は GitHub メタデータ上の 25,181 であり、README 内の古い数値はそのまま受け取らない方が安全です。
ライセンスと利用条件
ライセンスは MIT です。LICENSE のとおり、フォーク・教育利用・商用利用・派生物の配布などが広く認められており、利用のハードルは低い部類に入ります。社内研修や勉強会の教材として取り込みたい場合も、ライセンス上の制約は小さいといえます。
どんなエンジニアに向くか・導入判断のまとめ
最後に、これまでの内容をふまえて導入判断の軸を整理します。本記事は GitHub リポジトリと公式サイトのドキュメントに基づく調査であり、レッスンの実行や環境構築は行っていない点を改めて申し添えます。実際の難易度や解説の質は、各自で公式サイトのレッスンを読んで確認することをおすすめします。
向いていると考えられるのは、次のようなエンジニアです。
- 生成 AI の API は使えるが、アテンションや学習ループ、エージェントの内部動作を自分の言葉で説明できるようになりたい人
- 散在した教材ではなく、数学基礎から本番運用までを 1 本の道筋として体系的に学び直したい人
- 読むだけでなく、自分の手で実装しながら、再利用可能な成果物を蓄積していきたい人
- Claude や Cursor などのエージェントにスキルとして組み込みながら学びたい人
逆に、別の教材が適しているのは次のような場合です。
- 学びたい範囲が LLM の内部実装に限られている → rasbt/LLMs-from-scratch
- まず短期間で生成 AI アプリを動かして全体像をつかみたい → microsoft/generative-ai-for-beginners
- 数学やアルゴリズムの自力実装には時間をかけず、ロードマップに沿って効率よく進めたい → mlabonne/llm-course
ai-engineering-from-scratch は、網羅範囲の広さ・自分の手で実装する設計・毎レッスンが成果物を残す仕組みという 3 点で、他の AI 学習 OSS と明確に性格が異なります。学習量は約 320 時間と相応に大きいため、自分の背景に合った開始フェーズを選び、必要な範囲から取り組むのが現実的です。
次の一歩として、まずは 公式サイト でレッスンを 1 つ読んでみる、/find-your-level で自分の開始フェーズを確認してみる、あるいはメンテナである Rohit Ghumare 氏のプロフィール から関連プロジェクトを辿ってみる、といった形で、自分に合うかどうかを直接確かめてみてください。



