Kronos とは?金融市場向けの OSS ファンデーションモデルを解説

金融市場における時系列予測は、従来の機械学習モデルから大規模ファンデーションモデルへとパラダイムシフトが起きています。2025 年以降、Amazon の Chronos や Google の TimesFM など汎用の時系列ファンデーションモデルが相次いで登場しましたが、これらのモデルの多くは金融データへの特化度が低く、K-line(ローソク足)データの独特のパターンを十分に捉えられないという課題がありました。
そのような状況の中、清華大学の研究チームが公開した Kronos(GitHub: shiyu-coder/Kronos)は「世界初の金融市場向け OSS ファンデーションモデル」として注目を集めています。世界 45 の取引所から収集した 120 億件以上の K-line レコードで事前学習されており、AAAI 2026 に採択された研究成果です。
本記事ではドキュメントベースで Kronos の概要・アーキテクチャ・モデルバリアントの選び方・他の TSFM との比較・基本的な使い方を解説します。Kronos の採用を検討しているエンジニアや研究者の意思決定の材料としていただければ幸いです。
なお本記事はドキュメント・README・論文に基づいた紹介であり、実際の動作確認は行っていません。本番利用前には必ずご自身の環境での検証をお願いします。

目次
作業時間削減
システム化を通して時間を生み出し、ビジネスの加速をサポートします。
システム開発が可能に
Kronos とは?金融市場に特化した OSS ファンデーションモデル
Kronos は、金融市場の K-line(ローソク足)シーケンスを「言語」として捉え、それを学習するために設計されたデコーダーオンリーのファンデーションモデル群です。
プロジェクトの公式説明によれば、Kronos は「初の金融ローソク足(K-line)向けオープンソースファンデーションモデルであり、世界 45 の取引所のデータで学習されている」とされています(出典: GitHub - shiyu-coder/Kronos)。
プロジェクトの基本情報
項目 | 値 |
|---|---|
GitHub スター数 | 19,400(2026-04-19 時点) |
フォーク数 | 3,500 |
ライセンス | MIT |
採択学会 | AAAI 2026 |
言語 | Python (81.9%), HTML (17.7%) |
なぜ金融特化のモデルが必要なのか
汎用時系列ファンデーションモデルが登場した際、金融データへの応用が期待されましたが、実際には大きな課題がありました。Kronos の論文(arXiv 2508.02739)では次のように述べられています:一般的な TSFM の事前学習データに占める金融データの割合は 1% 未満であり、K-line データに固有の非定常性・高ノイズ・複雑な動学を十分に捉えられていないとされています。
Kronos はこの問題を「100% 金融データによる事前学習」で解決しようとするアプローチです。
Kronos のアーキテクチャ: 2 段階フレームワークの仕組み
Kronos のコアとなる技術は「2 段階フレームワーク」です。論文では「K-line Tokenization(K-line トークナイゼーション)と Autoregressive Pre-training(自己回帰事前学習)」と説明されています(出典: Kronos 論文 arXiv 2508.02739)。
Stage 1: 専用トークナイザー(BSQ ベース)
第 1 段階は、連続的な市場データを離散トークンに変換する専用トークナイザーです。
論文では「Binary Spherical Quantization(BSQ)を用いた Transformer 系オートエンコーダー」として説明されています。仕組みを簡単にまとめると以下のとおりです:
- 各 K-line は「coarse subtoken(粗粒度)」と「fine subtoken(細粒度)」という 2 層の階層的な離散トークンに変換されます
- 語彙サイズは 2^20 形式で、各サブトークンレベルごとに 2^10 エントリー(1,024 種類)の表現が可能です
- 対象データは OHLCVA(始値・高値・安値・終値・出来高・売買代金)の全次元を扱います
この階層的なトークン化により、価格の大まかなトレンドと細かい変動パターンの両方を捉えることができます。
Stage 2: 自己回帰 Transformer
第 2 段階は、トークン化された K-line シーケンスを自己回帰的に学習するデコーダーオンリー Transformer です。
特徴として、世界 45 の取引所から収集した 120 億件超の K-line レコード(7 種類の時間粒度:1 分〜週足)で事前学習されており、特定のタスクへのファインチューニングなしに多様な定量的ファイナンスタスクをこなせるゼロショット能力を持ちます。
モデルファミリーの比較: mini から large まで
Kronos は 4 つのバリアントを提供しており、すべて Hugging Face Hub(NeoQuasar) からアクセス可能です。
モデル | パラメータ数 | コンテキスト長 | 公開状況 |
|---|---|---|---|
Kronos-mini | 4.1M | 2048 | オープンソース |
Kronos-small | 24.7M | 512 | オープンソース |
Kronos-base | 102.3M | 512 | オープンソース |
Kronos-large | 499.2M | 512 | クローズドソース(非公開) |
Kronos-large は公開されていない点に注意が必要です。 コミュニティからアクセス可能なモデルは mini・small・base の 3 種類に限られます。
採用するバリアントの選び方
- Kronos-mini(4.1M): コンテキスト長が 2048 と最大。実験・プロトタイプ作成や、長い時系列を扱う場面に向いています
- Kronos-small(24.7M): リソースが限られた環境での利用に適しています
- Kronos-base(102.3M): 論文でのベンチマーク結果が報告されており、性能と実用性のバランスが取れた標準モデルです
ベンチマーク性能: 汎用 TSFM との比較
論文(arXiv 2508.02739)で報告されているベンチマーク結果は以下のとおりです:
タスク | 指標 | Kronos の優位性 |
|---|---|---|
価格予測(price forecasting) | RankIC | 最強 TSFM ベースライン比 +93%、非事前学習最強比 +87% |
ボラティリティ予測(volatility forecasting) | MAE | -9%(低いほど良い) |
合成データ生成(synthetic generation) | generative fidelity | +22% |
特に注目されるのは価格予測での RankIC の 93% 改善です。RankIC(Rank Information Coefficient)はクロスセクション予測の順位相関を示す指標で、定量的ファイナンスで広く使われています。
類似リポジトリとの比較
Chronos(amazon-science/chronos-forecasting、約 4,800 スター)
Amazon が公開する汎用時系列予測モデルです。Chronos-2(120M パラメータ、エンコーダーオンリー)は 2025 年 10 月にリリースされ、多変量・共変量サポートを備えています。汎用性に優れますが、金融データへの特化はありません。Kronos との最大の違いは「金融 K-line に特化したトークナイザーの有無」と「訓練データの金融比率(Chronos は 1% 未満、Kronos は 100%)」です。
TimesFM(google-research/timesfm、約 15,600 スター)
Google Research が公開する汎用時系列ファンデーションモデルです(ICML 2024 採択)。BigQuery 統合によるエンタープライズ対応が強みで、200M パラメータのモデルが公開されています。Kronos と同様のデコーダーオンリーアーキテクチャを採用していますが、訓練データの金融比率は 1% 未満であり、金融タスクでは Kronos が統計的に有意な優位性を示しています。
クイックスタート: README の基本的な使い方
以下は GitHub README および Hugging Face モデルカード の公式コードをそのまま抜粋したものです。改変は行っておらず、実行にあたっては必ず元のドキュメントを参照してください。
インストール
pip install -r requirements.txt
(出典: https://github.com/shiyu-coder/Kronos/blob/master/README.md)
モデルとトークナイザーの読み込み・予測の実行
from model import Kronos, KronosTokenizer, KronosPredictor
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
predictor = KronosPredictor(model, tokenizer, device="cuda:0", max_context=512)
pred_df = predictor.predict(
df=x_df,
x_timestamp=x_timestamp,
y_timestamp=y_timestamp,
pred_len=120,
T=1.0,
top_p=0.9,
sample_count=1
)
(出典: https://github.com/shiyu-coder/Kronos/blob/master/README.md)
入力データの要件:
README によれば、入力データには ['open', 'high', 'low', 'close'] 列が必須です。volume と amount はオプションです。Kronos-small と Kronos-base の max_context は 512 が最大値であり、最適なパフォーマンスのためにはルックバック長がこの上限を超えないようにする必要があります。
ファインチューニング対応: Qlib との連携
Kronos はゼロショット利用だけでなく、ドメイン固有のファインチューニングパイプラインも提供しています。README では「中国 A 株市場データを使った Qlib 統合」のデモが紹介されています(出典: https://github.com/shiyu-coder/Kronos)。
Qlib は Microsoft が公開する定量投資プラットフォームであり、Kronos との組み合わせにより、特定の市場や銘柄セットに特化したモデルの構築が可能です。ファインチューニングを行うことで、ゼロショットより高い精度が期待できる場面もあります。
Kronos の採用を検討する際の注意点
Kronos の README には重要な注意書きが記載されています(出典: https://github.com/shiyu-coder/Kronos/blob/master/README.md):
"This is a research project. Production deployment requires additional considerations including portfolio optimization, risk factor neutralization, and sophisticated backtesting methodologies." (意訳: 本プロジェクトは研究目的です。本番運用にはポートフォリオ最適化・リスクファクター中立化・高度なバックテスト手法など追加の検討が必要です。)
採用を検討する際に押さえておくべき点を以下にまとめます:
- Kronos-large は非公開: 最大パラメータのモデル(499.2M)はオープンソースではありません。公開モデルの最大は Kronos-base(102.3M)です
- 研究プロジェクト: 2025 年公開の比較的新しいプロジェクトです。本番金融システムへの直接適用には追加の評価・バックテストが必要です
- MIT ライセンス: 商用利用・改変・再配布が可能です。ただし本番利用前にはライセンス条文を必ず確認してください
- GPU 環境: コードサンプルでは
device="cuda:0"が使用されており、GPU 環境が推奨されます
Kronos に関連するリソース
プロジェクトに関連する公式リソースをまとめます:
- GitHub リポジトリ: https://github.com/shiyu-coder/Kronos
- arXiv 論文(2508.02739): https://arxiv.org/abs/2508.02739
- ライブデモ(BTC/USDT 予測): https://shiyu-coder.github.io/Kronos-demo/
- Hugging Face Hub(NeoQuasar): https://huggingface.co/NeoQuasar
- GitHub Issues: 146 件の Open Issues が活発に議論されており、コミュニティが成長中です
時間を自由に
挑戦と成長を共にできるメンバーとの出会いをお待ちしています。









