Brand LogoBrand Logo (Dark)
首页智能体广场工具包广场GitHub 精选提交智能体博客

分类

  • AI 绘画
  • AI 音频
  • 自动化工具
  • 聊天机器人
  • 编程工具
  • 金融工具

分类

  • 大语言模型
  • 营销工具
  • 零代码/低代码
  • 研究与搜索
  • 视频与动画
  • 视频编辑

GitHub 精选

  • DeerFlow — 字节跳动开源超级智能体框架

最新博客

  • OpenClaw vs Composer 2 Which AI Assistant Delivers More Value
  • Google AI Studio vs Anthropic Console
  • Stitch 2.0 vs Lovable Which AI Design Tool Wins in 2026
  • Monetizing AI for Solopreneurs and Small Teams in 2026
  • OpenClaw vs MiniMax Which AI Assistant Wins in 2026

最新博客

  • OpenClaw vs KiloClaw Is Self-Hosting Still Better
  • OpenClaw vs Kimi Claw
  • GPT-5.4 vs Gemini 3.1 Pro
  • Farewell to Bloomberg Terminal as Perplexity Computer AI Redefines Finance
  • Best Practices for OpenClaw
LinkStartAI© 2026 LinkstartAI. 版权所有。
联系我们关于
  1. 首页
  2. GitHub 精选
  3. Kronos
Kronos logo

Kronos

面向金融OHLCV的开源基础模型:离散化K线为层级token并用自回归Transformer学习市场序列。
8.4kPythonMIT License
#python#pytorch#transformer#时间序列预测#金融-k线#ohlcv
#离散-tokenizer
#自回归模型
#量化研究
#金融数据建模
#finetuning
#foundation-model

项目简介

Kronos 的核心思路是把金融市场的K线序列当作一种可建模的“语言”。它先用专用tokenizer把连续、多维的OHLCV压缩成层级离散token,再用解码器式自回归Transformer在token序列上做预训练,从而把预测、生成与下游任务统一到同一种表示空间。模型权重与Tokenizer可以直接从 Hugging Face 拉取,并提供面向工程的Predictor接口,把归一化、截断、采样与反归一化做成可复用管道。需要进一步贴合你的资产、频率与交易制度时,可以用 Qlib 组织数据与回测流程,再用torchrun做两阶段微调(tokenizer与predictor),把“研究笔记”推进到可回归的训练与评估闭环。

痛点 vs 创新

✕传统痛点✓创新方案
把金融时序直接喂给通用模型,往往会被噪声与尺度差异击穿:同一套特征与分布假设在不同市场/频率下会迅速漂移。Kronos 用两阶段“离散tokenizer→自回归预训练”把连续OHLCV变成可学习的token语言,让建模目标与表示更稳定、可迁移。
传统时间序列方案把分桶、归一化、采样与评估散落在脚本里,实验难复现,结论难在团队内复用与回归。通过Predictor与成套微调脚本,把训练、推理与评估路径固化为可配置管道,便于A/B对比与回归测试。

架构深度解析

两阶段离散化建模范式
底层范式是先把连续OHLCV量化为层级离散token,再在token序列上做自回归预训练;这相当于为金融时序建立一套“可学习的字表与语法”。
从数据到预测的核心流转
核心流转是K线表格→tokenizer编码→自回归采样生成→反归一化输出。Predictor把截断、温度/Top-p采样与多路径平均等推理策略收敛到一致接口。
面向微调与回测的关键栈
关键技术栈以Python生态为主,训练侧依赖PyTorch分布式(torchrun),数据与回测可与Qlib协同,便于把同一套训练配置与评估集做成可回归工件。

部署指南

1. 克隆仓库并准备Python环境

bash
1git clone https://github.com/shiyu-coder/Kronos.git && cd Kronos && python -m venv .venv && . .venv/bin/activate

2. 安装依赖

bash
1pip install -U pip && pip install -r requirements.txt

3. 从Hugging Face加载模型与Tokenizer并运行预测脚本

bash
1python examples/prediction_example.py

4. (可选)安装并准备Qlib数据用于微调/回测

bash
1pip install pyqlib && python finetune/qlib_data_preprocess.py

5. (可选)用torchrun执行两阶段微调(tokenizer与predictor)

bash
1torchrun --standalone --nproc_per_node=2 finetune/train_tokenizer.py && torchrun --standalone --nproc_per_node=2 finetune/train_predictor.py

落地场景

核心场景目标人群解决方案最终收益
量化研究的价格路径预测基线量化研究员把多资产K线序列统一成token语言做预测与对比用同一评测口径快速迭代特征与策略输入,减少实验不可复现
跨市场数据的表示学习与迁移多市场/多交易所团队用统一Tokenizer对齐不同市场频率与尺度降低分布漂移带来的建模成本,把迁移学习变成工程可控流程
信号生成与回测管道一体化策略工程团队把预测输出转换为可交易信号并接入回测形成训练—推理—回测的闭环,便于回归与版本对比

避坑指南

避坑指南
  • 该项目的推理可以CPU运行,但微调与批量预测更依赖GPU与分布式训练资源,训练成本需要提前核算。
  • 把预测直接当作alpha会引入结构性风险:需要交易成本、滑点、风险暴露与组合约束,否则回测容易过拟合。
  • 不同交易所/品种的制度与数据质量差异很大,Tokenizer与数据清洗策略是效果上限的关键变量。

常见问题

Kronos适合用来做交易吗?▾
Kronos 更像“信号与表示学习底座”。如果要交易,必须把预测接入交易成本、滑点与组合约束,并用回归集与走样检测防止过拟合。
一定要GPU才能用吗?▾
不一定。推理与小规模实验可在CPU上跑;但要做批量预测、长周期训练或两阶段微调,建议用GPU并用torchrun做分布式以控制吞吐与稳定性。
如何把自己的市场数据接进来并做微调?▾
先把数据整理成OHLCV表格并统一时区/缺失值策略,再用 Qlib 组织训练/验证/测试切分与回测口径,最后按两阶段流程分别微调tokenizer与predictor,并用固定评测集做差分回归。
在 GitHub 上查看

项目指标

Star 数8.4 k
编程语言Python
开源协议MIT License
部署难度中等

Table of Contents

  1. 01项目简介
  2. 02痛点 vs 创新
  3. 03架构深度解析
  4. 04部署指南
  5. 05落地场景
  6. 06避坑指南
  7. 07常见问题

相关项目

nanobot
nanobot
22.5 k·Python
DeerFlow — 字节跳动开源超级智能体框架
DeerFlow — 字节跳动开源超级智能体框架
26.1 k·Python
gstack
gstack
0·TypeScript
Marketing for Founders
Marketing for Founders
2.2 k·Markdown