C
ChaoBro

Kronos: foundation model, читающий язык финансовых рынков, 11 751 звезда за месяц

Kronos: foundation model, читающий язык финансовых рынков, 11 751 звезда за месяц

Пространство финансовых данных и прогнозирования временных рядов годами контролировалось традиционными количественными моделями и специализированными архитектурами глубокого обучения (LSTM, варианты Transformer).

Kronos пошёл другим путём: рассматривая финансовый рынок как «язык» для изучения.

Подход

Kronos — это foundation model для финансовых рынков. Основная идея — закодировать различные рыночные сигналы — ценовые движения, объёмы, технические индикаторы, новостные настроения, макроэкономические данные — в единый «язык» и затем моделировать его архитектурой, подобной LLM.

Это следует той же логике, что и большие языковые модели, обрабатывающие естественный язык: не полагаясь на правила или вручную созданные признаки, а позволяя модели самостоятельно учиться паттернам из массивных данных.

Технический обзор

Из репозитория видно несколько ключевых элементов дизайна Kronos:

  • Унифированное кодирование входных данных: разные типы финансовых данных (числовые, текстовые, событийные) отображаются в единое пространство токенов
  • Самообучаемое предобучение: masked prediction или next-token prediction на масштабных исторических финансовых данных
  • Zero/few-shot перенос: после предобучения может переноситься на новые рынки или классы активов с zero или few-shot файн-тюнингом

Преимущество этого подхода — кросс-рыночная универсальность. Модель, обученная на A-акциях, теоретически может перенестись на американские акции, криптовалюты или товары с минимальным файн-тюнингом — при условии, что лежащий в основе «финансовый язык» общий.

Проверка реальностью

Немного холодной воды:

  • Непредсказуемость рынка: даже сильнейшая модель не может гарантировать стабильную прибыль. Рынки влияют политика, настроения и непредвиденные события — множество факторов, которые невозможно выучить из исторических данных.
  • Риск переобучения: финансовые данные имеют крайне низкое отношение сигнал/шум; модели легко учат шум, а не истинные сигналы.
  • Бэктест ≠ живая торговля: красивые кривые доходности на исторических данных могут полностью исчезнуть в живой торговле.

Ценность Kronos не в «помощи в зарабатывании денег», а в предоставлении сообществу финансовых исследователей open-source, воспроизводимой foundation model. Раньше для финансового NLP или количественных исследований нужно было либо использовать закрытые API, либо тренировать с нуля. Теперь есть готовый baseline.

Основной источник: