Рассматривать финансовый рынок как текст, который нужно прочитать, — вот ключевая гипотеза Kronos.
Логика проекта проста: финансовые данные (цены акций, объемы торгов, индикаторы) по своей сути представляют собой последовательности, обладающие временными зависимостями, подобно естественному языку. Почему бы не применить архитектуру Transformer, доказавшую свою эффективность в обработке языка, к финансовым данным?
shiyu-coder/Kronos набрал 24 946 звёзд и 4 360 форков на GitHub. Для сферы финансового ИИ это серьезный резонанс. Однако за этими цифрами скрывается главный вопрос: действительно ли подход к финансовым данным как к «языку» является надежным с технической точки зрения?
Технический подход: Токенизатор + Трансформер
Основной рабочий процесс Kronos делится на два этапа:
Первый шаг — дискретизация. Специализированный токенизатор отображает непрерывные данные финансовых временных рядов (цены, объемы и т. д.) в дискретные последовательности токенов. Это аналогично процессу в NLP, где текст разбивается на субтокены. Дискретизация позволяет модели обрабатывать финансовые данные с использованием стандартной архитектуры Transformer без необходимости создавать специализированную модель для временных рядов.
Второй шаг — прогнозирование. После того как токенизатор выдает последовательность токенов, модель Transformer используется для предсказания следующего шага. Структурно это идентично предсказанию следующего токена в NLP.
Преимущества этого подхода включают:
- Прямое использование зрелых технологических стеков из области NLP (механизмы внимания, позиционное кодирование, парадигмы предобучения + дообучения)
- Представления на уровне токенов естественным образом поддерживают мультимодальные входные данные (одновременное кодирование цен, объемов, технических индикаторов и т. д.)
- Предобученные модели могут быть перенесены на новые финансовые инструменты в режиме zero-shot
Но финансовые данные и язык принципиально различаются
Здесь необходимо трезво оценить реальность.
Последовательности токенов в естественном языке обладают ключевым свойством: семантической непрерывностью. Фразы «Сегодня отличная погода» и «Сегодня хорошая погода» находятся рядом в семантическом пространстве. Финансовые данные устроены иначе: скачок цены со 100 до 101 и скачок со 100 до 105 могут иметь одинаковое расстояние в пространстве токенов, но их фундаментальные рыночные последствия совершенно различны.
Что еще критичнее, статистические свойства финансовых рынков нестационарны. Базовая грамматическая структура языка сохраняется веками, тогда как рыночные режимы могут полностью меняться за считанные месяцы — переходя от низкой волатильности к высокой, от тренда к флэту. Паттерны, усвоенные предобученной моделью, могут оказаться совершенно бесполезными в новой рыночной конъюнктуре.
В статье по Kronos (опубликованной в августе 2025 года) авторы также признают эту проблему. Предлагаемое решение — улучшение способности к обобщению через дообучение и предобучение на множестве инструментов, — но по сути это гонка со временем, пытающаяся обогнать нестационарность рынка.
Активность проекта
Судя по данным GitHub, проект насчитывает 76 коммитов, а последнее обновление вышло в прошлом месяце. В трекере задач открыто 157 issues и 33 PR, что свидетельствует как об активном использовании проекта сообществом, так и о его быстрой итеративной разработке.
Структура проекта включает модули examples, model, finetune и webui, обеспечивая полный цикл обучения и инференса. Для тех, кто хочет опробовать модель, порог входа относительно низкий.
Моя точка зрения
Технический подход Kronos интересен с академической точки зрения, но требует крайней осторожности в реальной торговле.
Финансовый рынок — это не задача генерации текста. «Грамматика» ценовых последовательностей формируется стратегическим взаимодействием миллионов участников, и правила этого взаимодействия постоянно эволюционируют. Трансформеры способны улавливать статистические закономерности из исторических данных, но они не способны предвидеть внезапные структурные сдвиги на рынке.
Подходящие сценарии использования:
- Сравнение бенчмарк-моделей в количественных исследованиях
- Вспомогательное извлечение признаков для многофакторных моделей
- Образовательные и исследовательские цели
Неподходящие сценарии использования:
- Прямое использование для принятия решений в реальной торговле
- Замена традиционных фреймворков управления рисками
Из 24 900 звёзд большинство, скорее всего, получено из чистого любопытства. Лишь немногие действительно применяют модель в торговле, да и те, вероятно, используют её в связке с набором традиционных статистических моделей для сравнения.
Если вы занимаетесь количественными исследованиями, Kronos определенно стоит протестировать. Но помните: в финансах лежит огромный разрыв между моделью, хорошо работающей на исторических данных, и реальным извлечением прибыли на живом рынке.
Основные источники: