Вот жесткая правда: если ваша ML-модель показывает 85% точность на бэктесте, она почти наверняка сольет деньги на живом рынке. Я видел десятки фрилансеров, которые строили красивые LSTM-сети с идеальными графиками производительности, а потом терялись в шоке, когда реальная торговля приносила минус.
Три ресурса, которые объясняют проблему честно
Статья Marcos Lopez de Prado на SSRN разбирает концепцию комбинаторной симметрии. Он показывает математически, почему большинство паттернов в финансовых данных - это шум, а не сигнал. Его книга The Elements of Financial Machine Learning стоит каждого доллара.
Блог QuantStart публиковал серию постов о walk-forward анализе. Там конкретные примеры кода на Python, где видно, как модель разваливается при смещении временного окна всего на 3 месяца.
Канадское исследование 2019 года в Journal of Financial Data Science проанализировало 150 опубликованных торговых стратегий. Результат? 93% не работают после учета транзакционных издержек и проскальзывания.
Что реально помогает
Используйте комбинаторное очищение выборки - метод, который убирает избыточные корреляции между обучающими примерами. Добавьте эмбарго между train и test данными минимум на 2 недели. Тестируйте на множестве рыночных режимов, а не только на трендовых периодах.
Главное - примите, что 60% точности с низкой волатильностью лучше, чем 90% на бэктесте. Реальная торговля - это управление риском, а не погоня за идеальной кривой equity.