Traders Fair Nigeria — начнётся через 00 дней
Начнётся через 00 дней Посмотреть участников

Как собирать качественные исторические данные для бэктестинга

Где искать, как очищать и проверять исторические данные, чтобы тесты не искажались из-за пропусков, ошибок или survivorship bias.

Как собирать качественные исторические данные для бэктестинга

Каждый бэктест хорош настолько, насколько хороши данные, лежащие в его основе. Исторические данные низкого качества приводят к ложным результатам, излишней уверенности и потере времени. Для создания надежных стратегий трейдерам нужны точные, чистые и согласованные данные. Эта статья объясняет, где получить исторические данные, что проверять и как подготовить их для бэктестинга.


Почему качество данных имеет значение

  • Отсутствующие свечи создают ложные сигналы.
  • Неправильные метки времени искажают индикаторы.
  • Нереалистичные спреды завышают результаты.
  • Неполные тиковые данные скрывают риски проскальзывания.

Короче говоря, плохие данные = плохая стратегия.


Источники исторических данных

  1. Данные, предоставляемые брокером
    • Обычно бесплатны, но могут иметь пробелы или ограниченную глубину.
  2. Специализированные поставщики
    • Такие компании, как Tickstory, Dukascopy и Quandl, предоставляют высококачественные тиковые и барные данные.
  3. Биржевые данные
    • Лучше всего подходят для акций, фьючерсов и криптовалют, так как поступают непосредственно с бирж.
  4. API
    • Некоторые брокеры и сервисы предоставляют прямые API для загрузки рыночной истории.

Типы необходимых данных

  • Тиковые данные: Каждое изменение цены. Лучше всего подходит для скальпинга и высокочастотных стратегий.
  • Минутные данные: Сбалансированный вариант для большинства розничных бэктестов.
  • Дневные/недельные данные: Полезны для свинговых и позиционных торговых систем.

Как подготовить исторические данные

  1. Проверьте полноту – отсутствие пропущенных дней или часов.
  2. Нормализуйте метки времени – убедитесь, что часовые пояса соответствуют вашей платформе.
  3. Включите спреды и комиссии – для реалистичных результатов.
  4. Отфильтруйте плохие тики – некоторые фиды имеют выбросы (например, ценовые шипы).

Пример влияния плохих данных

Стратегия на основе скользящих средних на EURUSD выглядит прибыльной с бесплатными 1-минутными данными (+25% годовых). Но при тестировании на тиковых данных с реальными спредами результат падает до -3% в год. Одно только качество данных изменило исход.


Лучшие практики

  • Всегда проверяйте данные перед использованием.
  • Используйте историю не менее 5-10 лет, если доступна.
  • Для форекса предпочитайте тиковые данные с переменными спредами.
  • Для акций всегда проверяйте, включены ли дивиденды и сплиты.

Заключение

Высококачественные исторические данные — это основа надежного бэктестинга. Сбор, очистка и проверка ваших данных гарантируют, что ваши стратегии отражают реальные торговые условия. Без этого даже самый умный алгоритм строится на песке.

Понимание ключевых метрик бэктестинга (Sharpe, просадка, Profit Factor)
Погружение в коэффициент Шарпа, максимальную просадку и profit factor: как они считаются и как применять их корректно.
Следующий урок