Тестирование стратегий и поиск данных

27.12.2016

Тестирование стратегий и поиск данныхВ этой статье будут рассматриваться два связанных метода, которые активно используются трейдерами: тестирование стратегий историей и поиск данных для выполнения теста. Оба этих метода достаточно сильны и обладают ценностью при их правильном использовании, что является проблемой многих торговцев. Поэтому здесь также будут описаны две ловушки, в которые попадают часто трейдеры, известные как многократная проблема гипотезы и сверхнастройка. Тестирование стратегий — это процесс использования исторических данных для проверки работы некоторой торговой стратегии. Такое тестирование начинается со стратегии, которую вы хотели бы проверить, например, покупая EUR/USD выше пересечения 21-дневного скользящего среднего значения и продавая ниже пересечения этого среднего числа. Вы можете, конечно, проверить эту стратегию, наблюдая за движением рынка и в настоящем времени, но это займет много времени.

Поэтому используются обычно исторические данные, которые доступны, например, в торговом терминале. Для достижения более объективных результатов тестирования следует выбирать случайные периоды времени или одновременно несколько различных временных промежутков. Поиск данных предполагает нахождение информации для определения местонахождения образцов корреляции между переменными. В примере выше, использование 21-дневной стратегии скользящего среднего значения, этот специфический индикатор выбран случайно, но это не предполагает, что стратегия проверяется наобум. Это – тот случай, когда поиск данных может пригодиться. Можно перерыть много исторических данных по паре EUR/USD, чтобы увидеть, как цена вела себя после пересечения множества различных скользящих средних значений, можно также проверить ценовые движения другими индикаторами также и увидеть соответствие крупных ценовых движений. Процесс поиска данных может быть спорным, потому что, несколько обманчив.

Действительно ли поиск данных обоснованная научная техника? С одной стороны научный метод говорит, что вначале создается гипотеза, а затем происходит ее проверка против имеющихся данных, но с другой стороны необходимо сделать исследование данных прежде предполагаемой гипотезы. Так, где же истина? Информация нам доступна во время Наблюдения и Проверки. Поэтому оба этих состояния верны. Мы можем использовать данные, как для создания гипотезы, так и для ее проверки.

Но вы должны удостовериться при этом, что в обоих случаях используется не одна и та же информация! Вы не должны проверять свою гипотезу, используя тот же самый набор данных, что и для ее предположения. Другими словами, если вы используете поиск данных, чтобы придумать идею стратегии, — удостоверьтесь, что используете другие данные для тестирования этой идеи. Теперь мы обратим свое внимание на два фактора неправильного использования поиска данных и исторического тестирования, где проблема одна — "переоптимизация", которая делится еще на два типа: многократная проблема гипотезы и сверхнастройка. В некотором смысле они являются противоположными способами одной и той же ошибки. Многократная проблема гипотезы предполагает выбор из многих простых гипотез, в то время как сверхнастройка создает одну очень сложную гипотезу. Многократная Проблема Гипотезы. Обратимся к нашему примеру 21-дневной стратегии скользящего среднего значения. Предположим, что мы тестируем стратегию за 5 прошедших лет данных рынка.

Результаты в этом случае не очень хорошие. Однако, мы легко не сдаемся. Допустим, мы решаем проверить итоги 9-дневного скользящего среднего значения за этот период, так как они могут быть лучше. Мы проводим новый тест, и видим, что результаты все еще не фантастические, но лучше чем 21-дневного значения. Тогда мы проверяем, например, 5-дневные и 33-дневные скользящие средние значения. И, наконец, проверяем средние значения 2-дневное, 3-дневное, 4-дневное и т. д. вплоть до 51-дневного скользящего среднего значения.

Leave a Reply