К вопросу о распределениях. StockSharp

К вопросу о распределениях

16.01.2012

Church

Недавно встретил фразу "задача трейдера - ловить хвосты нормального распределения". Это некорректно, потому что на рынке не нормальное распределение.

Прикладываю 2 картинки, первая - распределение на fRTS, вторая - распределение случайной переменной, параметризированной статистиками fRTS (число испытаний, средняя и стандартное отклонение).

Под "тяжелыми хвостами имеется в виду пологий спуск, который виден на графике fRTS. На нормальном распределении такого нет: мы видим, что хвосты быстро сходят к нулю, и за пределами нескольких стандартных отклонений наблюдений вообще не встречается. При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.

Благодарите тех богов, которым молитесь, что на рынке НЕнормальное распределение.

Rplot02.png 31 KB (437) ndist.png 27 KB (365)

Теги:

клуб алготрейдеров

Спасибо:

dvoris

Дата: 12.03.2012

Грамотный подход :) Как думаете под какой тип распределения подходит распределение на fRTS? Лапласа, Levy skew alpha-stable?

Спасибо:

Church

Дата: 12.03.2012

На мой взгляд, это либо Коши, либо (что гораздо интереснее) смесь нескольких нормальных.

Спасибо:

dvoris

Дата: 17.03.2012

При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.

Так как заинтересовало вышенаписанное и люблю всё проверять в цифрах своими руками, то провёл следующую работу. Взял история fRTS с 2007 года, таймфрейм час, рассчитал логнормированные приращения ln(close/open).

2008-ой год (впрочем, не он один) внёс "супер-тяжелые хвосты", когда цена за один час менялась на 5-8-12%. Поэтому решил скомпрессовать хвосты в пределах 5 стандартных отклонений (порог оказался 4.5%). Если этого не сделать, то какое-либо распределение "натянуть" на наши данные будет проблематично.

Получилась следующая картина:

Красная линия - модельное распределение Коши, с оптимизированными параметрами. Нужно сказать, что программа пыталась подбирать и оптимизировать под наши данные более 2 десятков разных типов распределений.

Степень достоверности определялась по трем разным критериям. По всем трем распределение Коши оказалось наиболее точным (причем с большим отрывом): Нормальное распределение, как видим, вообще отдыхает.

По вероятностям ещё помозгую и, возможно, напишу.

Спасибо:

Church

Дата: 17.03.2012

Такой еще момент - известно, что волатильность имеет свойство кластеризоваться, т.е. для рынка характерны периоды большой волатильности (когда несколько наблюдений подряд попадают в хвосты) и малой (когда в центр). Возможное следствие - рынок не совсем корректно моделировать одним распределением, поэтому mixture models становятся интересными. Например, подход Горчакова основан на этом.

Спасибо:

vlad1024

Дата: 20.03.2012

оно гораздо ближе к лапласовскому, особенно если брать небольшие таймфреймы, это связано с тем что если исходить из no arbitrage, то функция price-impact должна быть экспоненциальной, или в данном случаи если мы расматриваем приращения (по сути price-impact в обе стороны) - лапласовской. Помимо этого у коши есть такая особенность, что у него область значений от (-inf, +inf) поэтому у него нет ни мат ожидания, ни дисперсии, что конечно приминительно к реальным рынкам не сильно реалистично. Следующий момент, это наличие так называемой "кластеризации" волатильности, в этом достаточно тривиально убедится если построить взаимное распределение (Day_High_i - Day_Low_i, Day_High_i+1 - Day_Low_i+1). На этом строятся различные модели стохастической волатильности, в которых дисперсия считается отдельной функцией зависящий от времени. В простейшем случаи это GARCH в которых просто берется авторегрессивность процесса дисперсии. Возможны более сложные варианты. Но главное помнить, что несмотря на то что исходный процесс отклоняется от нормального на нем все равно нельзя заработать при направленной торговле(опционы - другой вопрос). Самый широкий класс таких процессов - мартингаловский. И при этом они способны объяснить любое одномерное распределение процесса или стохастическую волатильность. Если вспомнить теорему о репрезентации мартингала. То это будет случайное блуждание с неоднородной интенсивностью торгов. Из-за того что меняется интенсивность на случайном блуждании все равное - не возможно заработать (по крайней мере направленно).

Спасибо:

Church

Дата: 22.03.2012

Спасибо за комментарий. Вопросы:

Что вы имеете в виду под функцией price-impact?
Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.
Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.

Спасибо:

vlad1024

Дата: 22.03.2012

Church: Спасибо за комментарий. Вопросы:

Что вы имеете в виду под функцией price-impact?

Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.

Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.

примерно вот это - http://arxiv.org/pdf/0903.2428v1.pdf
я там скорее хотел сказать, что отсутствие мат. ожидания и дисперсии не слишком хорошее свойство для распределения, и в распределении коши, слишком большой вес хвостов по сравнению с реальными данными. Распределение лапласа в этом смысле, гораздо "лучше".

Спасибо:

Bazil

Дата: 02.04.2012

Зачем гадать и подгонять полученное распределение под известные мат. модели? Тип всех рыночных распределений это Паррето-Леви, и оно характеризуется нестационарностью, что по всей видимости и имел в виду vlad1024.

Спасибо:

Добавить файлы через драг-н-дроп, , или вставить из буфера обмена.