К вопросу о распределениях
Atom Ответить
16.01.2012


Недавно встретил фразу "задача трейдера - ловить хвосты нормального распределения". Это некорректно, потому что на рынке не нормальное распределение.

Прикладываю 2 картинки, первая - распределение на fRTS, вторая - распределение случайной переменной, параметризированной статистиками fRTS (число испытаний, средняя и стандартное отклонение).

Под "тяжелыми хвостами имеется в виду пологий спуск, который виден на графике fRTS. На нормальном распределении такого нет: мы видим, что хвосты быстро сходят к нулю, и за пределами нескольких стандартных отклонений наблюдений вообще не встречается. При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.

Благодарите тех богов, которым молитесь, что на рынке НЕнормальное распределение.
Rplot02.png 31,4KB (0) ndist.png 27,8KB (0)



Спасибо:




8 Ответов
dvoris

Фотография
Дата: 12.03.2012
Ответить


Грамотный подход :)
Как думаете под какой тип распределения подходит распределение на fRTS? Лапласа, Levy skew alpha-stable?
Спасибо:

Church

Фотография
Дата: 12.03.2012
Ответить


На мой взгляд, это либо Коши, либо (что гораздо интереснее) смесь нескольких нормальных.
Автор топика
Спасибо:

dvoris

Фотография
Дата: 16.03.2012
Ответить


Цитата:
При случайном блуждении (которое, по традиции, ассоциируют с нормальным распределением) среднее расстояние, которое рынок пройдет в направлении нашей позиции равно среднему
расстоянию, которое он пройдет против нее, где бы мы ее ни открыли. Но за счет тяжелых хвостов у нас есть существенная вероятность поймать движение существенно большее, чем стоп.


Так как заинтересовало вышенаписанное и люблю всё проверять в цифрах своими руками, то провёл следующую работу.
Взял история fRTS с 2007 года, таймфрейм час, рассчитал логнормированные приращения ln(close/open).

2008-ой год (впрочем, не он один) внёс "супер-тяжелые хвосты", когда цена за один час менялась на 5-8-12%. Поэтому решил скомпрессовать хвосты в пределах 5 стандартных отклонений (порог оказался 4.5%). Если этого не сделать, то какое-либо распределение "натянуть" на наши данные будет проблематично.

Получилась следующая картина:
1

Красная линия - модельное распределение Коши, с оптимизированными параметрами.
Нужно сказать, что программа пыталась подбирать и оптимизировать под наши данные более 2 десятков разных типов распределений.

Степень достоверности определялась по трем разным критериям. По всем трем распределение Коши оказалось наиболее точным (причем с большим отрывом):
2
Нормальное распределение, как видим, вообще отдыхает.

По вероятностям ещё помозгую и, возможно, напишу.
Спасибо:

Church

Фотография
Дата: 16.03.2012
Ответить


Такой еще момент - известно, что волатильность имеет свойство кластеризоваться, т.е. для рынка характерны периоды большой волатильности (когда несколько наблюдений подряд попадают в хвосты) и малой (когда в центр). Возможное следствие - рынок не совсем корректно моделировать одним распределением, поэтому mixture models становятся интересными. Например, подход Горчакова основан на этом.
Автор топика
Спасибо:

vlad1024

Фотография
Автор статей
Дата: 20.03.2012
Ответить


оно гораздо ближе к лапласовскому, особенно если брать небольшие таймфреймы, это связано с тем что если исходить из no arbitrage, то функция price-impact должна быть экспоненциальной, или в данном случаи если мы расматриваем приращения (по сути price-impact в обе стороны) - лапласовской. Помимо этого у коши есть такая особенность, что у него область значений от (-inf, +inf) поэтому у него нет ни мат ожидания, ни дисперсии, что конечно приминительно к реальным рынкам не сильно реалистично.
Следующий момент, это наличие так называемой "кластеризации" волатильности, в этом достаточно тривиально убедится если построить взаимное распределение (Day_High_i - Day_Low_i, Day_High_i+1 - Day_Low_i+1). На этом строятся различные модели стохастической волатильности, в которых дисперсия считается отдельной функцией зависящий от времени. В простейшем случаи это GARCH в которых просто берется авторегрессивность процесса дисперсии. Возможны более сложные варианты.
Но главное помнить, что несмотря на то что исходный процесс отклоняется от нормального на нем все равно нельзя заработать при направленной торговле(опционы - другой вопрос). Самый широкий класс таких процессов - мартингаловский. И при этом они способны объяснить любое одномерное распределение процесса или стохастическую волатильность.
Если вспомнить теорему о репрезентации мартингала. То это будет случайное блуждание с неоднородной интенсивностью торгов. Из-за того что меняется интенсивность на случайном блуждании все равное - не возможно заработать (по крайней мере направленно).
Спасибо:

Church

Фотография
Дата: 22.03.2012
Ответить


Спасибо за комментарий. Вопросы:
1. Что вы имеете в виду под функцией price-impact?
2. Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.
3. Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.
Автор топика
Спасибо:

vlad1024

Фотография
Автор статей
Дата: 22.03.2012
Ответить


Church Перейти
Спасибо за комментарий. Вопросы:
1. Что вы имеете в виду под функцией price-impact?
2. Почему предположение об области значений (-inf, +inf) с экспоненциально убывающими вероятностями нереалистично? Легко представить маловероятное событие, которые уронит рынок до 0 (атомная война?), или взвинтит его во много раз (атомная война, в которой мы остались одни?). Отсутствие матожидания и дисперсии это просто следствие. Зато есть медиана.
3. Я, может быть, соглашусь, что на направленной торговле нельзя работать только на основании данных о распределении. Но, используя дополнительные факторы, можно получить смещенную условную вероятность.


1. примерно вот это - http://arxiv.org/pdf/0903.2428v1.pdf
2. я там скорее хотел сказать, что отсутствие мат. ожидания и дисперсии не слишком хорошее свойство для распределения, и в распределении коши, слишком большой вес хвостов по сравнению с реальными данными. Распределение лапласа в этом смысле, гораздо "лучше".
Спасибо:

Bazil

Фотография
Дата: 02.04.2012
Ответить


Зачем гадать и подгонять полученное распределение под известные мат. модели? Тип всех рыночных распределений это Паррето-Леви, и оно характеризуется нестационарностью, что по всей видимости и имел в виду vlad1024.
Спасибо:


Добавить файлы через драг-н-дроп, , или вставить из буфера обмена.

loading
clippy