karellin
|
Дата: 14.02.2014
|
|
|
|
Bond Ничего особенного в этом методе нет. Вы приходите в магазин и видите, что на прилавке лежит селедка в масле(Монте-Карло), в майонезе(Генетические алгоритмы), селедка мелко порезанная с укропом(Рой частиц) и здоровенная банка цельной слабосоленой сельди(Метод перебора). Вы считаете, что с майонезом сельдь самая вкусная, а мне нравится просто в масле. Но не важно, что мы там думаем все равно это обычная селедка. И здесь тоже самое, в основе - нелинейная стохастическая оптимизация. Кроме Полного перебора. Те же проблемы с локальными экстремумами. Кстати, в моем алгоритме таких проблем нет) И прочее, прочее, прочее... И с чего вы решили, что он удобен для больших размерностей? Почитайте, к примеру, комментарии в конце статьи на Википедии.
Я не маркетолог, мне трудно судить о достоинствах и недостатках селедок различного приготовления. Если бы вы спросили допустим Марковица о том тестере стратегий, который написали, то думаю, что услышали бы много интересного о математической обоснованности своих методов. То же самое и об отзывах ученых о генетическом алгоритме. особенно порадовало мнение о том, что недостатком генетического алгоритма является неспособность спроектировать самолет сразу целиком. типа есть алгоритмы для этого, а вот ГА ну никак не может. Чтобы не быть голословным: http://technomag.bmstu.ru/doc/56533.html
взял про большие размерности из логики. то что в вашем алгоритме нет таких проблем - ваше недоказанное ничем мнение, как и мое про большие размерности. существует класс задач ГА - генетическое программирование (задача переменной размерности решаемая путем эволюции дерева выражения). поделитесь, пожалуйста, как его можно реализовать с помощью монте карло. Небольшое размышление на тему: Например, будем классифицировать элементы множества по половинкам - больше или меньше ноля. В одномерном пространстве будет всего 2 подмножества, в 2-хмерном - 4, в 3-мерном - 8, в N-мерном 2^N. Допустим подбираем 30 параметров. Количество подмножеств - более 1*10^9 подмножеств, которые можно разделить, и это при разделении по каждой оси пространства только на 2. Какова же вероятность попадания случайного значения из монте-карло внутрь гиперкуба диаметром 0,1 от возможного? 1*10^30 по-видимому. А если алгоритм промахнется пару раз? Генетический алгоритм тоже неидеален, но он накапливает информацию о лучших решениях в случае если решение задачи состоит из относительно независимых частей. Допустим, решение состоит из двух частей, одинаково влияющих на результат. Тогда генетический алгоритм будет решать не задачу попадания значения в 1*10^30 от общего пространства признаков, а лишь 2*10^15, поскольку размерность каждой из частей решения только 15. Если независимых частей еще больше, то выигрыш становится еще существеннее. Примерно так.
|
|
Спасибо:
|
|
|
|
|
Bond
|
Дата: 14.02.2014
|
|
|
|
Цитата:Если бы вы спросили допустим Марковица о том тестере стратегий, который написали, то думаю, что услышали бы много интересного о математической обоснованности своих методов. Не знаю кто такой Марковиц, да это и не важно. Меня за 6 лет обучения в техническом университете научили самостоятельно решать сложные задачи. От всех этих заумных книжек больше вреда, чем пользы. Если у человека есть ясное мышление, то он и без них разберется. А если трейдер торгует по астрологическим прогнозам, то ему ничего не поможет. Цитата:то что в вашем алгоритме нет таких проблем - ваше недоказанное ничем мнение, как и мое про большие размерности Я никому ничего не доказываю. И никого ни в чем не убеждаю. Цитата:существует класс задач ГА - генетическое программирование (задача переменной размерности решаемая путем эволюции дерева выражения). поделитесь, пожалуйста, как его можно реализовать с помощью монте карло. Что?[huh] Цитата:А если алгоритм промахнется пару раз? Вот главный вопрос! Остальное все риторика. Вот именно на этом моменте и была построена основная логика моего алгоритма. И почему вы его все время сравниваете с Монте-Карло? Мой алгоритм правильнее назвать "Методом уменьшения итерационной решетки". Да, и совершенно не важно как он зовется. Вы думаете что "Генетический алгоритм" имеет какое-то отношение к эволюции и генетике? Или "Метод имитации отжига" связан с термодинамикой или кристаллографией? Или "Рой частиц" с муравьями или пчелами? Это всего лишь ассоциации для более простого понимания, не более. Одна природа алгоритмов, никто из них не может быть лучше или хуже! Не правильно спрашивать: "Что лучше Генетика или Монте-Карло?" Правильно спрашивать: "Как определить область выборки? Как задать критерий останова? Как не упереться в локальный максимум?" Мне кажется, что вы не поняли в чем суть алгоритма. П.С. "Как селедку не называй, шоколадным тортом она от этого не станет!" [laugh]
|
|
Спасибо:
|
|
|
|
|
karellin
|
Дата: 14.02.2014
|
|
|
|
В чем суть вашего алгоритма, я возможно и не понял. Поправьте меня, если я не прав. Вы предлагаете оценивать по монте-карло области наименее пригодных решений и отбрасываете эти области целиком, уменьшая (обрезая) пространство, в котором производится поиск. Я же говорю вам о следующем. При большой размерности пространства достаточно велик (в случае размерности 30 - просто ОГРОМЕН) шанс пропустить в области плохих решений локальный или глобальный максимум. Генетический алгоритм я называю так, поскольку это общераспространенное название данного класса алгоритмов. Естественно, алгоритм не имеет почти ничего общего с реальной биологией. Я прекрасно представляю себе, как он работает, иначе просто не стал бы вступать в его обсуждение. Мне интересно другое. Поняли ли вы, что я имел в виду в последней части своего ответа, говоря о значительном повышении вероятности для ГА найти правильный ответ при решении задачи, состоящей из двух слабо взаимосвязанных частей, каждую из которых характеризует свой набор признаков. Если нет, то судя по отсутствию вопросов вы все уже для себя решили, и это вам не нужно. Но если вы уже определились со своим отношением к ГА и его месту среди прочей стохастики - так и напишите. По крайней мере, это сэкономит мне время. А то получается, что я пытаюсь ответить на вопрос человеку, который не хочет меня слышать, поскольку убежден в правильности другого ответа. 9 признаков - не та размерность, в которой могут существенно проявиться различия ГА и монте-карло. Bond Цитата:существует класс задач ГА - генетическое программирование (задача переменной размерности решаемая путем эволюции дерева выражения). поделитесь, пожалуйста, как его можно реализовать с помощью монте карло. Что?[huh] Приз за лучший ответ.[laugh] Можете узнать что это, погуглив "генетическое программирование". Вам будет интересно. Спасибо.
|
|
Спасибо:
|
|
|
|
|
Bond
|
Дата: 15.02.2014
|
|
|
|
Цитата:Вы предлагаете оценивать по монте-карло области наименее пригодных решений и отбрасываете эти области целиком, уменьшая (обрезая) пространство, в котором производится поиск. На каждой итерации уменьшается область выборки. Выбирается заданное число худших параметров и согласно их количеству общий объем выборки делится на множество микрообластей, которые вырезаются из пространства как самые неудачные. После каждой итерации все результаты за все время исследования сортируются и выбираются самые неудачные. Все результаты сохраняются и анализируются до конца оптимизации. Задача алгоритма не идти к максимуму, а не упустить из вида хорошие области пространства. А все хорошие параметры можно потом дополнительно исследовать. Главное, что мы знаем, где их искать. Цитата:При большой размерности пространства достаточно велик (в случае размерности 30 - просто ОГРОМЕН) шанс пропустить в области плохих решений локальный или глобальный максимум. Цитата:9 признаков - не та размерность, в которой могут существенно проявиться различия ГА и монте-карло. Вы теоретик или практик? Просто я не знаю ни один полноценный тестер, который сможет хотя бы 5 параметров нормально прооптимизировать. 9 параметров это и без того очень много! Исходя из своего опыта могу сказать, что нужно исследовать не менее 20% от общего пространства, чтобы получить более или менее адекватный результат. Обычные компы такой объем никогда не высчитают. Если будете использовать много параметров, то получите многоэкстремальное рваное пространство со всеми вытекающими проблемами. Если вырезать микрообласти по монте-карло, которые будут помещаться между экстремумами, то здесь нет никакой проблемы. Хотите точнее - уменьшайте области, увеличивайте время тестирования. Хотите быстрее - увеличивайте области, увеличивайте вероятность пропустить экстремум. ГА тоже не может из ниоткуда получать данные о пространстве, ей также нужно его тестировать и "мутировать" в сторону экстремумов. Возможно в многоэкстремальном пространстве ГА будет вести себя корректнее. Я не знаю. Нужно тестировать. Вот коллега сейчас пишет, что много лет занимается тестированием и сейчас перешел на метод отжига. Хз, каждому свое. Не забывайте, что очень много зависит от способа формирования пространства стратегий и архитектуры стратегий и тестировщика.
|
|
Спасибо:
|
|
|
|
|
karellin
|
Дата: 15.02.2014
Вы описали алгоритм, наполовину обратный ГА. Вместо популяции лучших решений в нем создается своеобразная популяция худших (в виде областей, исключенных из поиска), хотя в больших размерностях это работать не будет. Но для вашей задачи это видимо лучшее решение из возможных. Если честно, ни разу не встречал практического использования ГА для задач с числом оптимизируемых параметров менее 10, может просто не интересовался такими задачами. Например, для обучения НС число оптимизируемых весовых коэффициентов часто бывает более 100. Bond Цитата:то что в вашем алгоритме нет таких проблем - ваше недоказанное ничем мнение, как и мое про большие размерности Я никому ничего не доказываю. И никого ни в чем не убеждаю. По-видимому дискуссию пора заканчивать. Вы действительно для себя уже сделали все выводы, имеете собственный взгляд на проблему и не нуждаетесь в том, чтобы его кто-то опроверг. Спасибо за полезную информацию, кое-что заставило задуматься.
|
|
Спасибо:
|
|
|
|
|
Bond
|
Дата: 15.02.2014
Цитата:Если честно, ни разу не встречал практического использования ГА для задач с числом оптимизируемых параметров менее 10, может просто не интересовался такими задачами. Например, для обучения НС число оптимизируемых весовых коэффициентов часто бывает более 100. Мы видимо говорим о разных параметрах) Цитата:По-видимому дискуссию пора заканчивать. Вы действительно для себя уже сделали все выводы, имеете собственный взгляд на проблему и не нуждаетесь в том, чтобы его кто-то опроверг. Спасибо за полезную информацию, кое-что заставило задуматься. Пока писал "Исследователя" разобрался во многих тонкостях оптимизации. И выводы, конечно, сделал. Если у вас появятся интересные идеи для практической реализации, то я всегда с удовольствием готов их обсудить, а может даже написать практические примеры. И вам спасибо за интересные мысли про ГА.
|
|
Спасибо:
|
|
|
|
|
ashot
|
Дата: 16.02.2014
karellin Например: в известных книгах типа Энциклопедии торговых стратегий Кац и МакКормик, Нейронные сети и финансовые рынки Бэстенса, Ван Дер Берга, Вуда написана всякая лажа. Авторы либо совершенно не разбираются в НС (вряд ли), либо успешно притворяются тупыми. Выводы о том, что НС применима (не применима) для решения задач, решать которые она не предназначена, на уровне книжки "Что такое хорошо, и что такое плохо". Для дилетантов писалось за гонорар. «Энциклопедия торговых стратегий» Кац, Маккормик, очень авторитетный трейдерский источник. Я бы негативно о сказанном в этой книжке не отзывался, без весомейщих аргументов. Каждый может вот так вот безосновательно очернить.
|
|
Спасибо:
|
|
|
|
|
karellin
|
Дата: 16.02.2014
ashot «Энциклопедия торговых стратегий» Кац, Маккормик, очень авторитетный трейдерский источник. Я бы негативно о сказанном в этой книжке не отзывался, без весомейщих аргументов. Каждый может вот так вот безосновательно очернить.
Я эту книгу в свое время на принтере распечатал и перечитывал раз пять. Еще раз повторю, не касаясь всего содержания книги: в части НС авторы некомпетентны. Они обучают сеть прогнозированию цен, а также точек разворота на основе приращений цен в прошлом. При этом в качестве параметров НС берут топологию сети. Вполне ожидаемо получают отрицательный результат (иногда даже на обучающей выборке), и на основании этого делают вывод о непригодности НС. Если я пропустил что-то, поправьте меня.
|
|
Спасибо:
|
|
|
|
|
ashot
|
Дата: 17.02.2014
|
|
|
|
karellin ashot «Энциклопедия торговых стратегий» Кац, Маккормик, очень авторитетный трейдерский источник. Я бы негативно о сказанном в этой книжке не отзывался, без весомейщих аргументов. Каждый может вот так вот безосновательно очернить.
Я эту книгу в свое время на принтере распечатал и перечитывал раз пять. Еще раз повторю, не касаясь всего содержания книги: в части НС авторы некомпетентны. Они обучают сеть прогнозированию цен, а также точек разворота на основе приращений цен в прошлом. При этом в качестве параметров НС берут топологию сети. Вполне ожидаемо получают отрицательный результат (иногда даже на обучающей выборке), и на основании этого делают вывод о непригодности НС. Если я пропустил что-то, поправьте меня. Возможно я подзабыл что то, но по-моему авторы наоборот там превозносят НС и ГА как единственно верные пути. Там у них всё плохо кроме этих методов. «Топология в качестве параметров» не припоминаю. То что приращения используют это не совсем так уж плохо на общем фоне, большинство логарифмированный прайс подают на вход, приращения это шаг вперёд, хотя и так и так подгонка. Я знаю людей которые из НС вытянули грааль, но те парни настолько закрыты для общения и даже намёков о том что они делают, у меня новичка так точно нет шансов. Знаю только что там всё архисложно, там не велс, не метатрейдер и даже не S#, а С++ и MatLab с какими то фичами которым расшифровывают и интерпретируют данные поступающие с калайдеров, оказалось что это одна и та же методология, я как услышал так и подафигел, там с ними работает дядя который раньше в ЦЕРНе перемалывал терабайты в день ища новый частицы в квантовом хаосе. Говорили что обычный ТА с индикаторами и тестированием, это гарантированно слив спреда с комиссией, нет шансов.
|
|
Спасибо:
|
|
|
|
|
karellin
|
Дата: 17.02.2014
Превозносят там ГА. Про НС пишут, что не фонтан, но использовать можно. ТА - лженаука, использующая некоторые научные подходы в их примитивном виде. Считаю, что себя он уже исчерпал.
|
|
Спасибо:
|
|
|
|