chudokos
|
Дата: 25.04.2013
|
|
|
|
Михаил Сухов chudokos В том, что бид больше оффера не всегда есть проблема.
Конкретно в этом случае - это косяк Квика, 100%. Судя по всему, это РТС, и неправильно собирается стакан. Не уверен, стоит ли вообще писать кривые данные. chudokos - Удаление плохих тиков (например, сделка была на 20% выше/ниже предыдущей) - Проверка и удаление дублированных данных (это алгоритм может быть использован также в следующем пункте) - Склеивание файлов, записанных их разных источников (как клеить стаканы, учитывая, что время пишется локального компьютера, я не знаю, но идеи есть) - Приведение времени записанных стаканов ко времени проведения сделок (если это вообще возможно) - Фильтрация стаканов (аналог создания свечек по сделкам, но тут еще проще - просто отфильтровать часть данных) по разным таймфреймам - Заполнение данных по пустым дням из других источников (я так понял, что это есть в склеивании данных, но еще не тестировал, можно ли не склеивая заполнить пропуски)
1) Это можно сделать самостоятельно через Storage API 2) Что есть дублированные данные? 3) Нет смысла в том плане, что овчинка не стоит выделки. 4) Опять же, нет смысла, так как есть более правильные пути. 5) См пункт 1. 6) Не совсем понятно, что предлагается сделать chudokos Так образом, блок с манипуляциями будет, на мой взгляд достаточно полным и проведя их можно подойти к тестированию стратегий, будучи уверенным, что данные корректные, полные, время различных видов данных совпадает со временем сервера. Хотя насчет последнего не так все просто, ведь мы видим стакан уже с задержкой и когда он был на сервере биржи мы не знаем точно, а вот время сделки у нас серверное.
Если мы говорим про Квик, то да, данные без метки времени. Если брать от биржи, то конечно же с меткой. Скажем так, стоит или не стоит, это все же, на мой взгляд, вопрос индивидуальный. Тем более, что из-за этой ошибки не записываются ВСЕ данные после этого. К тому же трейдер знает, что там есть косяк, и готов к этому, тем более что это косяк во время клиринга. Возьмем классику - Каца и Маккормика, сколько времени в книге они уделяют корректным данным их очистке, полноте и т.д. Из того что он описывает, далеко не все вендоры дают полностью корректные данные, так это США, где все за деньги и должно быть вылезано. Да и бизнес-аналитику возьмите, данные и дублированные попадаются и неполные и некорректные, но борются с этим же. А если их нет совсем, то что анализировать тогда? Вы часто грешите на Квик, у них есть косяки, не спорю, но очень редко. Он транслируют данные из шлюза - это раз, два - я никогда визуально не видел в сессионное время кривых стаканов от Квика. Возможно дело не в Квике, а в "парсинге"? Как-то я проверял тиковые сделки от биржи, думаете там не было косяков? ) Так это первоисточник! 1) Не совсем знаю что это, но буду знать, что можно взять там ) Я так понимаю, для этого нужно обладать умением программировать на .NET 2) Остались после записи Гидрой ранних версий, сейчас вроде бы нет. Проверю еще раз 3) Возможно 4) Какие, подскажите, я голову сломал уже? ) 5) Ок 6) Ну, например, сделок по какому-то инстурменту нет за какие-то дни, Гидра видит за какие, качаем с Финама или других мест только за эти дни. Также можно сверку делать. Например, квик отключился, сервер упал или еще что, сделки за день есть не все, но мы этого не знаем. Как проверить есть ли все сдекли, нужно скачать с другого места и сравнить хотя бы количество сделок, если различия больше какого-то порога, понимаем, что данные есть, но не полные. Биржевые стаканы приходят из шлюза с меткой времени, честно?
|