Какими техническими средствами пользуется "новая" теория Клесова
23-01-2015Я не антрополог, а программист-биоинформатик, нс, занимаюсь только комбинаторной оптимизацией. Основная профессия — комп. саенс. Я не бросаюсь словами на ветер, себе цену знаю.
Замечание Вадима Веренича:
Для анализа Y-хросомы программами пакета PHYLIP (которые только и применяется Клесовым и его "академиками") не используются уже лет десять. Золотой стандарт — это Fluxus Network, но также нередко используются TNT и программа Валерия Запорожеченко — MURKA.
Почему, несмотря на то, что в академии вроде работало не менее 3 разработчиков софта, за все время ее жизни не сделали хоть малюсенькую программку, которая бы сама, не обращаясь к PHYLIP *попгена* уважаемого Джо Фелзенштейна, что-то там считала? Может, лучше было свою манию величия и превосходства над биологами выражать как-то материальнее? Клесов пользуется программой PHYLIP только для построения дерева, предковое состояние каждого признака он не реконструирует с помощью софта. Я пытался докопаться у наших отечественных генеалогов, которые и учили Клесова строить деревья, они сказали, что это по инструкции (любительской) на каком-то генеалогическом сайте.
По моему опыту общения с А.Клесовым более «содержательные дискуссии» в принципе невозможны. Это крайне необразованный биологически человек, без малейшего желания учиться азам, с диким самомнением. Он не только не понимает биологической природы вещей которые изучает (в конце концов, фиг знает кто на свете это понимает идеально), но, увы, не может разобраться даже с простыми математическими свойствами модели, которую использует. Единственная более-менее нетривиальная метода его собственной разработки никогда не была им формально обоснована и работает она ничуть не лучше, чем другие, известные до него, когда академик еще не ведал о «деревьях гаплотипов». Техническая сторона деятельности у него на самом деле такая же эссенциалистская, как и то, что выставляется для популярной аудитории.
Что еще довольно вызывающе в поведении автора «ДНК-генеалогии» — это его прямое указание биологам, чем им должно заниматься, а что оставить на откуп гуру. Самое такое характерное — что генетика это якобы наука о норме и патологии мутаций, типа вы займитесь наследственными болезнями, а мне оставьте вопрос об эволюции нейтральных признаков, чай больше вас в этом понимаю. Заметим, сие было сказано в статье на Переформате, то есть обращено к аудитории, которая скорее всего не представляет что нейтральность к отбору — это идея, разработанная внутри популяционной генетики, в некотором смысле одно из замечательных достижений науки. Оно хорошо известно, что когда автор в статьях к любителям говорит одно, а к профессиональной аудитории обращается иначе, — это верный признак умысла. Честные исследователи могут выбирать разные аналогии, термины и глубину интерпретации в разных ситуациях, но все равно говорят примерно об одном и том же.
В так называемой «ДНК-генеалогии» направленность на аудиторию адептов — одна из главнейших черт. У Клесова даже терминология сляпана как фронда к русской биологической терминологии. Показательный пример. На вопрос «Зачем вы говорите МАРКЕР вместо устоявшегося ЛОКУС?» отвечают «А у нас устоялся другой термин, мы имеем право отличаться!». То, что там «устоялось» — просто калька с английского языка, где действительно имеется такой термин, который в русской литературе до неудобства многозначен. Далее, изложение ДНК-генеалогии сильно засорено избыточным употреблением слова «гаплогруппа». Гаплогруппа — вообще-то номенклатурный термин. Более общими понятиями являются «аллель» или «линия», в зависимости от контекста следует выбирать подходящее слово.
Например «поговорим об эволюции линий гаплогруппы P» вполне корректная фраза, а вот «Возьмем некую гаплогруппу, пусть ее очень много в племени А, а в племени Б пусть распространена другая гаплогруппа». Что тут не так? Линия, как только фиксирована современной номенклатурой, получает название «гаплогруппа такая-то», причем именование получают как самые мелкие линии, так и очень древние и крупные. Нет единого критерия, по которому линия получает имя раньше или позже, это случайности порядка открытия мутаций и номенклатурной рутины. В биологической реальности имел место случайный процесс изменения частоты линий, чем меньше популяция, тем чаще линии вымирали и тем длиннее становились стволы на дереве, соединяющие редкие современные таксоны с корнем человечества.
Грубо говоря, чем длиннее ствол, тем большее право имеют его ветви именоваться «гаплогруппой», и наоборот, чем ветвистее крона, тем более непривычно называть каждую мелкую веточку гаплогруппой. «Линия» (lineage) — как раз общее понятие, применимое ко всем ветвям и стволам дерева, независимо от количества таксонов, ее представляющим. На худой конец, есть филогенетическая и кладистическая терминология, но там тоже нет никаких «гаплогрупп».
Зачем ДНК-генеалогии охмуреж терминами? Ведь, по идее, когда вы рассказываете о науке в аудитории, с ней не знакомой, интуитивно надо стремиться находить слова, как можно более знакомые слушателям, чтобы произносимое находило поддержку интуиции, каким-то фактам, известным со школы и т.д. Противоположный подход вызывает опять-таки подозрение в наличии какой-то скрытой цели, колонизации человеческого обихода совершенно малозначительными понятиями, которые вводятся для рекламы чего-то. Может, это и есть «переформат»?
Клесов НИКОГДА не будет спорить с вами на открытой площадке, в присутствии свидетелей, по одной простой причине: он просто не может поддерживать дискуссию на должном техническом уровне, потому что не владеет азами науки, которой занимается.
Содержательные дискуссии с ним кончаются наездами и задиранием головы — он "очень умный", чтобы учиться.
Клесов использует пуассоновскую модель мутирования микросателлитных локусов, но подвох в том, что прошлое не моделируется как случайный процесс на дереве, а только ищутся предельно простые его характеристики, скажем, зная среднюю частоту мутирования и количество «предковых» гаплотипов, найти время жизни этого предка. Поскольку статистически значимое обилие предковых гаплотипов среди ныне живущих людей возможно только, когда этот предок совсем недавний, то соответственно эта модель применима лишь к событиям последних 1-2 тысяч лет. Клесов высказал предположение, что если выборка гаплотипов (элайнмент) происходит от одного предка, то время его жизни, посчитанное через «вымывание» предкового гаплотипа мутированием, равно времени, за которое «натикало» наблюдаемое количество мутаций гаплотипов-потомков. Несовпадение величин в этой ситуации трактуется как «фантомность» предка, то есть действие гомоплазии.
При некоторых дополнительных предположениях этот факт вполне можно, конечно, обосновать математически, но Клесов, не пытаясь ничего доказывать, идет дальше и начинает считать подобным образом времена жизни древнейших мужчин, вплоть до Адама, вводя новые и новые поправки, которыми можно прикрыть неприменимость этого подхода для случаев, когда потолок древности предка превышен, а сам «базовый гаплотип» фантомен. Например, при работе с линиями человеческой Y-хромосомы давностью 5-10 тыс. лет он использует филогенетические деревья, призванные показать, «как встали гаплотипы», причем он уверенно полагается на них даже тогда, когда деревья по микросателлитам не совпадают с более точными данными снипирования.
Цель построения деревьев тоже не декларируется, нет даже элементарного понимания, что выборка может и не содержать филогенетического сигнала, не используются средства контроля, внутренней непротиворечивости реконструкции, устойчивости к пермутациям исходных данных. Нет понимания того, что факт наличия или отсутствия ближнего или дальнего общего предка тех или иных ныне живущих таксонов в биологии решается многими методами, и даже один и тот же метод может давать разные результаты, от которых зависит и возраст жизни этого предка. То есть не используются стандартные средства, которыми пользуется большинство биологов при изучении прошлого, и не предлагается никаких альтернативных средств.
Сам подход Клесова в некотором смысле перевернут: Клесов ищет простые инвариантные характеристики дерева (возраст) даже в тех случаях, когда можно легко показать, что они не инвариантны и меняются в зависимости от топологии дерева. Научная биология давно разработала иные пути, самый главный из них — это поиск наиболее правдоподобных деревьев с учетом выбранной модели мутирования, и этот способ не полагается ни на какие заведомо "отфонарные" идеи, программа ищет оптимум среди комбинаторно большого числа вариантов истории.
Без спекулятивного камлания над «базовым гаплотипом» (почему базовым, кто сказал? что это за экспертное мнение?), напротив, это и выяснится в результате эксперимента, что там базовое. На худой конец, есть версии того же подхода, которые можно применять для уже выбранной «истинной» топологии, и таким способом можно тестировать гипотезы о разной скорости мутирования выбранных локусов в тех или иных ветвях или временах. Все это описано в литературе, и биологи не виноваты, что доморощенный гуру не желает ее читать.
Когда гуру наконец понял, что ограничившись небольшим количеством признаков (из большого числа), можно легко сесть в лужу, он стал чуть осторожнее. Скажем, когда мы впервые познакомились, он так и считал, что если полокусно вычислить доминирующие аллели, это и будет предок, от которого можно исчислять всех потомков. Потом, наверное, он напоролся на грабли и стал дальше изобретать велосипеды, вместо того чтобы чего-то почитать.
Простите, мы сейчас говорим о Клесове и его команде, которые до сих пор не освоили никаких программных средств, кроме сделанных талантливыми любителями на американских генеалогических ресурсах, все его построения деревьев — по инструкции с этих сайтов, буквально и уже много лет. До сих пор команда Анатолия Алексеевича не написала даже простенького калькулятора, принимающего выборку гаплотипов и выдающего результат в соответствии с его теорией мутирования.
К чему это? Да к тому, что Анатолий Алексеевич занимается самой, что ни на есть, биологией, что бы там ни говорил своим клиентам-адептам. И планирует заниматься ею еще глубже и серьезнее. Что эти самые результаты MGS он будет получать после обработки данных софтом, который сделали "ненавистные попгены", более того, даже для выводов позаимствует еще кучу "попгеновских изобретений" и все равно ничтоже сумняшеся будет рассказывать на форумах, как изобрел велосипед.
И по поводу аргументации. Клесов пишет тут, что для проверки наличия единого предка «в ДНК-генеалогии разработаны собственные методы». Но если ДНК-генеалогия, как ее понимает Клесов, является наукой, то ее авторы должны встраивать свои "открытия" в систему, которая была создана до них, либо доказывать, что – наоборот - их понятия шире, а имеющиеся являются частным случаем новых.
В действительности, ничего подобного мы не наблюдаем просто потому, что никто в Клесовской Академии не владеет имеющимся филогенетическим аппаратом даже на уровне прилежного студента. Не говорю сейчас о каком-то глубоком понимании математики, которая лежит за теоремами филогенетики, ведь филогенетика - это по сути раздел прикладной математики, она состоит из математических определений и доказательств чуть менее чем полностью. Ну, хотя бы по минимуму, на уровне твердого знания "вот я умею решать эту проблему, я знаю рецепты, которые дают ответ, есть ли в выборке филогенетический сигнал или нет".
Причина такого небрежения знаниями внутри клесовской Академии, в общем-то, лежит на поверхности — это банальное нежелание ее руководителя учиться самому и ангажировать делать то же самое своих академиков. А послать своих "ученых" учиться куда-то в другое место — опасно, так как образованные люди могут составить конкуренцию гуру, еще и усомнятся в 10 аксиомах ДНК-генеалогии и понесут ересь.
Со стороны такое нарочитое небрежение знаниями и опытом, накопленными биологами и компьютерными саенистами, работающими в биологии, выглядит совершенной дикостью. Ведь филогенетика на самом деле и не привязана к биологии намертво, просто исторически так сложилось, что в биологии учение об эволюции получило самую серьезную научную поддержку, и в 60-х годах прошлого века стала востребована математическая теория, позволяющая привести некоторые виды рассуждений к рутинной форме, дабы освободить время для интерпретации, требующей участия человека. И, напротив, в некоторых других науках, потребляющих филогенетический аппарат, возникло стойкое противостояние эволюционным методам, которое откровенно вредило и технически и теоретически.
Примером является сравнительная лингвистика, где консервативное отношение к теории глубинной реконструкции языков некоторой части авторитетов откровенно мешало новаторской мысли, и только в последние два десятилетия ситуация заметно улучшилась, к языкам применяют практически весь набор методов построения деревьев, который ранее применялся только в биологии. В предисловии к классическому учебнику «Филогенетика» Семпл и Стил лингвистика упомянута как область приложения филогенетики, наряду с биологией, а сама филогенетика рассматривается как самостоятельная междисциплинарная отрасль знания, со своим аппаратом и методологией.
В связи с этим даже фрондерский настрой ДНК-генеалого-академиков по отношению к биологии априори не предполагает отрицания полезности филогенетики, которой вообще-то все равно, к чему ее применяют — лишь бы в основе мутирования лежал случайный процесс определенного вида. Но, тем не менее, Клесов как руководитель этой самой Академии тщательно следил за идеологической верностью средств, которыми дозволено пользоваться его ученикам, и пресекал малейшие попытки использовать инструменты более сложные, чем он применяет сам, коими являются прежде всего калькулятор и Excel.
Собственно, данный мой комментарий — к вопросу о фронде клесовской ДНК-генеалогии по отношению к любому знанию, где ее основатель не является специалистом. И дело тут даже совсем не в биологах, которые попали в немилость к гуру, видно, за то, что познакомили его с понятием «гаплогруппа».
P.S.
Некоторые соображения более технического порядка от разработчики софтвера для расчета мутаций.
Академик давно просил, слезно молил, чтобы его схватили за руку на молекулярке, ну теперь попался. Предковый гаплотип сам требует сложнейшей процедуры для своего нахождения. А вымершие ветви мешают вот чем. Скажем 1000 лет назад древний узел имел 5 потомков, средняя длина ветвей от него до листиков на дереве, которое мы бы построили, застань мы эти вымершие популяции, была ну пусть 80 некоторых единиц. Из 5 ветвей вымерли 3. И средняя длина стала, скажем, 140 единиц. За счет чего так? За счет высокой дисперсии длин прикорневых линков. Ведь каждая веточка от корня к листикам включает прикорневые линки, а если их мало, то «зашумление» этого прикорневого пространства путает картину. А вот будь прикорневых ветвей много, не вымирай они — мы бы знали историю куда лучше.
Поэтому когда А.Клесов заявляет «да нам все равно, кто там вымер, мы изучаем генеалогию оставшихся ветвей» — это несколько некорректно. Если нас интересует эпоха относительно недавняя, когда люди стали быстро размножаться из-за производящего хозяйства, было много перенаселенных регионов — это одно дело. Там картина более достоверная в части возраста. Если же нам интересно, что было в каменном веке, а также в медвежьих углах, где с выживанием были проблемы даже сто лет назад, скажем крайний север — это уже другой вопрос. Грубо говоря, ситуация роста популяции — самая «сферическая в вакууме», с ней проще работать, меньше влияние случайностей.
В силу утраты практически всех реликтовых ветвей, истинную (cоответствующую снипам) топологию ветвей гаплогруппы I2 можно восстановить только используя оба типа маркеров: бинарные маркеры UEP, т.е снипы Y, и STR.
Внимательный читатель спросит — но ведь Клесов отлично осведомлен о существовании снипов Y, почему же он их не использует в своих деревьях? Ведь такое возможно?
Ответ прост до ужаса: академики до сих пользуются онлайн утилитой Y-Utility: Y-DNA Comparison Utility, c недавнего времени позволяющей вводить и 111-маркерные гаплотипы, а затем задавая «скорости мутации», получать входной файл (матрица генетических дистанций) для обработки в программах kitsh, neighbour пакета Phylip. К глубокому унынию «академиков» Клесова и Рожанского, в оной Y-utility нет и в будующем не предвидется использованием снипов. Поэтому-то и не получают «академики» комбинированные матрицы по снипам и STR-маркерам. И по этой же причине не растут деревья с правильной топологией в академических садах клесовского Вестника.
Собственно, Клесову и не нужна филогения как метод получения информации. Про бабку Вангу писали, что она требовала приносить ей сахар, который щупала и типа что-то там "видела", будучи слепой. Вот NJ-деревья у Клесова это такой примерно сахар. Он смотрит на свои расчески и начинает медитировать, берет калькулятор, считает логарифм числа мутаций и изрекает истину. Все! Никакой рациональной, видимой связи результатов подсчетов с деревьями там нет. То есть его «предок» вычисляется не филогенетически. Это возможно, но разумеется только в очень простых случаях. И не для всех локусов это можно определить на глаз даже в игрушечного размера выборках.
Суть претензий к гуру: если бы его статьи прошли стандартную рецензию, то их бы просто не допустили, или сузили список заявленного в них до нескольких результатов, обсуждение которых могло бы быть интересно.
Не в том дело что он химик. Клесов, когда занялся биологией, не шел по стандартному пути изначально, по простой причине: у него не было и нет в планах осваивать что-то новое сверх инструментария химической кинетики.
Вот еще какой вопрос есть. С клесовского Переформата: http://pereformat.ru/dna/
«Один из основных вопросов – надо набрать как минимум тысячу человек для первого круга тестирования, а потом еще одну тысячу – для второго круга. Инвесторы в этом не уверены, потому и уходят. А заказ расходных материалов на тесты делается как минимум на тысячу человек. Поэтому серьезная просьба – направить короткое сообщение на Переформат с заявкой на тест. Никакой финансовой обязательности это за собой не влечет, это первая оценка ситуации. Просто заявка о намерениях, если цена будет подходящая. Окажется всего сотня человек – значит, эта лаборатория, по сути, мало кому нужна. Окажется пять тысяч человек – другой разговор. Тесты будут делаться по 3200 снипов на человека, такое покрытие мало где есть, плюс – персональная ДНК-родословная, с расчетами и деревьями гаплотипов, этого вообще нигде в мире нет».
«Такое покрытие мало где есть» — ох, как нескромно. Есть как минимум 2 действующие коммерческие лаборатории, доступные всем желающим, одна из них это американская FTDNA, выполняющая исследование там же, другая YFULL, тоже американская, сиквенсы кажется делает в Китае. Обе имеют сложившуюся хорошую репутацию и свою долю рынка. Работа заключается в сборке хромосомы из отсеквенированных фрагментов и фильтрации/интерпретации найденных мутаций, и работа эта очень сложна, технична.
Непонятно, в чем преимущество новой лаборатории, которую планирует создать А.Клесов, какой опыт имеют специалисты, которых для этого привлекут, как нарастить опыт и базы данных практически с нуля в отрасли, где все специалисты на виду. Зачем эта фраза — «в мире нигде нет»? Чего нет? Все уже давно есть, причем тут Клесов, который пренебрежительно морщится на «ментальность лаборантов», которые эти самые хромосомы собирают из кусочков-элайнментов?
Вот правда интересно, так честно, какие преимущества будут у новой лаборатории? То, что она будет российская? Замечательно. NGS в России есть, коммерческое NG секвенирование это очень неплохо. Из патриотических соображений — обеими руками ЗА. Но в чем тут научная новизна? Может, А.Клесову стоит сначала показать примеры интерпретации полных сиквенсов, которые окажутся лучше, чем имеющиеся? То есть ученый, который всячески открещивается от биологических методов, позиционирует свою версию генеалогии как нечто совершенно новое-инопланетное, вдруг желает воспользоваться целой артиллерией стандартных методов работы с ридами, фильтрацией снипов, построением деревьев из больших элайнментов, не владея софтом для работы с такими гигантскими фрагментами ДНК? Оно, конечно, со стороны выглядит красиво и заманчиво, но не для тех, кто разбирается в технической стороне дела. см. личную стр https://www.facebook.com/valeryz2001
P.S.
Vadim Verenich: 25.01.2015 в 0:12
Радует одно — наука не стоит на месте, и ранее популярные (в том числе и у Клесова) расчеты TMRCA по Y-STR потихоньку сходят на нет, уступая дорогу новым и более точным методикам расчетов по SNP-мутациям Y-хромосомам. Поскольку «Академия Клесова» за все время существования так и не озаботилась обзовестись собственным софтом для расчетов матрицы дистанции и TMRCA в выборке гаплотипов, то их ожидают трудные времена, так в силу неумения работать (или вернее, нежелания учиться работе)со снипами, Клесов просто не сможет переварить для своих адептов новые данные, если вместо Y-STR будут публиковаться Y-SNP гаплотипы (через пару лет этот формат станет более общепринятым). Подобное развитие событий выбьет под «ДНК-генеалогией» Клесова ту базу, которая придает его писаниям наукообразный вид «точной дисциплины». В итоге, когда этот клесовский Изенгард будет разружен естественным ходом независящих от него событйи, Анатолию Клесову ничего не останется, как погрузиться в демагогию. А в этой области его интеллекутальные чары не столь велики.
Похоже, что именно сейчас ДНК-генеалогия Клесова переживает свой пик (точно также, как и новая хронология в 1999-2001 годах). А потом потихоньку сойдет на нет, хотя какое-то количество людей будет еще долго проникнуто идеями АК.
(текст составлен редактором В. Лебедевым из постингов к статье "ДНК-демагогия Клесова", http://trv-science.ru/2015/01/13/dnk-demagogiya-kljosova/ ). Всего 1200 комментариев.
Рейтинг комментария: 6 2