Модель появления и пропадания генов в ходе эволюции
Ход эволюционного процесса удобно представлять в виде филогенетического дерева. Дерево отображает последовательность разделения видов, начиная от общего организма, проходя через ряд промежуточных предков и заканчивая срезом эволюционного процесса в настоящее время. Ген в ходе эволюции может пропасть у какого-либо из организмов и далее у всех потомков этого организма отсутствовать или… Читать ещё >
Модель появления и пропадания генов в ходе эволюции (реферат, курсовая, диплом, контрольная)
ген архитектура нейронный сеть Рассматривается упрощенная модель эволюции, в которой вероятности пропадания и появления генов в потомках исходного организма считаются постоянными для каждой ветви филогенетического дерева. Исчезновение и возникновение генов в ходе эволюции приводит к их специфическому распределению среди изучаемых организмов.
Ход эволюционного процесса удобно представлять в виде филогенетического дерева. Дерево отображает последовательность разделения видов, начиная от общего организма, проходя через ряд промежуточных предков и заканчивая срезом эволюционного процесса в настоящее время. Ген в ходе эволюции может пропасть у какого-либо из организмов и далее у всех потомков этого организма отсутствовать или отсутствующий ген может появиться у одного из промежуточных организмов. Результат воздействия эволюционного процесса на гены в организмах приводит к образованию специфических паттернов, характерных для каждого из генов. Паттерном является последовательность признаков наличия («1») или отсутствия («0») конкретного гена в каждом из организмов.
На основе анализа паттернов для разных генов группы организмов можно судить о ходе эволюционного процесса. Так, если ген отсутствует в подгруппе организмов, объединенных одним поддеревом филогенетического дерева, то можно предположить, что он пропал на ветви, непосредственно предшествовавшей вершине такого поддерева. На самом деле такой подход, конечно, неточен. Динамика наличия генов носит стохастический характер, и ее оценку необходимо проводить с учетом этого, то есть определять вероятности их появления и пропадания на каждой из ветвей дерева.
Рассмотрим вектора, описывающие вероятности появления и пропадания генов на каждой ветви филогенетического дерева, соответственно.
Здесь — это общее количество ветвей в дереве. Удобно ввести у филогенетического дерева узлы с номерами соответствующими номеру входящей в него ветви дерева (рис. 1). При переходе от некоторого узла к следующему, с номером, вероятность появления гена будет равна, а его пропадания —. Тогда филогенетическое дерево описывает схему возможных изменений признаков наличия гена в ходе эволюции.
Частоты встречаемости различных видов паттернов будут полностью определяться векторами и. Зависимость эта в замкнутом виде представлена быть не может, но для каждого конкретного паттерна можно рассчитать вероятность его появления путем перебора допустимых вариантов комбинаций вероятностей и их дополнений.
Рис. 1. Пример вероятностей появления и пропадания генов на филогенетическом дереве
Возникает задача найти такую пару векторов и, при которой достигается наименьшее отклонение истинных частот присутствия паттернов от рассчитанных вероятностей их появления, то есть минимизировать функцию ошибок.
(1.1).
Для прямого расчета составляющих градиента объем вычислений оказывается столь велик, что становится сомнительной возможность их проведения в разумное время.
Аналогичная проблема возникла в теории нейронных сетей при обучении многослойных персептронов. Одна из наиболее важных идей в теории нейронных сетей состоит в возможности эффективного проведения расчета производных целевой функции по весам с помощью алгоритма backpropagation. Суть этого алгоритма состоит в правильной группировке слагаемых и основанном на этом использовании метода динамического программирования, что снижает количество необходимых операций на порядки.