Стохастическая модель квазивидов
Слово «стохастический» - это прилагательное, которое описывает что-то, определяемое случайным образом. Впервые оно появилось для описания математических объектов, называемых стохастическими процессами, но сейчас в математике термины «стохастический процесс» и «случайный процесс» считаются взаимозаменяемыми. Слово первоначально произошло от древнегреческого «στόχος», что означает «цель, предположение». В теории вероятностей и смежных областях стохастический или случайный процесс является математическим объектом, обычно определяемым как совокупность случайных величин. Исторически случайные переменные были связаны с набором чисел или индексировались ими и обычно рассматривались как точки во времени.Это давало интерпретацию стохастического процесса в виде числовых значения некоторой системы, случайным образом меняющейся со временем. Примерами таких систем могут являться: рост популяции бактерий, электрический ток, колеблющийся из-за теплового шума, или движение молекулы газа. Стохастические процессы широко используются в качестве математических моделей систем и явлений, которые, как представляется, изменяются случайным образом. Они имеют приложения по многим дисциплинам, включая такие науки, как биология, химия, экология и физика, а также технологии и инженерные области, такие как обработка изображений, теория информации, информатика, криптография [и телекоммуникации. Более того, казалось бы, случайные изменения на финансовых рынках стимулировали широкое использование случайных процессов в финансах. В данной работе будем реализовывать стохастическую модель динамики квазивидов ВИЧ с использованием генетических алгоритмов. Генетический алгоритм — это эвристический алгоритм, который используется для решения задач оптимизации и моделирования путемкомбинирования,случайного подбора и вариации искомых параметров и использует механизмы, аналогичные естественному отбору в природе. Является разновидностью эволюционных вычислений, с помощью которых решаются оптимизационные задачи с использованием методов естественной эволюции, таких как наследование, рекомбинации, мутации и отбор. Отличительной особенностью генетического алгоритма является акцент на использование оператора «скрещивания», который производит операцию рекомбинации, роль которой аналогична роли скрещивания в живой природе. Будем называть виртуальным геномом последовательность символов, которая кодирует некоторый участок РНК вируса иммунодефицита человека. Далее будет использован четырехбуквенный алфавит, каждая буква которого соответствует нуклеотиду: A – аденин, G – гуанин, T – тимин, C – цитозин. В модели виртуальный ген является аналогом нити вирусной РНК, а виртуальная популяция (вектор пар виртуальных генов) – аналог вирусных частиц. Общая схема генетического алгоритма приведена на рисунке1.
Рисунок 1– Схема генетического алгоритма
Рассматриваемая популяция подразделяется на восемь классов: WT (дикий тип –в 41 и 215 позициях находятся метионин (ATG) и треонин (ACC) соответственно, т.е. в позициях 121–123 содержится комбинация символов ATG, а в позициях 643–645 – комбинация символов ACC); M41L (в 41 позиции последовательность TTG); T215N (в 215 позиции последовательность ААС); T215S (в 215 позиции последовательность ТСС); T215Y (в 215 позиции последовательность TAC); M41L/T215N (в 41 позиции последовательность TTG, в 215 позиции последовательность AAC); M41L/T215S (в 41 позиции последовательность TTG, в 215 позиции последовательность TCC); M41L/T215Y (в 41 позиции последовательность TTG, в 215 позиции последовательность TAC). Размер популяции – 1000 вирусных цепочек, не меняется в ходе программы. Длина генома – 1800. Начальная популяция состоит из вирусных мутантовдикого типа, т.е. вирусные цепочкив позициях 121–123 содержат комбинацию символов ATG, а в позициях 643–645 – комбинацию символов ACC. При инициализации популяции символы в позициях вирусных цепочек, отличных от 121-123 и 643-645, генерируются случайным образом. Начальная популяция состоит из одинаковых вирусных цепочек. Рекомбинация В генетических алгоритмах и эволюционных вычислениях кроссовер, также называемый рекомбинацией, является генетическим оператором, используемым для объединения генетической информации двух родителей с целью генерации нового потомства. Это один из способов стохастически генерировать новые геномыв существующейпопуляции.Он аналогичен кроссоверу, который происходит во время полового размножения в биологии. В данной модели рекомбинация представляется следующим образом: в процессе обратной транскрипции происходит перенос генов с одной цепочки РНК на другую крест-накрест (рисунок 2). Рисунок 2– Схема рекомбинации
При этом цепочки-родители, участвовавшие в рекомбинации, заменяются своими потомками. В данной модели вероятность рекомбинации двух вирусных цепочек равна 0,5. Для каждой пары цепочек берется случайное число от 0 до 1, и если оно меньше или равно 0,5, то происходит рекомбинация. Точка разрыва выбирается случайным образом. На текущем этапе моделируется разрыв только в одной позиции. Мутация Следующий этап генетического алгоритма– мутация. Мутация – это генетический оператор, используемый для сохранения генетического разнообразия от одного поколения популяции до следующего и является аналогом биологической мутации. Мутация изменяет значения одного или несколькихгенов в геноме и происходит в соответствии с определяемой в модели мутационной вероятностью. Эта вероятность должна быть установлена на низком уровне. В данной модели положим вероятность мутации равной 0,2. Как и в случае рекомбинации, мутация будет происходить, если случайное число от 0 до 1 оказывается меньше или равно 0,2. Позиция, в которой будет происходить мутация, выбирается случайным образом. Для моделирования вероятности мутации использованы оригинальные данные, полученные в ходе биологических экспериментов учеными из города Лёвен (Бельгия). Скорости мутаций приведены в таблице 1.
Таблица 1– Скорости мутаций
Для использования данных в модели был адаптирован метод рулетки. Скорости мутации для каждого основания были расположены на колесе рулетки так, что размер сектора, соответствующего каждому основанию, пропорционален скорости мутации в данное основание. На рисунке3 изображены рулетки для расчета вероятностей мутаций каждого из рассматриваемых в модели типов оснований. Рисунок 3– Рулетка для расчета вероятности мутации оснований
Процесс размножения популяции на данном этапе реализуется как умножение на некоторое число (20) количества генов всех типов, присутствующих в популяции. Отбор Отбор – это этап генетического алгоритма, в котором отдельные геномы выбираются из популяции для следующей итерации. Отбор генов в новую популяцию производился по известным значениям функции приспособленности, приведенным в таблице 2, с помощью метода рулетки.
Таблица 2– Значения функции приспособленности
Расчеты проводились дважды – для концентрации AZTμM равной 0 и 0,3. Размер сектора рулетки для каждого квазивида пропорционален его устойчивости к AZTμM, т.е. вероятность цепочки быть отобранной в новую популяцию тем больше, чем выше ее резистентность к AZTμM.
Популярное: Почему стероиды повышают давление?: Основных причин три... Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (320)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |