Компьютерный анализ сплайсинга

Компьютерный анализ сплайсинга

Автор: Неверов, Алексей Дмитриевич

Шифр специальности: 03.00.03

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Москва

Количество страниц: 148 с. ил.

Артикул: 3311004

Автор: Неверов, Алексей Дмитриевич

Стоимость: 250 руб.

Оглавление
Список использованных сокращений и обозначений.
Апробация
1. Введение и обзор литературы
1.1 Введение .
1.2 Алгоритмы предсказания генов, основанные на статистических свойствах геномной последовательности
1.3 Азьтернативный сплайсинг АС.
2. Предсказание генов в геномах низших эукариот.
3. Элементарные альтернативы в генах эукариот
3.1 Выявление элементарных альтернатив
3.2 Координированный альтернативный сплайсинг.
4. Альтернативный сплайсинг и функции белков.
4.1 Белковые изоформы альтернативно сплайсируемых генов
4.2 Частота ошибок сплайсинга
5. Материалы и методы.
5.1 Динамическое программирование ДП.
5.2 Построение базы данных альтернативного сплайсинга ЕТЭАБ
5.3 Функциональные группы элементарных альтернатив.
6. Основные результаты и выводы.
Приложения.
Благодарности
Список литературы


Недостатком является то, что они не гарантируют нахождения оптимального решения. Алгоритмами сплайсового выравнивания называют алгоритмы построения выравнивания, учитывающие экзонинтронную структуру генов и гарантирующие нахождение оптимального решения методом динамического программирования. Подробный обзор алгоритмов, использующих сходство для предсказания генов, приведен в работе . Такие алгоритмы позволяют идентифицировать генов в новом геноме , и эта доля будет возрастать по мере секвенирования новых геномов. Тем не менее, применение статистических алгоритмов распознавания генов в процессе аннотации является обязательным этапом, особенно для организмов, имеющих большое значение для медицины и биотехнологии. Современные статистические программы распознавания генов эукариот и многие программы, предсказывающие гены прокариот, используют Скрытую Марковскую Модель НММ генома. Алгоритмы, основанные на НММ, превосходят в чувствительности и специфичности алгоритмы, использующие альтернативные подходы нейронные сети, линейный дискриминантный анализ, лингвистический анализ ,. Одним из достоинств НММ является вероятностная интерпретация алгоритм ищет экзонинтронную структуру, которая с наибольшей вероятностью соответствует последовательности ДНК При построении модели может быть использована любая вероятностная весовая функция сайтов, нуклеотидного состава экзонов и некодирующей ДНК. Далее мы подробно рассмотрим Скрытую Марковскую Модель эукариотического гена, которая лежит в основе статистических алгоритмов. Так же мы коснемся построения парной Скрытой Марковской Модели рНММ для выравнивания гомологичных последовательностей и задачи оценивания параметров модели обучения. Скрытая Марковская Модель эукариотического гена. Успешное применение НММ к задаче распознавания генов человека в работе и i , предложивших программу , дало начато целой серии программ, использующих аналогичную модель геномной ДНК i , , . Перечисленные программы различались в деталях статистических моделях сайтов, кодирующей и некодирующей ДНК и организмах, для которых было произведено обучение. В настоящее время все перечисленные программы обучены для предсказания генов широкого спектра организмов. Программа . При сравнении качества предсказаний различные программы демонстрируют близкие результаты . Прежде чем обсуждать скрытые Марковские модели, дадим определение простой цепи Маркова . Последовательность случайных величин , х,. Маркова с состояниями 1,2,. , Vi, x,, если выполняются условия 1 дтя любого момента времени , УДг, . Рх хиеВидеВг, ,хтеВх,8Рхх,8 Свойство 2 называется свойством марковости и означает, что при любом фиксированном положении системы в данный момент времени, будущее поведение системы не зависит от поведения системы в прошлом. Марковская цепь может быть представлена в виде набора 8,А, п состояний 8, матрицы вероятностей переходов между состояниями Аа5,Рх,1х, 18 и вектором начальных состояний ж Рх18, 81 . Если вероятности переходов а5, не зависят от времени г, то цепь называется однородной. Будем называть Марковской цепью порядка к1 последовательность случайных величин хо, XI, х, . Гк9 обладающих свойством для любого момента времени 2 Рх,х, I, ,x,1с Хо Рх,х, х,. Легко заметить, что Марковская цепь порядка к сводится к Марковской цепи первого порядка путем определения новых состояний как 5. Дадим теперь формальное определение Скрытой марковской модели . Теперь мы будем различать последовательность символов Х X, . Г алфавит и последовательность состояний 7, 2т, 2,е 5. Пусть задана обычная марковская цепь состояний 8,А,лу для каждого состояния зададим распределение эмиссионных вероятностей символов е3ЬРх,Ь 1, 5, х, еГ, 2,е 8. Глядя на последовательность символов X, мы более не можем однозначно сказать какой последовательностью состояний 7, она была сгенерирована состояния скрыты от наблюдателя.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.195, запросов: 145