Информационно-статистический анализ нуклеотидных последовательностей

Информационно-статистический анализ нуклеотидных последовательностей

Автор: Садовский, Михаил Георгиевич

Автор: Садовский, Михаил Георгиевич

Шифр специальности: 03.00.02

Научная степень: Докторская

Год защиты: 2004

Место защиты: Красноярск

Количество страниц: 394 с. ил.

Артикул: 2747228

Стоимость: 250 руб.

1.2. Проблема аннотирования геномов
1.3. Модели генетических текстов
1.4. Построение словарей генетических текстов
1.5. Распознавание структурных закономерностей в генетических текстах
1.6. Методы сравнения генетических текстов
1.7. Информация и энтропия
1.8. Выводы Главы 1
Глава 2. Частотный словарь. Случаи глобального восстановления.
2.1. Соотношение последовательность конечночастотный словарь и
проблема восстановления целого из частей 2.2. Конечночастотный словарь и проблема восстановления полной
последовательности
2.3. Характеристики конечночастотных словарей для реальных
нуклеотидных последовательностей 2.4. Изменение избыточности генов в результате сплайсинга
2.5. О распределении наидлиннейших повторов в различных участках
последовательности
2.6. О распределении наидлиннейших повторов в геномах некоторых
организмов
2.7. Выводы Главы 2
Глава 3. Частотный словарь. Случай локального восстановления
3.1. Задача локального восстановления. Гипотеза наиболее вероятного
продолжения
3.2. Принцип максимума энтропии частотного словаря и восстановление
частотных словарей большей толщины по заданному 3.3. Локальное востановлсние частотных словарей и проблема выбора
статистической модели генетического текста 3.4. Информационное содержание частотных словарей
3.5. Предельная энтропия, удельная энтропия и качество восстановления
частотных словарей
3.6. Качество восстановления для некоторых реальных символьных
последовательностей
3.7. Огличия реальных и восстановленных частотных словарей некоторых 9 генетических текстов 3.8. Сравнительное исследование информационных свойств генов
вирусов и генов их хозяев 3.9. Информационная мкость некоторых геномов
3 Микроинформационная структура генов и геномов
3 Самоподобие геномов . 4 .
3 Выводы Главы 3
Глава 4. Распределение информационно значимых слов в геномах
4.1. Поиск и выделение информационно значимых сайтов в символьных
последовательностях
4.2. Поиск и выделение информационно значимых сайтов в некоторых
биологических последовательностях 4.3. Поиск и выделение информационно значимых сайтов в геномах
4.4. Информационно значимые сайты функционально различных частей в
геномах
4.5. Связь между информационно значимыми сайтами различной длины в
геномах
4.6. О связи структуры и функции в геномах статистическая семантика
геномов
4.7. Выводы Главы 4
Глава 5. Информационные и статистические подходы к определению близости символьных последовательностей
5.1. Сравнение символьных последовательностей по носителям их конечночастотных словарей 5.2. Сравнение генетических текстов по носителям их конечночастотных словарей
5.3. Сравнение символьных последовательностей по их конечночастотным словарям 5.4. Сравнение нескольких символьных последовательностей с помощью их конечночастотных словарей 5.5. Сравнение символьных последовательностей по их частотным словарям 5.6. Сравнение генетических текстов по их частотным словарям 5.7. Сравнение геномов по наборам их информационно значимых слов 5.8. Сравнение функционально различных частей генома по наборам их информационно значимых слов 5.9. Выводы Главы
Заключение
Список литературы
Введение


Тем не менее, частотный словарь такой длины весьма и весьма избыточен в том смысле, что он позволяет полностью восстановить всю исходную последовательность, поскольку каждое слово в нм имеет единственное продолжение. Обратно, весьма упорядоченный текст из четырхбуквенного алфавита вида имеет избыточность, определяемую в соответствии с 1. Данное обстоятельство не является удивительным, если вспомнить, что словари, содержащие слова большей
длины например, 4 и более весьма бедны они содержат лишь 4 различных слова. Для частотных словарей, содержащих слова таких длин избыточность, определяемая согласно 1. Аналогичные результаты, полученные для нескольких конкретных геномов приведены в работе 7. Исследование энтропийных характеристик символьных последовательностей тесно связано с изучением такого их качества, как сложность. В этом направлении получены классические результаты , , , , многие частные варианты которых успешно применялись к исследованиям символьных последовательностей. Другим интересным направлением в исследованиях статистических свойств нуклеотидных последовательностей является их изучение в рамках методологии, которая носит название фрактальной геометрии см. В работе 0 изучался митохондриальный геном следует подчеркнуть, что митохондриальные геномы отличаются по своим статистическим свойствам от иных геномов и богатство структур, наблюдавшихся в данной работе, может быть объяснено именно этим различием. Для данного генома изучался такой его показатель, как фрактальная размерность. Несколько иной, но близкий подход к этой проблеме изложен в ,. Близок к подходу, основанному на изучении фрактальных свойств символьных последовательностей и подход, основанный на исследований вейвлетпреобразований частотных словарей и спектров символьных последовательностей , , , . Такой подход оказывается эффективным при уточнении показателей сложности символьной последовательности, особенно когда эти показатели меняются вдоль по изучаемой последовательности незначительно. Изучение символьных последовательностей, в том числе их статистических и информационных характеристик является центральным местом во многих задачах биоинформатики, лингвистики, некоторых других областях знания. В настоящее время развитие этих исследований в сфере биоинформатики и сопряженных биологических дисциплин реализовалось в следующих областях. Одной из самых важных с прикладной точки зрения является задача аннотирования геномов. Актуальность этой задачи обусловлена как быстрым ростом числа полностью расшифрованных геномов, так и различными задачами как фундаментального, так и прикладного направлений, возникающими в связи с использованием того знания, которое предоставляется исследователям после расшифровки генома. Задача поиска и выделения по образцам тех или иных фрагментах в символьных последовательностях. Данная задача весьма актуальная как в связи с поиском но обширным базам данных, так и для выявления различных структурных элементов в нуклеотидных и аминокислотных последовательностях. Один из основных инструментов в поиске и выявлении такого рода структурных элементов, а также порядка либо беспорядка в символьных последовательностях связан с приближением их с помощью тех или иных моделей. Марковские цепи различного порядка выступают такого рода моделями. Задача сравнения символьных последовательностей является базовой при решении многих других задач, как фундаментальных, так и прикладных. В настоящее время в исследованиях по биоинформатике, а также молекулярной биологии и молекулярной генетике основным методом сравнения остатся выравнивание. Для этого метода развито большое количество различных программных и алгоритмических реализаций. Энтропийный и информационный подходы к изучению символьных последовательностей также составляют важную часть всех исследований в этой области. Однако базу этого подхода составляют исследования одночастичных однобуквенных функций распределения, по которым определяются информационные и энтропийные характеристики изучаемых последовательностей.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.210, запросов: 145