Анализ регуляторных геномных последовательностей с помощью компьютерных методов оценок сложности генетических текстов

Анализ регуляторных геномных последовательностей с помощью компьютерных методов оценок сложности генетических текстов

Автор: Орлов, Юрий Львович

Шифр специальности: 03.00.15

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Новосибирск

Количество страниц: 180 с. ил.

Артикул: 2633751

Автор: Орлов, Юрий Львович

Стоимость: 250 руб.

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
Список сокращений
Глава 1. ОБЗОР ЛИТЕРАТУРЫ
1.1. ЗАДАЧИ КОМПЬЮТЕРНОГО АНАЛИЗА ГЕНЕТИЧЕСКИХ МАКРОМОЛЕКУЛ
1.1.1. Проблемы компьютерного анализа генетических текстов
1.1.2. Международные проекты геномных исследований
1.2. СТРУКТУРА ГЕНОМНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
1.2.1. Особенности структуры генов и геномов про и эукариот
1.2.2. Формальная классификация типов повторов
1.2.3. Повторы в геномах
1.2.4. Взаимная совместимость генетических сообщений
1.3. СТРУКТУРНОФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ РЕГУЛЯТОРНЫХ
РАЙОНОВ ТРАНСКРИПЦИИ ГЕНОВ ЭУКАРИОТ
1.3.1. Строение регуляторных районов генов эукариот
1.3.2. Иерархическая организация регуляторных районов эукариот
1.3.3. Анализ нуклеосомного кода укладки хроматина
1.4. АЛГОРИТМЫ ОЦЕНКИ СЛОЖНОСТИ ГЕНЕТИЧЕСКИХ ТЕКСТОВ
1.4.1. Сложность символьных последовательностей
1.4.2. Сложность текстов по Лемпелю и Зиву
1.4.3. Анализ лингвистической комбинаторной сложности ДНК
1.4.4. Анализ структуры геномных последовательностей преобразование Фурье
1.5. МЕТОДЫ МНОЖЕСТВЕННОГО ВЫРАВНИВАНИЯ И ПОИСКА ГОМОЛОГИИ
1.5.1. Алгоритмы попарного выравнивания
1.5.2. Метод 1граммного разложения
1.5.3. Поиск гомологий на основе алгоритмов выравнивания и
1.5.4. Реконструкция деревьев сходства
1.6. КОМПЬЮТЕРНЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ ФУНКЦИОНАЛЬНЫХ РАЙНОВ ГЕНОМНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
1.6.1. Стандарты описания функциональных сайтов
1.6.2. Методы компьютерного распознавания регуляторных районов
1.6.3. Метод скрытых марковских цепей
1.6.4. Обзор программ распознавания промоторов
1.6.5. Сравнение точности методов распознавания
1.7. ИНТЕГРАЛЬНЫЕ МЕТОДЫ ПРЕДСКАЗАНИЯ ФУНКЦИОНАЛЬНЫХ РАЙОНОВ В ГЕНЕТИЧЕСКИХ ТЕКСТАХ
1.7.1. Методика отбора контекстных характеристик на основе теории полезности для принятия решений
1.7.2. Нейронные сети для классификации генетических текстов
1.7.3. Поиск закономерностей в базах данных
1.7.4. Алгоритмы поиска закономерностей на основе вероятностных реляционных моделей
ЗАКЛЮЧЕНИЕ ПО ОБЗОРУ ЛИТЕРАТУРЫ И ПОСТАНОВКА ЗАДАЧ
ИССЛЕДОВАНИЯ
Глава 2. КОМПЬЮТЕРНЫЙ АНАЛИЗ ГЕНЕТИЧЕСКИХ ТЕКСТОВ
МАТЕРИАЛЫ И МЕТОДЫ
2.1. МЕТОДЫ И АЛГОРИТМЫ АНАЛИЗА СЛОЖНОСТИ ГЕНЕТИЧЕСКИХ ТЕКСТОВ
2.1.1. Алгоритмы оценки сложности, реализованные в программе xi
2.1.2. Сложность по Лемпелю и Зиву. Алгоритм и программная реализация
2.1.3. Стохастическая сложность геномных последовательностей алгоритм и программная реализация
2.1.4. Обобщение метода сложностного разложения для двух и более текстов
2.1.5. Профили сложности геномных последовательностей
2.1.6. Поиск максимальных совершенных и несовершенных повторов
2.2. ПОИСК ЗАКОНОМЕРНОСТЕЙ КОНТЕКСТНОЙ ОРГАНИЗАЦИИ
ГЕНЕТИЧЕСКИХ ТЕКСТОВ СИСТЕМА IV
2.2.1. Использование алгоритма Дискавсри для поиска закономерностей
2.2.2. Параметры компьютерной системы iv
2.2.3. Выделение контекстных сигналов
2.2.4. Поиск сигналов и комплексных сигналов в нуклеотидных последовательностях
2.3. ВЫБОРКИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГЕНЕТИЧЕСКИХ МАКРОМОЛЕКУЛ
ДЛЯ КОМПЬЮТЕРНОГО АНАЛИЗА
2.3.1. Базы данных и выборки последовательностей
2.3.2. Данные по функциональным районам генов и геномов. Выборки промоторов, экзонов, интронов, сайтов формирования нуклеосом
2.3.3. Данные по полным геномам микроорганизмов
2.3.4. Данные по полным геномам эукариот
Глава 3. РЕЗУЛЬТАТЫ КОМПЬЮТЕРНОГО АНАЛИЗА ГЕНЕТИЧЕСКИХ
ТЕКСТОВ
3.1. АНАЛИЗ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК, СОДЕРЖАЩИХ САЙТЫ СВЯЗЫВАНИЯ ТРАНСКРИПЦИОННЫХ ФАКТОРОВ
3.1.1. Сложность нуклеотидных последовательностей сайтов связывания транскрипционных факторов
3.1.2. Качественный анализ контекстных зависимостей в нуклеотидных последовательностях ССТФ
3.1.3. Поиск сайтов связывания транскрипционных факторов с помощью марковских моделей с переменной памятью
3.2. АНАЛИЗ СЛОЖНОСТИ ФУНКЦИОНАЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
ДНК ЭКЗОНОВ, ИНТРОНОВ И РЕГУЛЯТОРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
3.2.1. Сравнение сложности экзонов, интронов и регуляторных последовательностей
3.2.2. Анализ локальных участков сложности промоторов
3.3. АНАЛИЗ ЗАКОНОМЕРНОСТЕЙ КОНТЕКСТНОЙ ОРГАНИЗАЦИИ
ПРОМОТОРПЫХ РАЙОНОВ
3.3.1. Контекстные сигналы в промоторных последовательностях
3.3.2. Поиск комплексных сигналов в промоторах
3.3.3. Исследование промоторов генов системы липидного метаболизма, интерферон 8 регулируемых генов и генов системы ответа на тепловой шок
3.3.3. Анализ комплексных сигналов и распознавание промоторных районов генов 2 эукариот
3.4. ИССЛЕДОВАНИЕ СЛОЖНОСТИ САЙТОВ СПЛАЙСИГА
3.5. АНАЛИЗ ЛИДЕРНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ мРНК ГЕНОВ 9 ЭУКАРИОТ ОЦЕНКИ СЛОЖНОСТИ И ПРЕДСКАЗАНИЕ УРОВНЯ ЭКСПРЕССИИ
3.6. ИССЛЕДОВАНИЕ САЙТОВ СВЯЗЫВАНИЯ НУКЛЕОСОМ
3.6.1. Контекстные деревьяисточники для сайтов формирования нуклеосом
3.6.2. Сложность сайтов формирования нуклеосом
3.6.4. Предсказание сайтов формирования нуклеосом в геномной ДНК
3.7. АНАЛИЗ КОНТЕКСТНОЙ СТРУКТУРЫ ПОЛНЫХ ГЕНОМОВ
3.7.1. Оценка локальной контекстной структуры полных геномов с помощью 5 марковских моделей с переменной памятью
3.7.2. Поиск контекстно неоднородных участков в геномах
3.7.3. Сложностные разложения протяженных геномных последовательностей. 9 Распределение повторов различных типов
3.7.4. Анализ протяженных геномных повторов максимальной длины
3.7.5. Анализ контекстной близости бактериальных геномов с помощью 8 сложностных разложений. Выделение максимальных общих фрагментов
3.7.6. Поиск участков низкой сложности в полных бактериальных геномах
3.7.7. Анализ структуры хромосом эукариот
ЗАКЛЮЧЕНИЕ
ВЫВОДЫ ПО ДИССЕРТАЦИОННОЙ РАБОТЕ
Список публикаций по теме диссертации
ЛИТЕРАТУРА


Результаты исследования контекстной организаций сайтов формирования нуклеосом с помощью марковских моделей. Сравнительный анализ сложности функциональных районов эукариот, включая экзоны, интроны, регуляторные районы, сайты формирования нуклеосом. Исследование сложности текста и распределения повторов в полных бактериальных геномах выявление максимальных совершенных повторов. Применение системы iv для исследования структурнофункциональной организации промоторных районов коэкспрсссирующихся групп генов и поиска комплексных сигналов. Автор выражает глубокую признательность научному руководителю чл. Колчанову, сотрудникам ИЦиГ СО РАН О. В. Вишневскому, В. Г. Левицкому, М. А. Позднякову и М. П. Пономаренко, сотрудникам ИМ СО РАН Е. Е. Витяеву, В. Д. Гусеву и В. Н. Потапову за помощь в подготовке работы и обсуждение научных результатов. НТП нетранслируемая последовательность п. ДНК РГП регуляторные iеномные последовательности ССТФ сайты связывания транскрипционных факторов т. Глава 1. Распознавание и функциональная аннотация регуляторных последовательностей генов эукариот имеют большое значение для молекулярной биологии в наступившую постгсномную эру. До начала эпохи массового ссквснирования многим исследователям казалось, что функциональные участки будут однозначными, иметь весьма простую структуру. В действительности, проблема определения функции по последовательности ДНК гораздо сложнее, что связано с неоднозначностью кодирования генетической информации ФранкКаменецкий, v, . Лишь участки действия некоторых ферментов имеют одинаковое строение например, сайты действия рестриктаз Нго тина. Участки ДНК, с которыми связываются регуляторные белки, не столь однозначны. Их поиск в нуклеотидной последовательности гораздо более сложная задача. Сайты связывания РНКполимераз, участки начала трансляции РНК, участки сплайсинга и т. В ряде случаев функциональные сайты, выполняющие идентичную функцию, могут полностью отличаться по первичной структуре. Это относиться как к нуклеотидным сайтам, так и к активным сайтам белков Vv , . Поэтому выявление и анализ закодированных в последовательностях ДНК функциональных сигналов требует применения более совершенных методов распознавания образов, статистических подходов и специальных оптимизированных алгоритмов для преодоления вычислительных трудностей, связанных с обработкой огромных массивов информации. К задачам предсказания функционального значения геномной ДНК функциональной аннотации следует отнести идентификацию белоккодирующих участков, сайтов связывания с белками, сигналов транскрипции и трансляции v, . Прогресс в этой области непосредственно зависит от уровня накопленных молекулярнобиологических знаний. Несмотря на вс более совершенные методы распознавания, задача идентификации белоккодирующих генов далека от разрешения значительно различаются даже оценки числа генов в геноме человека, найденных с помощью различных компьютерных методик ii, . Генетическим текстом здесь и далее будем называть представление природной макромолекулы в виде конечной последовательности символов соответствующего алфавита 4 типа нуклеотидов для ДНК и РНК и типов аминокислот для белков. Представление молекул ДНК, РНК и белков как генетических текстов является наиболее простым и отражает наиболее существенные особенности генетических макромолекул наличие в них генетической информации и линейного способа ее записи и храпения. Словами назовем короткие нуклеотидные последовательности в геноме. Изучение наиболее и наименее распространенных слов, выявление участков генома, различающихся по частотам использования нуклеотидов и нуклеотидных слов позволяет выдвигать новые гипотезы о функциональной роли фрагментов генетического текста и их эволюционной истории i , Ратнер, , i , v i, i , Уотермсн, , . Исторически одним из первых представление о генетических языках было введено В. А. Ратнером в х Ратнер, . Плодотворным оказался подход, связанный с лингвистическими представлениями текста и математической теорией кодирования информации iv, i, iv .

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.262, запросов: 145