Алгоритмы и программные системы для анализа регуляторных последовательностей ДНК

Алгоритмы и программные системы для анализа регуляторных последовательностей ДНК

Автор: Черемушкин, Евгений Сергеевич

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Новосибирск

Количество страниц: 140 с. ил.

Артикул: 2976577

Автор: Черемушкин, Евгений Сергеевич

Стоимость: 250 руб.

Алгоритмы и программные системы для анализа регуляторных последовательностей ДНК  Алгоритмы и программные системы для анализа регуляторных последовательностей ДНК 

1. АЛГОРИТМЫ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ РЕГУЛЯТОРНЫХ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК.
1.1. Биологическая постановка задачи.
1.2. Обзор подходов к распознаванию ССТФ.
1.3. Поиск шумоподобных сигналов на последовательности ДНК.
Преобразование последовательности ДНК к сигналу.
Алгоритм поиска сигналов Баркера
Визуализация автокорреляционной функции цепочек ДНК.
Анализ разброса АКФ в различных участках ДНК
Изучение зависимости скоррелированности регуляторных участков от положения в гене
1.4. Обобщенные сигналы Фрэнка в применении к анализу последовательностей
Применение сигналов Фрэнка к анализу последовательностей ДНК
Результаты
1.5. Исследование последовательностей ДНК с помощью кода Голея и кода
Хэмминга 4,
Коды Хэмминга.
Коды Голея
Анализ последовательностей ДНК с помощью сигналов Голея.
Результаты анализа последовательностей с помощью одного из кодов Хэмминга
Результат анализа последовательностей с помощью кода Голея
1.6. Алгоритмы визуализации ДНК на основе вейвлетпреобразования
Заключение
2. АЛГОРИТМЫ РАСПОЗНАВАНИЯ ЦИСЭЛЕМЕНТОВ, БАЗИРУЮЩИЕСЯ НА
БИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ
2.1. Алгоритмы распознавания сайтов
2.2. Ал гори весовых матриц.
2.3. Модифицированный алгоритм филогенетического футпринта
Выравнивание последовательностей
Модифицированный алгоритм филогенетического футпринта.
2.4. Алгоритм распознавания сайтов ядерных рецепторов
2.5. Алгоритмы анализа профилей экспрессии микрочипов
Технология
Постановка задачи.
Поиск оптимального композиционного модуля.
Тестирование на реальных данных дрожжевого клеточного цикла.
2.6. Анализ однонуклеотидных полиморфизмов в последовательностях ДНК.
Алгоритм поиска однонуклеотидных полиморфизмов
Вычисление оптимальных порогов Б1тп И Б1тах
Статистические оценки распределения однонуклеотидных полиморфизмов в сайтах
Заключение
3. ПРОГРАММНЫЙ КОМПЛЕКС ПО АНАЛИЗУ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ДНК
3.1. Реализация алгоритма филогенетического футпринта
Построение базы данных консервативных некодируюших последовательностей
3.2. Описание пакета БМРКеБеагсЬ.
Визуализация результатов анализа однонуклеотидных полиморфизмов.
3.3. Реализация алгоритма антифутпринтi
3.4. Система .
Ядро системы
Жизненный цикл компонентов системы .
3.5. Визуальные интерфейсы для обработки информации
Разработка информационной системы xi.
Реализация алгоритма поиска сайтов ядерных рецепторов.
3.6. Пакет i по обработке биологической информации
Реализация объединенной среды по анализу регуляторных последовательностей. 8 Визуализация результатов анализа биологической информации
3.7. Оценка качества распознавания программных систем.
Поиск ключевой регулирующей молекулы на примере анализа экспрессии при
индукции апоптоза фактором
Проведение комплексного анализа на примере данных по изучению синдрома
хронической усталости.
Результаты анализа экспериментальных данных.
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Результаты работы докладывались на различных конференциях ЕССВ Париж, Франция ii i ii Гаваи, США Ii, i на Дне молодых ученых Новосибирск Конференции естественных вычислений I Чаныиа, Китай Немецкой конференции по биоинформатике Гамбург, Германия конференции Технологии Майкрософт в информатике и программировании в гг. Новосибирск. Автором по теме диссертации опубликовано печатных работ. Диссертационная работа состоит из введения, трех глав и списка литературы. Объем диссертации 0 стр. Список литературы содержит наименований. Работа включает рисунков и графиков, полученных в результате расчетов на ЭВМ, а также таблиц. Целью данной работы явилась разработка новых и улучшение имеющихся алгоритмов и программ для приближенной идентификации подцепочек в последовательностях ДНК, называемых цнеэлементми или сайтами связывания транскрипционных факторов с ДНК ССТФ. В первой главе рассматриваются алгоритмы идентификации подцепочек, соответствующих различным кодам Кодам Баркера, Голея, Фрэнка, Хэмминга. Также рассматриваются подходы по анализу ДНК с помощью автокорреляционной функции. Автором было изучено применение теории шумоподобных сигналов к анализу регуляторных последовательностей ДНК. Аналогичных исследований других научных коллективов в мире автором не найдено. Также было изучено применение вейвлетов к анализу последовательностей ДНК. Во второй главе рассмотрены алгоритмы идентификации цисэлементов подцепочек в регуляторных районах ДНК с использованием известной заранее информации об этих подцепочках. Рассмотрен алгоритм весовых матриц. Рассмотрен новый алгоритм распознавания двойных сайтов, разработанный автором. Предложенный нами алгоритм более специфичен, так как рассчитан только на сайты с двойным ядром. Поэтому алгоритм поиска двойных сайтов рассматривается авторами как наиболее применимый для данной задачи. Авторами исследован существующий и предложен новый модифицированный алгоритм филогенетического футпринта, реализующий лучший по сравнению с существовавшими ранее методами поиск сайтов в гомологичных регуляторных последовательностях. Предложен новый алгоритм анализа данных по экспрессии генов микрочипов с целью определения регуляторной промоторной модели гена. Также предложен алгоритм выявления регуляторных свойств однонуклеотидных полиморфизмов. В третьей главе описаны программные системы, реализующие все описанные выше алгоритмы. В ходе работы были разработаны несколько программных продуктов, объединяющих все исследованные в рамках данной работы алгоритмы. История разработки этих программных продуктов содержит несколько экспериментальных версий, которые были использованы для апробирования набора классов, реализованных в окончательной версии. Реализован алгоритм филогенетического футпринта Язык Си, создана база данных консервативных некодирующих последовательностей , пакет программ , производящий анализ однонуклеотидных полиморфизмов в последовательностях ДНК. Далее разработана интегральная система , включающая различные алгоритмы поиска ССТФ алгоритм поиска сайтов ядерных рецепторов, алгоритм поиска ССТФ при имеющихся данных по экспрессии генов, алгоритм поиска сайтов в наборе последовательностей промоторов одного вида, различающихся по фенотипу, алгоритм анализа однонуклеотидных полиморфизмов, улучшенный алгоритм филогенетического футпринта. Проект по разработке программной системы i получил поддержку фонда Бортника по программе СТАРТ. На разработку этой системы зарегистрирована карта НИОКР номер . В настоящий момент пакет i находится на этапе внедрения. С использованием элементов пакета разработана интеллектуальная система анализа данных по экспрессии генов xi. Различные программные продукты реализованы на языках С, , v, , . Была проведена оценка качества распознавания программных систем на нескольких экспериментальных примерах. В том числе были рассмотрены исследования специальной линии раковых клеток человека, подавляемых фактором . Также был рассмотрен обширный набор данных пациентов с синдромом хронической усталости, включающих микрочипы, однонуклеотидные полиморфизмы, фенотипические данные, соответствующие анализу крови. В результате проведения анализа данных были выявлены как раз те транскрипционные факторы, которые, как подтверждено экспериментально, отвечают за регуляцию генов в данном эксперименте.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.210, запросов: 244