+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Оценка достоверности кластеров функционально-значимых фрагментов биологических последовательностей

  • Автор:

    Фурлетова, Евгения Игоревна

  • Шифр специальности:

    03.01.09

  • Научная степень:

    Кандидатская

  • Год защиты:

    2012

  • Место защиты:

    Москва

  • Количество страниц:

    128 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

ОГЛАВЛЕНИЕ
Введение
Глава 1. Обзор литературы
1.1. Мотивы биологических последовательностей и их вхождения
1.2. Вероятностные модели
1.3. Методы вычисления Г-значения кластера вхождений мотива
1.4. Сходства биологических последовательностей
1.5. Затравки
Глава 2. Теоретическая основа алгоритма 8и1Рге4
2.1. Постановка задачи
2.2. Перекрытия слов в мотиве. Граф перекрытий
2.3. Среднее число перекрытий
2.4. Текстовые множества
2.5. Вероятности текстовых множеств
Глава 3. Алгоритм 8и1Рге4 для вычисления /’-значения участка, содержащего кластер вхождений мотива
3.1. Алгоритм ЗиАРгебдля моделей Бернулли
3.2. Алгоритм ЗтйРгебдля СММ
3.3. Алгоритм ЗибРгебдля Марковских моделей
3.4. Предварительные построения
3.5. Анализ сложности алгоритма 8и1Рге1'
Глава 4. Программная реализация алгоритма БиГРгеГи ее апробация
4.1. Программная реализация алгоритма 8и1РгеГ
4.2.Сравнение программы 8и1РгеГ с программой АйоРго
4.3. Оценка статистической значимости шаблонов неупорядоченных участков в белках
Глава 5. Построение классификационных затравок для нахождения
5.1. Классификационные затравки. Основные определения
5.2. Классификационные алфавиты
5.3. Классификационные затравки
Заключение
Литература

ВВЕДЕНИЕ
Актуальность темы исследования
Одним из важных направлений биоинформатики является распознавание функционально-значимых участков биологических последовательностей. Как правило, такие участки отличаются повышенным содержанием определенных слов. Набор слов, характерных для функционально-значимых участков определенного вида называется мотивом; место положения слова из мотива в биологической последовательности называется вхождением (или сайтом вхождения) мотива; набор сайтов, расположенных на определенном участке биологической последовательности, называется кластером вхождений (или кластером сайтов) мотива. Таким образом, задачу распознавания функциональнозначимых участков можно решать путем поиска участков с повышенным содержанием слов из соответствующего мотива. При таком подходе для решения задачи распознавания необходимо:
1) уметь оценивать достоверность (функциональную значимость) найденного кластера вхождений мотива и 2) определять характерную для мотива последовательность мономеров.
В биологических последовательностях кластеры вхождений определенного мотива могут появляться не только в результате естественного отбора, но и случайно. В качестве меры достоверности кластера вхождений мотива в биологической последовательности часто используется вероятность (Р-значение) появления такого кластера в случайной последовательности соответствующей длины при подходящей вероятностной модели. Чем меньше вероятность обнаружить в случайной последовательности кластер, в котором количество вхождений мотива превышает заданный порог, тем больше оснований считать, что наличие такого кластера обусловлено его биологической значимостью.
Говоря более формально, Р-значением кластера из г вхождений мотива, расположенного на участке длины п относительно заданной вероятностной модели, называется вероятность обнаружить в случайной последовательности длины п кластер, содержащий не менее г вхождений мотива. Таким образом,

встает вопрос о разработке эффективного метода вычисления Г-значения, что и является основной задачей данного исследования.
Проблема оценки достоверности предсказанных функциональнозначимых вхождений мотива возникает в различных областях биоинформатики. Среди ученых, внесших значительный вклад в решение этой проблемы,
О. Берг, Д. Гильберт, В.Ю. Макеев, A.A. Миронов, Г. Нюэль, М. Рснье, П. фон Хиппель и ряд других. Примером области, где необходима оценка достоверности кластеров сайтов, является идентификации потенциальных кластеров сайтов связывания белков - факторов регуляции транскрипции (ССФРТ), т.е. участков ДНК, которые взаимодействуют с факторами транскрипции. Здесь мотив - это набор допустимых сайтов связывания данного фактора транскрипции. Во многих существующих программах распознавания кластеров ССФРТ отбор значимых результатов производится на основе вычисленного P-значения. Сказанное выше определяет актуальность выбранной темы.
Построение мотивов, используемых для распознавания, ведется, как правило, с помощью поиска локальных сходств. Для достаточно удаленных друг от друга видов (например, для человека и мыши) выраженное сходство между участками генома говорит о функциональной значимости этих участков. При этом сходные по первичной структуре участки филогенетически удаленных геномов часто имеют сходные функции. Поэтому поиск сходных фрагментов важен при построении мотивов: обнаружив ряд сходных между собой фрагментов в одном геноме или в нескольких геномах, можно по ним построить поисковый образ (мотив), который затем будет использоваться для поиска участков генома, содержащих избыточное количество вхождений таких мотивов.
Для решения задачи поиска локальных сходств, как правило, применяются фильтрационные методы. В частности, именно так работают программы для поиска локальных сходств, такие как BLAST [92], Owen [96], YASS [99]. Эти методы основаны на предварительной фильтрации пространства поиска. Сначала находят короткие гомологичные фрагменты последовательностей (якоря или затравочные сходства). Затем якоря расширяют до выравниваний более длинных фрагментов путем анализа окрестностей якорей. Образец для поиска затравочных сходств называется затравкой. Фильтрационные методы

Рис. 2.2.1 Левый граф перекрытий ЬОСц для мотива Н из примера 2.2.2. Кружками отмечены внутренние вершины графа у/ є ОУ(Н). Листьями графа являются классы эквивалентности из Н*, см. пример 2.2.6. Листья отмечены прямоугольниками. Корень дерева соответствует пустому слову.
Рис. 2.2.2. Правый граф перекрытий КОСц для мотива Низ примера 2.2.2. Кружками отмечены внутренние вершины графа н>є ОУ(Н). Листьями графа являются классы из Н*. Листья отмечены прямоугольниками. Корень дерева соответствует пустому слову. Номера вершин соответствуют номерам тех же вершин в ЬООа (см. рис. 2.2.1).

Рекомендуемые диссертации данного раздела

Время генерации: 0.122, запросов: 967