Алгоритмы и программный инструментарий для исследования процессов генной регуляции

Алгоритмы и программный инструментарий для исследования процессов генной регуляции

Автор: Валеев, Тагир Фаридович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Новосибирск

Количество страниц: 163 с. ил.

Артикул: 3304818

Автор: Валеев, Тагир Фаридович

Стоимость: 250 руб.

Алгоритмы и программный инструментарий для исследования процессов генной регуляции  Алгоритмы и программный инструментарий для исследования процессов генной регуляции 

Оглавление
Введение.
Глава 1. Первичный анализ регуляции генов.
1.1. Основные понятия и определения.
1.2. Создание базы знаний о факторах и предсказание сайтов связывания.
1.3. Обработка экспериментальных данных и предсказание регулирующих факторов Глава 2. Модель регуляторного комплекса.
2.1. Постановка задачи
2.2. Построение модели
2.2.1. Конструирование и анализ алгоритма оконного класса моделей
2.2.2. Конструирование булева класса моделей.
2.3. Целевая функция
2.4. Поиск оптимального комплекса.
2.4.1. Выбор эффективного алгоритма поиска.
2.4.2. Операторы создания и мутации
2.4.3. Оператор кроссовера.
2.5. Обобщнный класс моделей унификация знаний о сайтах и факторах
2.5.1. Общая структура.
2.5.2. Подкомплекс семантика и структура
2.5.3. Вес обобщнного комплекса.
2.5.4. Эффективная программная реализация математической модели обобщенного комплекса
2.5.5. Операторы создания, мутации и кроссовера в обобщнном классе
2.6. Обобщнная целевая функция.
2.6.1. Компоненты целевой функции
2.6.2. Ограничения обобщнной целевой функции
Глава 3. Взаимодействие с пользователем и оценка качества
3.1. Вычисление комплекса и вывод результата.
3.2. Методы оценки качества результата.
3.2.1. Мультизапуск проверка устойчивости поведения генетического алгоритма
3.2.2. Запуск с кластеризацией
3.2.3. Запуск с расщеплением выборки достоверность результата и переобучение .
3.3. Значимость компонентов подкомплекса.
Глава 4. Реализация и тестирование.
4.1. Реапизация СМЛ
4.2. Тестирование СМА
4.2.1. Тестирование на искусственных данных.
4.2.2. Тестирование на экспериментальных данных.
4.3. Система ЕхР1аш
Заключение.
Список литературы


В главе конструируется эта функция для всех классов моделей, введённых во второй главе, после чего приводится пример использования надёжности. Четвёртая глава посвящена реализации и тестированию. В ней приведена внутренняя структура СМА с точки зрения программирования: структура основных пакетов, краткое описание классов. В раздел 4. Результаты тестирования на искусственно сгенерированных промоторах, в которые были внедрены сайты определённых факторов и композиционных элементов, показали, что СМА успешно находит внедрённые факторы. Результаты тестирования на двух экспериментальных наборах данных, для которых правильный результат частично известен, показали, что комплекс, находимый СМА, хорошо согласуется с известными данными. Кроме того, описана система ЕхР1ат, которая также создавалась при участии автора. Она интегрирует пользовательские экспериментальные результаты с базами данных биологической информации и позволяет проводить различные типы анализа, преобразуя необходимым образом входные и выходные данные. В заключении описаны основные результаты работы, вклад автора в проделанную работу и идеи дальнейшего развития проекта. Для описания алгоритмов в тексте работы используется псевдокод. Мы не используем какой-либо реальный язык программирования, чтобы не отвлекаться в описании алгоритмов на формальности (к примеру, объявление переменных), а сосредоточиться на главном. Большинство конструкций псевдокода должны быть интуитивно понятны любому программисту. Алгоритм начинается с заголовка, состоящего из слова alg, названия алгоритма и набора параметров. Сам алгоритм и блоки операторов циклов заключены в операторные скобки begin. Конструкция if, циклы for и while, оператор преждевременного выхода из цикла break, оператор присваивания := подобны существующим в языке Pascal. Возвращаемое алгоритмом значение задаётся с помощью оператора return, как в языке Си. Помимо скалярных типов данных существуют списки, для которых определены операции вставки элемента и списка элементов того же типа (insert. Набор переменных, объединённый в круглые скобки, соответствует записи (record) в Pascal или структуре (struct) в Си. Для упрощения сама переменная-структура обычно не именуется, а обращение к полям производится, как к независимым переменным. Кроме того, существуют массивы. Под массивом понимается список элементов, доступ к которым осуществляется по ключу. Добавление элемента в массив выполняется через присваивание вида pt := 1; если элемента /? В программном коде такой массив может быть реализован как хэш, AVL-дерево или массив в общепринятом смысле (если ключи можно представить как последовательные целые числа). С символа # начинается комментарий, который обычно объясняет параметры алгоритма. Глава 1. Для удобства описания различных алгоритмов и методов анализа генной регуляции введём некоторые определения, а также вкратце опишем некоторые общепринятые биологические термины, по возможности не вдаваясь в детали. Нуклеотидом будем называть элемент алфавита 0 = {A,C,G,T}, биологически соответствующий одному из нуклеотидов последовательности ДНК: аденин, цитозин, гуанин или тимин. Здесь и далее нуклеотиды обозначаются прямыми латинскими прописными буквами в отличие от множеств и функций, обозначения которых выделены курсивом. В некоторых случаях алфавит нуклеотидов может быть расширен до 0' = Ou{N}; элемент N означает, что данный нуклеотид не был распознан в процессе секвенирования. Последовательностью нуклеотидов будем называть слово we Q'' в алфавите Q’; биологически оно соответствует какому-либо фрагменту генома. Как известно, молекула ДНК обычно состоит из двух цепей, связанных между собой. Они обозначаются символами (+) и (-), которые мы будем называть стрэндами (англ. ДНК). Зададим множество стрэндов, состоящее из двух элементов: 5/= {(+),(-)}. Геном мы будем называть подцепочку, с которой считывается (транскрибируется) рибонуклеиновая кислота, РНК, а затем формируется белок. Транскрипция — это первый этап формирования белка по информации, содержащейся в гене.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.212, запросов: 244