Модели и алгоритмы обнаружения локальных закономерностей в задаче распознавания вторичной структуры белка

Модели и алгоритмы обнаружения локальных закономерностей в задаче распознавания вторичной структуры белка

Автор: Торшин, Иван Юрьевич

Шифр специальности: 05.13.17

Научная степень: Кандидатская

Год защиты: 2011

Место защиты: Москва

Количество страниц: 100 с. ил.

Артикул: 5379257

Автор: Торшин, Иван Юрьевич

Стоимость: 250 руб.

Модели и алгоритмы обнаружения локальных закономерностей в задаче распознавания вторичной структуры белка  Модели и алгоритмы обнаружения локальных закономерностей в задаче распознавания вторичной структуры белка 

ОГЛАВЛЕНИЕ
0. Введение. О задачах распознавания в биоинформатике
0.1. Тема и актуальность исследования
0.2. О задачах распознавания в биоинформатике, начальных
данных и их экспериментальных источниках
0.3. Краткое содержание работы по главам
Глава 1. Разрешимость, регулярность и локальность задачи
распознавания вторичной структуры белка
1.1. Исходные определения
1.2. Локальность
1.3. Условие существования локальных функций
1.4. Разрешимость задачи и монотонность условия разрешимости
1.5. 0тупиковость и тупиковость систем масок
Глава 2. Анализ информативности мотивов на основе
критерия локальной разрешимости
2.1. Критерий разрешимости на объектах и мсгасловах
2.2. Монотонность условия разрешимости и тупиковые системы мотивов
2.3. Эвристические оценки информативности мотивов
2.4. Информативность мотивов и условие разрешимости
2.5. Об оценках информативности и непротиворечивых множествах объектов
Глава 3. Об использовании критериев локальной
разрешимости и регулярности для исследования морфологии первичной структуры белка
3.1. Локальная регулярность на множествах мотивов
3.2. Тупиковые множеств мотивов, обеспечивающие локальную регулярность
Глава 4. Построение оптимальных Валфавитов как
инструмент исследования морфологии вторичной структуры
4.1. Об алфавитах для описания вторичной структуры белка
4.2. Сложность Валфавита и критерий локальной разрешимости
4.3. Принцип максимального покрытия ведущих позиций
Глава 5. Экспериментальное тестирование формализма
5.1. Формирование непротиворечивых множеств объектов
5.2. Комбинаторное тестирование критерия локальной разрешимости
5.3. Комбинаторное тестирование критерия локальной регулярности
5.4. Построение оптимальных Всловарей
5.5. Эмпирическая схема распознавания вторичной структуры
6. Заключение
7. Список литературы
0. Введение. О задачах распознавания в биоинформатике
0.1. Тема и актуальность исследования
Темой исследования является разработка методов анализа данных на основе комбинаторного тестирования алгебраических критериев разрешимости и регулярности и применение указанных методов для решения проблемы отбора информативных локальных закономерностей в задаче распознавания вторичной структуры белка.
Актуальность


Актуальность темы с позиции биоинформатики обусловлена накоплением огромных массивов разрозненных данных по структуре и функции биомакромолекул (белки, ДНК, РЖ) на фоне отсутствия математически обоснованных методов для установления закономерностей в разноуровневых описаниях исследуемых молекулярных систем. Приведем краткое введение в проблемную область. Рис. Уровни структуры белка и функция белка (на примере а-гемоглобина). Клетка - мельчайшая структурная единица организма, а белки -активные молекулярные образования, поддерживающие жизнь клетки. В современной биологии любой белок рассматривается с нескольких точек зрения (Рис. Шб); (2) как одномерная последовательность характерных локальных конфигураций («вторичная структура», 2Пб); (3) как трехмерный объект («атомная структура», «третичная структура», «четвертичная структура», «пространственная структура», представимая как набор декартовых координат атомов белка, ЗИб) и (4) как особый механизм, выполняющий определенную роль или т. Фб) []. В настоящее время основным постулатом биологии белка является утверждение о том, что первичная структура однозначно определяет вторичную и третичную структуры, а третичная структура определяет биологическую роль белка. Поэтому основной задачей теоретической биологии белка считается установление закономерностей, определяющих взаимосвязь первичной и третичной структуры. Как показал проведенный ранее экспертный анализ [-], для решения этой задачи целесообразно решить промежуточную задачу -установить взаимосвязь между первичным и вторичным уровнями структуры белка или решить задачу «распознавания вторичной структуры белка». В настоящей работе данная задача рассматривается как перевод последовательности символов из одного алфавита в другой (Рис. Актуальность задачи обусловлена значительным объемом данных по первичным структурам белков и на два-три порядка меньшим количеством экспериментальных данных о пространственной структуре. Рис. УШ-ТРЕЕКЭА. Сразу отметим, что особого внимания заслуживает локальность рассматриваемой задачи. Иначе говоря, в соответствии с гипотезой о локальности каждая литера в каждой позиции вторичной структуре определяется некоторой окрестностью в соответствующей позиции первичной структуры белка. Впервые комплекс задач о взаимосвязи различных аспектов структуры белка возник в середине х годов, когда были определены пространственные (3D) структуры некоторых белков. В целом, эти попытки не были до конца успешны,. Методы классической механики наиболее успешно используются как способ внесения малых коррекций в уже известную пространственную структуру белка (например, определенную в ходе рентгеноструктурного эксперимента, полученную при моделировании эффектов точечных мутаций аминокислотной последовательности и т. Подходы, построенные на физико-химических принципах, также не привели к созданию полностью аккуратных методик распознавания. GOR []). Хотя использованные принципы и адекватны с физикохимической точки зрения, средняя аккуратность такого рода методов не превышала %. Примечание. В качестве «аккуратности» в задаче распознавания вторичной структуры белка используется доля совпадений литер вторичной структуры (обозначается как «Q3totai» []). Некоторое увеличение аккуратности распознавания Q3totai произошло, когда для решения данной задачи стали использоваться такие методы машинного обучения как нейронные сети и машины опорных векторов [,,-]. В увеличении аккуратности также сыграло свою роль и то, что для обучения стали использовать не отдельные последовательности, а т. PSI-BLAST) []. В целом, типичный алгоритм распознавания вторичной структуры методами этого «второго поколения» выглядит следующим образом. Имеется обучающая выборка, состоящая из сравнительного небольшого числа (несколько сотен) пар первичной и вторичной структур. Для каждой аминокислотной последовательности находятся все «схожие» по каким-то критериям последовательности и строится «профиль». Затем профили аминокислотных последовательностей разбиваются на отрезки определённой длины ( аминокислотных позиций) и каждому отрезку ставится в соответствие одна литера алфавита вторичной структуры (иначе говоря, производится отнесение данного отрезка «аминокислотного профиля» к соответствующему классу вторичной структуры).

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.430, запросов: 244