Разработка адаптивного метода робастного понимания слитной речи на основе интегральной обработки данных

Разработка адаптивного метода робастного понимания слитной речи на основе интегральной обработки данных

Автор: Ронжин, Андрей Леонидович

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Санкт-Петербург

Количество страниц: 134 с. ил

Артикул: 2334437

Автор: Ронжин, Андрей Леонидович

Стоимость: 250 руб.

СОДЕРЖАНИЕ
Введение.
Положения, выносимые на защиту.
Глава 1. Анализ состояния проблемы автоматического понимания слитной речи
1.1. Основные проблемы речевого диалога.
Проблема адаптивности системы к пользователю, окружающей среде, предметной
области
Проблема слитной речи.
Проблема робастности процесса понимания речи. Последовательная и интегральная модели обработки данных.
1.2. Методы компенсации разнообразия голосов и акустической обстановки
1.3. Основные методы, используемые при распознавании слитной речи
1.4. Подходы к робастному пониманию речи
Выводы по главе 1.
Глава 2. Интегральная модель адаптации
2.1. Интегральная обработка данных в базовой модели понимания речи
2.2. Интегральный подход к проблеме адаптации.
2.3. Алгоритм интегральной адаптации в модели речевого управления.
2.4. Метод аллофонной адаптации модели к новому голосу и акустической
обстановке.
Выводы по главе 2.
Глава 3. Робастное распознавание слитной речи. Модификация базовой модели понимания речи.
3.1. Параметрическое представление речевого сигнала.
3.2. Робастный метод распознавания слитной речи.
Выявление гипотез слов с помощью скользящего ДПанализа.
Оценка гипотез фраз по акустическим и временным характеристикам
3.3. Тестирование и оптимизация алгоритма распознавания слитной речи
3.4. Обеспечение адаптивности, робастности и слитного ввода речи в
базовой модели понимания.
Выводы по главе 3
Глава 4. Практическое использование разработанных в диссертации алгоритмов.
4.1. Электронные словари . Функции голосового перевода и коррекции произношения
4.2. Система голосового управления роботом с использованием сети Интернет
4.3. Модель голосового управления подвижным объектом
Описание модели.
Описание диалогового окна модели
Настройка аудио канала
Ввод эталонов синтагм.
Режим распознавания синтагм.
Понимание фраз в стандартном режимеИЗ
Режим тестирования модели понимания без микрофона.
Модуль создания и корректировки ситуативной базы данных.
Выводы по главе 4.
Заключение
Литература


В рамках проекта «Голосовое управление роботом», выполняемого совместно с Мексиканским Университетом Universidad National Autonoma de Mexico (UNAM), была создана реальная модель голосового управления роботом через сеть Интернет на основе алгоритмов робастного понимания речи. По проекту МНТЦ №Р задача 4 создана модель голосового управления летательным объектом, а также разработанных методов, в том числе метода распознавания слитной речи, робастного к семантикосинтаксическим отклонениям. Исследования, отраженные в диссертации, поддержаны фантом СПбНЦ «Разработка методов автоматического перевода устной речи» в рамках программы на год, раздел «Комплексные междисциплинарные проекты», выполняемого совместно с Российским государственным педагогическим университетом им. А.И. Апробация результатов работы. Крым, Украина, ). Публикации. Основные результаты по материалам диссертационной работы опубликованы в 6 печатных работах. Структура и объем работы. Диссертация объемом 2 машинописных страницы, содержит введение, четыре главы и заключение, список литературы (1 наименований), таблиц, рисунков. Основные результаты. Предлагаемые в диссертации алгоритмы позволяют проектировать диалоговые системы понимания слитной речи. Предложен метод адаптации к голосу диктора и акустической обстановке, на основе замещения участков речи, соответствующих аллофонам. Процедура адаптации позволяет за короткое время оптимизировать акустические параметры системы так, чтобы более точно распознавать речевые сообщения конкретного пользователя, в конкретной акустической среде. Разработан алгоритм интегральной адаптации модели сквозного понимания речи, позволяющий реализовать взаимосвязанную настройку параметров системы на всех уровнях обработки речевого сообщения. Это делает систему гибкой по отношению к изменениям в задаче и условиям функционирования. Разработан алгоритм распознавания слитной речи, робастный к семантико-синтаксическим отклонениям, что позволяет обеспечить процессы понимания естественного языка и создавать системы человеко-машинной коммуникации с дружественным интерфейсом. Модернизирована базовая модель понимания СПИИРАН для того, чтобы обеспечить слитный ввод речи и интегральную адаптацию. В результате создана адаптивная модель робастного понимания слитной речи. В первой главе приводится анализ основных проблем речевого диалога и существующих подходов к их решению. В качестве основного средства достижения робастного понимания выбрана модель интегральной обработки данных, также обоснована необходимость ее сквозной адаптации к конкретной задаче. Во второй главе приводится суть интегральной обработки, применяемой в модели понимания речи, разработанной в группе речевой информатики СПИИРАН. Предложен метод интегральной адаптации, который основан на оперативной настройке всех уровней модели понимания речи, что обеспечивает гибкость модели понимания к конкретной прикладной задаче. В конце главы рассмотрен разработанный метод аллофонной адаптации к голосу, на основе замещения участков речи. Третья глава посвящена описанию разработанного робастного метода распознавания слитной речи, а также модификация базовой модели понимания в части слитного ввода и интегральной адаптации. В начале главы описан новый метод параметрического представления речевого сигнала, основанный на модификации автокорреляционных методов. Затем представлен метод распознавания слитной речи, основанный на апостериорной генерации гипотез фраз в противовес общепринятому априорному гипотезированию. Метод основан на многоальтернативном выборе гипотез слов с помошью скользящего анализа и «мягком» оценивании гипотез фраз по акустическим и временным параметрам. Partner. Кроме тот, автор благодарит Dr. Jesus Savage (Мексика) за предоставленную возможность участия в совместном проекте, результатом которого стало создание реальной модели голосового управления роботом. Разработка метода адаптации к голосу и акустической обстановке на основе замещения участков речи. Модификация базовой модели понимания СПИИРАН для возможности ввода слитной речи и интегральной адаптации.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.247, запросов: 244