Модели и программная реализация распознавания русской речи на основе морфемного анализа

Модели и программная реализация распознавания русской речи на основе морфемного анализа

Автор: Карпов, Алексей Анатольевич

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Санкт-Петербург

Количество страниц: 132 с. ил.

Артикул: 3311376

Автор: Карпов, Алексей Анатольевич

Стоимость: 250 руб.

Модели и программная реализация распознавания русской речи на основе морфемного анализа  Модели и программная реализация распознавания русской речи на основе морфемного анализа 

СОДЕРЖАНИЕ
Введение.
Положения, выносимые на защиту.
Глава 1. Анализ требований и подходов к автоматическому распознаванию
1.1. Основные требования к современным системам распознавания речи
1.2. Базовые подходы к автоматическому распознаванию речи.
1.3. Распознавание речи на основе вероятностных моделей.
1.3.1. Признаковое описание речевого сигнала
1.3.2. Акустикофонетическое моделирование речи.
1.3.3. Статистическое моделирование языка предметной области
1.3.4. Метод распознавания слитной речи.
1.4. Обзор моделей распознавания русской речи.
Выводы по главе 1.
Глава 2. Модель обучения распознавателя русской речи с морфемным представлением языка
2.1. Особенности разработки модели распознавания русской речи.
2.2. Архитектура хмодели обучения с включением морфемного анализа русского языка
2.3. Подготовка текстовых и речевых баз данных модели обучения
2.4. Декомпозиция слов предметной области на морфемы
2.5. Создание и оценка морфемной модели языка.
2.6. Фонетическое транскрибирование обучающих текстов.
2.6.1. Выбор фонетического алфавита.
2.6.2. Фонетическое транскрибирование текста
2.7. Создание и обучение моделей акустикофонетических единиц речи
Выводы по главе 2.
Глава 3. Модель распознавания русской речи с морфемным уровнем обработки.
3.1. Выделение речи в звуковом сигнале методом анализа спектральной энтропии
3.1.1. Математическая основа метода.
3.1.2. Экспериментальная проверка метода
3.2. Выбор метода признакового описания речи
3.2.1. Спектральноразностные признаки речевого сигнала.
3.2.2. Оценка систем параметрического представления речи
3.3. Метод распознавания русской слитной речи с включением морфемной
обработки языка и речи
Выводы по главе 3.
Глава 4. Программная реализация модели распознавания русской речи
4.1. Архитектура программной реализации модели распознавания русской речи II.
4.2. Модель голосового доступа к электронному справочному каталогу
4.2.1. Описание модели голосового доступа к каталогу.
4.2.2. Сравнение моделей распознавания русской речи по точности распознавания.
4.2.3. Сравнение моделей распознавания русской речи по скорости обработки.
4.3. Модель бесконтактного управления компьютером
4.3.1. Архитектура модели
4.3.2. Модуль распознавания голосовых команд оператора.
4.3.3. Эксперименты с моделью бесконтактной работы с компьютером
Выводы по главе 4
Заключение
Литература


Таким образом, в результате проведенных автором исследований предложено решение актуальной проблемы повышения производительности модели автоматического распознавания русской речи с большим словарем, что способствует внедрению технологий автоматического распознавания русской речи в различные области человеко-машинного взаимодействия. В первой главе диссертации представлен анализ состояния дел в области автоматического распознавания речи в целом, а также сделан обзор существующих систем для русской речи, начиная с советских времен по настоящее время. Отмечается, что сейчас не существует готовых к использованию систем дикторонезависимого распознавания русской речи с большим словарем. Во второй главе приводится описание модели обучения распознавателя русской речи с применением морфемного представления словаря и модели языка. Это позволяет значительно сократить размер словаря языковых единиц и улучшить производительность модели. Получены результаты, показывающие преимущество слоговой и морфемной моделей языка перед целословной моделью. Третья глава описывает разработанную автором модель распознавания русской слитной речи с большим словарем с применением морфемного уровня обработки. Приведено описание и оценка предложенных методов параметрического спектрально-разностного представления речевого сигнала и выделения полезной речи методом анализа функции энтропии спектра звукового сигнала. Приводится результат сравнения целословной, морфемной, слоговой и фонемной моделей распознавания речи по двум основным критериям: точности и времени распознавания. В четвертой главе приводятся данные по реализации разработанных алгоритмов в экспериментально-исследовательских моделях, использующих слитный ввод русской речи. Модели обучения и распознавания русской речи, а также модули для записи речевых баз данных и оценки результатов распознавания объединены в единую программную реализацию дикторонезависимого распознавания русской слитной речи SIRIUS. Эта программная реализация использована для создания модели голосового доступа к рубрикатору электронного справочного каталога «Желтые страницы», а также модели бесконтактного управления компьютером, где вместо клавиатуры и мыши для управления компьютером используется голосовой ввод и движения головы оператора. Модель обучения распознавателя русской речи с морфемным представлением распознаваемого словаря и модели языка. Модель распознавания русской речи с морфемным уровнем обработки языка и речи. Программная реализация модели дикторонезависимого распознавания русской слитной речи с большим словарем. Глава 1. Процесс автоматического распознавания речи представляет собой преобразование акустического сигнала, полученного от микрофона, в последовательность слов, которая затем может использоваться для понимания смысла речевого высказывания. В первой главе диссертации приведен анализ основных требований, предъявляемых к системам распознавания речи, представлена базовая архитектура системы автоматического распознавания речи, опирающаяся на стохастические модели, а также сделан обзор существующих моделей распознавания русской речи. Задача распознавания речи характеризуется многими параметрами, в первую очередь, это свойства канала передачи речи, размер словаря, вариативность речи, уровень окружающего шума, тип ввода речи (изолированная/слитная) []. Для распознавания изолированных слов необходимо, чтобы диктор делал короткие паузы между словами, что замедляет ввод и ухудшает естественность, в то время как при вводе слитной речи этого не требуется. В отличие от печатного текста или от искусственных сигналов естественная речь не допускает простого и однозначного членения на элементы (фонемы, слова, фразы), поскольку эти элементы не имеют явных физических границ. Они вычленяются в сознании слушателя - носителя данного языка в результате сложного многоуровневого процесса распознавания и понимания речи []. Если попросить слушателя записать в виде фонем незнакомую иностранную речь, то он совершит множество ошибок членения слов и фраз, т.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 1.706, запросов: 244