Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов

Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов

Автор: Туркин, Виктор Николаевич

Год защиты: 1984

Место защиты: Москва

Количество страниц: 169 c. ил

Артикул: 4031056

Автор: Туркин, Виктор Николаевич

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Стоимость: 250 руб.

Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов  Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов 

Введение
ГЛАВА I. Системы распознавания речевых образов и их применение .
1.1. Системы распознавания изолированных речевых
команд
1.2. Системы автоматического распознавания слитной речи
1.3. Проблемы использования автоматического речевого ввода в системах диспетчерского управления .
1.3.1. Использование речевых интерфейсов в системах управления воздушным движением и бортовых системах самолетов
1.3.2. Использование речевого управления в диспетчерском тренажере
1.3.3. Применение систем автоматического речевого взаимодействия в системах оперативного диспетчерского управления энергосистемами .
Глава 2. Построение алгоритмов распознавания речевых образов на основе нелинейных методов сравнения
2.1. Постановка задачи распознавания дискретной речи
2.2. Алгоритм распознавания дискретной речи.
2.3. Сравнительная оценка объемов вычисления мер сходства методами ДП и ГС.
2.4. Построение алгоритма распознавания слитной речи с использованием метода градиентного спуска.
2.5. Построение алгоритмов обнаружения ключевых слов в потоке слитной речи.
2.6. Распознавание речевых образов с использованием ас
о
социативного кодирования признаков
Глава 3. Математическое обеспечение комплекса для исследо
вания и проектирования систем распознавания речевых образов. Результаты экспериментов.
3.1. Структура и математическое обеспечение комплекса для исследования и проектирования систем распознавания речи
3.1.1. Состав и функциональное назначение программных модулей комплекса
3.2. Экспериментальные исследования алгоритмов обработки речевых сигналов и вычисления мер сходства образов
3.2.1. Определение началаконца образов
3.2.2. Исследование влияния сглаживания признаков на надежность распознавания.
3.2.3. Исследование влияния компрессии речевых образов на надежность распознавания
3.2.4. Сравнение некоторых алгоритмов распознавания образов
3.2.5. Исследование различных вариантов нормировки признаков речевого сигнала .
3.2.6. Исследование влияния выбора метрики в пространстве признаков на надежность распознавания
3.2.7. Исследование влияния понижения размерности пространства признаков методом главных компонент на надежность распознавания.
3.2.8. Экспериментальное исследование алгоритмов распознавания с использованием ассоциативного кодирования
признаков . и
Глава 4. Практическая реализация систем распознавания речевых команд
4.1. Система распознавания дискретной речи .
4.2. Экспериментальная система распознавания слитной речи.
4.2.1. Распознавание трехзначных чисел
4.2.2. Распознавание языка диспетчера АС УВД
4.3. Экспериментальная система обнаружения ключевых
слов в слитном потоке речи.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ .
СПИСОК ЛИТЕРАТУРЫ


За последние несколько лет решение проблемы распознавания речевых образов существенно продвинулось вперед, как в области теоретических исследований, так и в практической реализации систем автоматического распознавания речи различного класса. Во всех промышленно развитых странах появились фирмы, специализирующиеся на разработке различных речевых устройств, кроме того практически все фирмы производители вычислительной техники также занимаются разработкой средств речевого взаимодействия с ЭВМ. Так по данным американского журнала 5ее. США существует более 0 фирм, производящих речевые системы. В свою очередь появилось и множество потребителей речевых устройств, начиная от производителей детских игрушек, способных воспринимать и синтезировать несколько речевых команд У , и кончая сложными системами военного назначения 8з . В нашей стране созданию систем автоматического распознавания и синтеза речи также уделяется большое внимание. ЭВМ 5го поколения необходимым условием является обеспечение возможности общения пользователей с вычислительной средой на ограниченном естественном языке. Несмотря на достигнутые успехи, решение проблемы распознавания речи далеко от желаемого идеала. До сих пор стоимость систем распознавания велика, а их возможности очень ограничены. Поэтому в настоящее время во всем мире продолжаются исследования в двух основных направлениях создании высокопроизводительных дешевых компонентов микропроцессоров и специализированных СБИС для обработки акустических сигналов и разработки более эффективных алгоритмов распознавания речевых образов, обеспечивающих создание систем распознавания с большим объемом словаря, слитной речи, а также неадаптивных систем распознавания, ориентированных на произвольного диктора. Рассмотрим основные принципы построения и алгоритмы, применяющиеся в настоящее время в системах автоматического распознавания речевых образов. При этом основное внимание будем уделять системам, в которых используются разные методы распознавания для иллюстрации различных подходов к построению систем различного класса. Что касается технических характеристик, технологической базы и стоимости коммерческих систем самого разного класса, то этим вопросам посвящены, например, обзоры , 8 , поэтому в настоящем обзоре этим вопросам будем уделять меньше внимания. Системы распознавания изолированных речевых команд можно классифицировать на два типа адаптивные системы, ориентированные на работу с диктором, на которого настроена система, и неадаптивные, работающие с произвольным диктором, не имеющим явных дефек
тов речи Первые можно разделить на два типа системы с объемом словаря доДООО слов и системы со словарем и более слов. В соответствии с указанным подразделением систем в основном отличаются и принципы их построения. При разработке систем распознавания речевых образов приходится решать две главные задачи выбор первичного описания речевых сигналов и разработка алгоритмов распознавания, обеспечивающих высокую надежность распознавания при минимальных вычислительных затратах. До настоящего времени нет общепризнанного метода обработки речевых сигналов для распознавания. Выбор первичного описания определяется в основном требованиями, предъявляемыми к конкретным системам и тлеющимися у разработчиков средствами. Тем не менее, можно выделить наиболее распространенные из них. Одним из наиболее простых методов, который можно реализовать как аппаратными, так и программными средствами, является измерение количества нулевых пересечений сигнала в различных полосах частот, или измерение длительностей интервалов между нулями сигнала. В работах 2, показано, что клишированная речь, в которой сохраняется только информация о параметрах пересечения нулей, сохраняет высокую разборчивость. Исходя из этого можно применять клиппирование речи на этапе предварительной обработки речевого сигнала. В работах , 8б дано теоретическое обоснование данного метода, а в з6, , приведены экспериментальные результаты, показывающие, что описание речевого сигнала параметрами пересечения нуля позволяет получить надежность распознавания не ниже, чем при описании спектральными параметрами.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.212, запросов: 244