+
Действующая цена700 499 руб.
Товаров:26
На сумму: 12.974 руб.

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Автоматные методы распознавания речи

  • Автор:

    Мазуренко, Иван Леонидович

  • Шифр специальности:

    01.01.09

  • Научная степень:

    Кандидатская

  • Год защиты:

    2001

  • Место защиты:

    Москва

  • Количество страниц:

    119 с. : ил

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ФОРМАЛЬНАЯ МОДЕЛЬ РЕЧИ
1Л Речь как математический объект. Основные определения..
1.2 Дискретизация
1.3 Формализация задачи распознавания речи. Функция качества словаря команд
ГЛАВА 2. ДЕТЕРМИНИРОВАННЫЕ АВТОМАТНЫЕ МОДЕЛИ
2.1 Метод решения задачи локального распознавания речи
2.2 Модель распознавания последовательного кода команды с помощью детерминированных автоматов
2.3 Модель и алгоритм распознавания кода команды для случая классов звуков. Нижняя оценка качества словаря команд
ГЛАВА 3. ВЕРОЯТНОСТНЫЕ АВТОМАТНЫЕ МОДЕЛИ
3.1 Понятие монотонного автономного вероятностного автомата. Модель распознавания речи с помощью вероятностных автоматов
3.2 Метрика р! на множестве стохастических словарных функций
3.3 Метрика р2 на множестве стохастических словарных функций. Функция качества словаря команд
3.4 Метрика р3 на множестве стохастических словарных функций
3.5 Связь между метрикой и вероятностью
ПРИЛОЖЕНИЕ 1. ПРИМЕР АЛФАВИТА БУКВ И ЗВУКОВ, ПРАВИЛ
ТРАНСКРИБИРОВАНИЯ ДЛЯ РУССКОГО ЯЗЫКА

ПРИЛОЖЕНИЕ 2. ПРИМЕР ФОНЕМНЫХ КЛАССОВ ДЛЯ РУССКОГО ЯЗЫКА
ПРИЛОЖЕНИЕ 3. МЕТРИКА НА МНОЖЕСТВЕ ЗВУКОВ РУССКОГО ЯЗЫКА
ЛИТЕРАТУРА
ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

ВВЕДЕНИЕ
Образное восприятие - одно из свойств мозга, позволяющее правильно воспринимать информацию о внешнем мире. При этом происходит классификация воспринимаемых ощущений, т.е. разделение их на группы похожих образов. Образы обладают тем свойством, что ознакомление с некоторым конечным числом их реализаций дает возможность узнавать все остальные представители образа. Более того, разные люди, обучающиеся на различном материале наблюдений, одинаково распознают одни и те же объекты.
Процессу распознавания образов всегда предшествует процесс обучения, во время которого мы знакомимся с некоторым числом примеров, зная наперед об их принадлежности к каким-то образам. У человека процесс обучения заканчивается успешно. Следовательно, образы - это объективные характеристики внешнего мира, а не произвольные наборы изображений. Эту объективную характеристику образов и стремятся выявлять с помощью математических методов. Создаются аппаратные и программные распознающие системы, на вход которых подается информация о предъявляемых объектах, а на выходе отображается информация о классах, к которым отнесены распознаваемые объекты.
Две фундаментальные гипотезы, лежащие в основе работы большинства систем автоматического распознавания речи (АРР), заключаются в следующем ([1, 6]):
1) информация в речевом сигнале переносится в виде изменений во времени его амплитудного спектра
2) речь - это сложный иерархически организованный сигнал, так что более простые образы одного уровня однозначно определенными правилами объединены в более сложные образы следующего уровня (аллофоны, фонемы, дифоны, трифоны, слоги, слова, предложения и т.п.)

Описание речевого сигнала с помощью нормальной функции описания также будем называть нормальным.
Содержательно это означает, что нормальными мы будем называть функции описания, для которых по описанию речевого сигнала в данный момент времени однозначно восстанавливается звуковой сигнал на окне анализа.
Приведем пример функции описания звуковых сигналов, основанной на операторе преобразования Фурье.
Пример 1.1. В качестве примера функции описания возьмем отображение, сопоставляющее окну анализа вектор значений преобразования Фурье на равноотстоящих значениях частот '/м Ро, 2/м Р0)... м/м Р0: сГт = (Ф5('/м Ро), Ф5 (2/м Ро), ... ф* (% Ро)), где Р0>Ртах.
В §1.2 будет показано, что введенная таким образом функция описания для достаточно больших М является нормальной (утверждение 1.4).
Пусть в - некоторый речевой сигнал. Пусть <ф - описание этого речевого сигнала, т.е. функция зависимости М-разрядного вектора действительных чисел от времени. Рассмотрим все возможные произнесения всех фонем.
Определение 1.7. Образом ТХЪ) фонемы ЬєВ для данной функции описания ё будем называть множество Р(Ь)={сЦ1;) | эеЩЬ), іє^б),
1,(8)]} С М.“
Утверждение 1.1. Образы различных фонем для нормальной функции описания не пересекаются.
Доказательство.

Рекомендуемые диссертации данного раздела

Время генерации: 0.228, запросов: 1382