+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Разработка алгоритмов для распознавания речи

  • Автор:

    У Вэньцань

  • Шифр специальности:

    01.04.13

  • Научная степень:

    Кандидатская

  • Год защиты:

    1999

  • Место защиты:

    Москва

  • Количество страниц:

    133 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы


СОДЕРЖАНИЕ

ВВЕДЕНИЕ
В.1. Общие замечания
В.2. Обзор развития распознавания речи
В.З. Цель и задачи диссертации
Г ЛАВА 1. Отделение крайних моментов изолированного слова
1.1. Общие сведения
1.2. Примеры проблем в определении крайних моментов слова
1.3. Алгоритм определения крайних точек слова
1.4. Результаты испытания
1.5. Выводы
Г ЛАВА 2. Анализ линейного предсказания
2.1. Постановка задачи
2.2. Принцип анализа линейного предсказания
2.3. Уравнения предсказания
2.4. Алгоритм Дарбина
2.5. Выбор порядка р и числа выборок фрейма N
2.6. Ке
2.7. Применение кепстра к распознаванию речи
2.8. Испытания
2.9. Выводы
ГЛАВА 3. Система распознавания изолированных слов на
основе трансформации временного масштаба
3.1. Постановка задачи
3.2. Общие сведения
3.3 Алгоритм трансформации временного масштаба
3.4. Метрика расстояния речевых образов
3.4.1. Евклидово расстояние

3.4.2. Взвешенное кепстральное расстояние
3.4.3. Метрики расстояния для коэффициентов ЛП
3.5. Две распознающих системы ТВМ
3.6 Результаты испытания
3.7 Выводы
ГЛАВА 4. Векторное квантование
4.1. Общие сведения
4.2. Основное положение ВК
4.3. Алгоритм 1ЛЮ
4.4. Два метода установки начальной кодовой книги
4.5 Результаты испытания
4.6. Выводы
ГЛАВА 5. Скрытая марковская модель
5.1. Общие сведения
5.2. Определение модели НММ
5.3. Оценивание параметров модели НММ
5.4. Вычисление Ру[а,А,В]
5.5. Оценка самой вероятной последовательности состояний
5.6. Типы модели НММ
5.7. Конкретные проблемы вычисления НММ
5.7.1. Масштабирование
5.7.2. Проблема начальных значений
5.7.3. Множественные последовательности наблюдений
5.8 Система распознавания речи на основе НММ
5.9. Выводы
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

ВВЕДЕНИЕ
В. 1. Общие замечания
Цель исследования по распознаванию речи состоит в понимании человеческого языка ЭВМ. Причем слово “понимание” имеет два значения. Первое - пословное преобразование устной речи в соответствующий письменный текст. Второе - правильная реакция на высказывание, содержащее в себе требование или справку диктора. Сочетанием распознавания речи с ее синтезом можно строить систему общения между человеком и машиной. Мотив интенсивного исследования по распознаванию речи в сферах промышленности, науки и обороны возник в связи с быстрым развитием информационной индустрии, охватывающей компьютеры, автоматизацию офиса, связь, оборону и робототехнику. Следующие примеры показывают некоторые применения распознавания речи.
• Фонетическая пишущая машинка: вместо клавиш используется голос для ввода письменного текста в компьютер и его распечатка на бумаге - давняя мечта человека. Это приведет офис к существенному обновлению и освободит типографских работников от трудоемкой работы.
• Связь: одна из ведущих коммуникационных компаний США и мира -фирма АТ&Т, длительно проводит интенсивное исследование распознавания речи, так как эту технику можно широко применить в области связи. Например, часто нужна идентификация кредитных карточек. Речь идет о том, что когда магазин получил карточку, для утверждения ему надо сообщать работнику банка номер карточки и денежную сумму. Работник банка, в свою очередь, вводит эти данные в компьютер и сообщает обратно магазину информацию, показанную

Рис. 1.9 Блок-схема алгоритма определения крайних точек слова.
тишины 2 и среднеквадратического отклонения утроенного числа переходов через нуль в течение тишины примем в качестве порога числа переходов через нуль. Обозначив порог через Т, получим:
Г„ = 2 + 3<ггЛ. (1.4)
Затем функция энергии Е(п) и функция Х(и) вычисляются для целого интервала сигнала. Пиковая энергия и энергия шума Ё используются для положения двух порогов Те1 и ТеИ, согласно правилу[49]:
Те1 = тіп(4 1,0.03 Е~Ё)+Ё)
те„ = *-те!
Алгоритм сначала применит правило энергии к поиску крайних точек. Рис. 1.10 показывает эту процедуру. Для начала слова поиск двигается по
Рис. 1.10 Иллюстрация поиска крайних фреймов слова по порогам энергии.

Рекомендуемые диссертации данного раздела

Время генерации: 0.096, запросов: 967