Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть

Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть

Автор: Кисельман, Бронеслав Арнольдович

Шифр специальности: 05.13.17

Научная степень: Кандидатская

Год защиты: 2001

Место защиты: Нижний Новгород

Количество страниц: 185 с.

Артикул: 319425

Автор: Кисельман, Бронеслав Арнольдович

Стоимость: 250 руб.

Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть  Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть 

ГЛАВА 1 Обзор основных технологий и алгоритмов распознавания речи для голосового управления в телефонии. Общая схема голосового управления через телефонную сеть. Основные ограничения и требования к системе распознавания и постановка задачи ее создания. Вычисление акустических признаков речевых сигналов . Метод МГСС. Технология РЬР. Дополнительная обработка акустических признаков. Выделение границ слов. Алгоритмы распознавания. Скрытые марковские модели
1. Использование нейронных сетей для автоматического распознавания речи. Стратегия алгоритмического построения системы распознавания. Некоторые особенности слухового восприятия человека. Основные моменты слухового восприятия. Метод скользящего окна. Блоксхема алгоритма. Фильтрбанк. Пример расчета АП речевого сигнала на основе ВПГФБ. Вычисление акустических признаков во временной области. Синтез компенсационного фильтра. Компрессор представляет собой нелинейную нечетную функцию, которая может иметь одну из следующих двух форм. Это так называемый изакон р 5, используемый в странах Северной Америки.


Это, очевидно, происходит изза того, что даже самые современные алгоритмы не могут выделить из речевого сигнала дикторонезависимую информацию смысл сказанного, полностью отсеяв дикторозависимую информацию, выражающуюся прежде всего в акустической изменчивости речевого сигнала. В настоящее время большая часть разработчиков систем распознавания речи для телефонии стремится создавать дикторонезависимые распознаватели, которые, конечно, более удобны в использовании, чем дикторозависимые. Стиль речевого ввоа. Это понятие отражает то, как говорит диктор при общении с системой распознавания. Например, обычно в разговорах между собой люди говорят в разговорном или редуцированном стиле, когда многие слова и части слов произносятся нечетко, отдельные слова произносятся слитно, происходит редукция и изменение фонемного состава некоторых слов. При диалоге с системой распознавания пока возможен лишь полный стиль, когда слова произносятся более или менее четко в конце концов это непосредственно влияет на точность распознавания. Кроме этого речь диктора может быть дискретной. В системах распознавания речи для телефонии чаще всего используется дискретная речь изолированные слова, реже прерывистая в предложениях между словами специально делаются паузы. Размер словаря. Словарь системы распознавания включает в себя набор слов, находящихся в распоряжении диктора при его диалоге с системой. При управлении объектами через телефонную сеть используются системы распознавания с малым слов и большим 0 слов словарями.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.543, запросов: 244