Оптимизация библиотеки эталонов в задачах распознавания речевых команд

Оптимизация библиотеки эталонов в задачах распознавания речевых команд

Автор: Крашенинникова, Наталья Александровна

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Ульяновск

Количество страниц: 138 с. ил.

Артикул: 3374695

Автор: Крашенинникова, Наталья Александровна

Стоимость: 250 руб.

Оптимизация библиотеки эталонов в задачах распознавания речевых команд  Оптимизация библиотеки эталонов в задачах распознавания речевых команд 

Актуальность темы. В настоящее время большое распространение имеют различные информационноуправляющие системы. Эти системы особенно удобны, когда оператор может общаться с ними естественным для себя образом на родном языке с помощью речевых команд РК. Поэтому большое внимание исследователей уделяется созданию речевых информационноуправляющих систем РИУС. Такие системы особенно полезны на транспорте и производстве, когда требуется управлять исполнительными механизмами, получать информацию об их состоянии и окружающей обстановке и снизить нагрузку на оператора. Подобные системы должны функционировать в условиях интенсивных помех шума двигателя, ветра и т. Поэтому актуальны исследования в области распознавания РК на фоне сильных шумов. В настоящее время существуют системы распознавания РК, работоспособные при малых шумах, однако они не пригодны в шумной среде. В связи с этим распознавание РК на фоне интенсивных шумов является важной научнотехнической проблемой. В условиях сильных шумов обычно применяется дикторозависимое распознавание РК с использованием библиотеки эталонов речевых команд ЭРК, и, как показывают эксперименты, качество распознавания в существенной мере зависит от того, насколько удачно сформирована эта библиотека.


I , , 5й Всероссийской с участием стран СНГ научнопрактической конференции Современные проблемы создания и эксплуатации радиотехнических систем Ульяновск, 8й Международной
научнотехн. РША8 Распознавание образов и анализ изображений новые информационные технологии ЙошкарОла, й научной сессии Российского научнотехнического общества радиотехники, электроники и связи им. А.С. Попова, посвященной Дню радио Москва, и на конференции профессорскопреподавательского состава Ульяновского государственного университета в г. Публикации. По теме диссертации опубликовано 9 статей, одна статья опубликована в издании из перечня ВАК. Объем и структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы из 2 наименований и приложения. Общий объем 8 страниц. В первой главе приводятся краткие сведения о физиологии человеческого восприятия звуков речи и системы речеобразования. Дается обзор основных методов распознавания РК и некоторых известных систем распознавания РК на фоне интенсивных шумов. Описан алгоритм распознавания РК по их АКП, на примере которого апробируются разрабатываемые в диссертации алгоритмы. Исследована распознаваемость АКП фонем русского и английского языков. Проанализирована авторегрессионная модель вариативности РС, позволяющая имитировать варианты произнесения РК из одного е произнесения диктором. Предложено использование этой модели при обучении иностранным языкам. Проанализирована степень влияния состава библиотеки эталонов на качество распознавания РК. Во второй главе рассматриваются методы оптимизации словаря РК и библиотеки их эталонов с целью повышения качества работы РИУС. Дана математическая формулировка решаемых задач. Предложены критерии качества словаря РК и библиотеки их эталонов. Разработаны и исследованы алгоритмы формирования словаря и библиотеки. Алгоритмы реализованы программами на ПК с использованием языка программирования высокого уровня Vi i. Они могут быть применены к любому набору распознаваемых РК и при любом количестве их произнесений. В заключении подведены основные итоги работы. ГЛАВА 1. РЕЧЕВОЙ СИГНАЛ. В этой главе приводятся краткие сведения о физиологии человеческого восприятия звуков речи и системы речеобразования. Дается обзор основных методов распознавания РК и некоторых известных систем распознавания РК на фоне интенсивных шумов. Кратко описан алгоритм распознавания РК по их АКП, на примере которого апробируются разрабатываемые в диссертации алгоритмы. Исследована распознаваемость АКП фонем русского и английского языков. Проанализирована авторегрессионная модель вариативности РС, позволяющая имитировать варианты произнесения РК из одного е произнесения диктором. Предложено использование этой модели при обучении иностранным языкам. Проанализирована степень влияния состава библиотеки эталонов на качество распознавания РК. Система человеческого речеобразования является сложным комплексом органов, связанных с центральной нервной системой, и включает в себя дыхательную систему, голосовой и носовой тракт , ,,,. Голосовой тракт человека рис. Длина голосового тракта зависит от пола и возраста человека у взрослого мужчины примерно см. Площадь поперечного сечения голосового тракта в процессе речи изменяется в зависимости от положения губ, языка, челюстей и небной занавески. В голосовой щели происходит первичное преобразование воздушного потока, поступающего под давлением из легких. Звуковая волна формируется в зависимости от конфигурации и напряжения голосовых связок. Далее акустические свойства волны изменяются в голосовом и носовом трактах. Источником энергии для образования речи является дыхательная система, включающая в себя легкие, бронхи и трахею. Речь, таким образом, представляет собой акустическую волну, которая образуется при проталкивании воздуха из легких через голосовую щель, голосовой и носовой тракты. Носовой тракт начинается у небесной занавески и заканчивается ноздрями. При опущенной нбной занавеске носовая полость становится соединенной с голосовым трактом и участвует в образовании звуков речи. Рис. Схема речеобразующих органов человека.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.477, запросов: 244