Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Крашенинникова, Наталья Александровна
05.13.18
Кандидатская
2007
Ульяновск
138 с. : ил.
Стоимость:
250 руб.
Актуальность темы. В настоящее время большое распространение имеют различные информационноуправляющие системы. Эти системы особенно удобны, когда оператор может общаться с ними естественным для себя образом на родном языке с помощью речевых команд РК. Поэтому большое внимание исследователей уделяется созданию речевых информационноуправляющих систем РИУС. Такие системы особенно полезны на транспорте и производстве, когда требуется управлять исполнительными механизмами, получать информацию об их состоянии и окружающей обстановке и снизить нагрузку на оператора. Подобные системы должны функционировать в условиях интенсивных помех шума двигателя, ветра и т. Поэтому актуальны исследования в области распознавания РК на фоне сильных шумов. В настоящее время существуют системы распознавания РК, работоспособные при малых шумах, однако они не пригодны в шумной среде. В связи с этим распознавание РК на фоне интенсивных шумов является важной научнотехнической проблемой. В условиях сильных шумов обычно применяется дикторозависимое распознавание РК с использованием библиотеки эталонов речевых команд ЭРК, и, как показывают эксперименты, качество распознавания в существенной мере зависит от того, насколько удачно сформирована эта библиотека.
I , , 5й Всероссийской с участием стран СНГ научнопрактической конференции Современные проблемы создания и эксплуатации радиотехнических систем Ульяновск, 8й Международной
научнотехн. РША8 Распознавание образов и анализ изображений новые информационные технологии ЙошкарОла, й научной сессии Российского научнотехнического общества радиотехники, электроники и связи им. А.С. Попова, посвященной Дню радио Москва, и на конференции профессорскопреподавательского состава Ульяновского государственного университета в г. Публикации. По теме диссертации опубликовано 9 статей, одна статья опубликована в издании из перечня ВАК. Объем и структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы из 2 наименований и приложения. Общий объем 8 страниц. В первой главе приводятся краткие сведения о физиологии человеческого восприятия звуков речи и системы речеобразования. Дается обзор основных методов распознавания РК и некоторых известных систем распознавания РК на фоне интенсивных шумов. Описан алгоритм распознавания РК по их АКП, на примере которого апробируются разрабатываемые в диссертации алгоритмы. Исследована распознаваемость АКП фонем русского и английского языков. Проанализирована авторегрессионная модель вариативности РС, позволяющая имитировать варианты произнесения РК из одного е произнесения диктором. Предложено использование этой модели при обучении иностранным языкам. Проанализирована степень влияния состава библиотеки эталонов на качество распознавания РК. Во второй главе рассматриваются методы оптимизации словаря РК и библиотеки их эталонов с целью повышения качества работы РИУС. Дана математическая формулировка решаемых задач. Предложены критерии качества словаря РК и библиотеки их эталонов. Разработаны и исследованы алгоритмы формирования словаря и библиотеки. Алгоритмы реализованы программами на ПК с использованием языка программирования высокого уровня Vi i. Они могут быть применены к любому набору распознаваемых РК и при любом количестве их произнесений. В заключении подведены основные итоги работы. ГЛАВА 1. РЕЧЕВОЙ СИГНАЛ. В этой главе приводятся краткие сведения о физиологии человеческого восприятия звуков речи и системы речеобразования. Дается обзор основных методов распознавания РК и некоторых известных систем распознавания РК на фоне интенсивных шумов. Кратко описан алгоритм распознавания РК по их АКП, на примере которого апробируются разрабатываемые в диссертации алгоритмы. Исследована распознаваемость АКП фонем русского и английского языков. Проанализирована авторегрессионная модель вариативности РС, позволяющая имитировать варианты произнесения РК из одного е произнесения диктором. Предложено использование этой модели при обучении иностранным языкам. Проанализирована степень влияния состава библиотеки эталонов на качество распознавания РК. Система человеческого речеобразования является сложным комплексом органов, связанных с центральной нервной системой, и включает в себя дыхательную систему, голосовой и носовой тракт , ,,,. Голосовой тракт человека рис. Длина голосового тракта зависит от пола и возраста человека у взрослого мужчины примерно см. Площадь поперечного сечения голосового тракта в процессе речи изменяется в зависимости от положения губ, языка, челюстей и небной занавески. В голосовой щели происходит первичное преобразование воздушного потока, поступающего под давлением из легких. Звуковая волна формируется в зависимости от конфигурации и напряжения голосовых связок. Далее акустические свойства волны изменяются в голосовом и носовом трактах. Источником энергии для образования речи является дыхательная система, включающая в себя легкие, бронхи и трахею. Речь, таким образом, представляет собой акустическую волну, которая образуется при проталкивании воздуха из легких через голосовую щель, голосовой и носовой тракты. Носовой тракт начинается у небесной занавески и заканчивается ноздрями. При опущенной нбной занавеске носовая полость становится соединенной с голосовым трактом и участвует в образовании звуков речи. Рис. Схема речеобразующих органов человека.
| Название работы | Автор | Дата защиты |
|---|---|---|
| Математические модели пологих оболочек ступенчато-переменной толщины с учетом поперечных сдвигов при конечных прогибах | Филиппов, Денис Сергеевич | 2000 |
| Модифицированные методы двойственности для решения вариационных и квазивариационных неравенств механики | Цой, Георгий Ильич | 2019 |
| Алгоритмы и комплекс программ построения математической модели компоновки промышленных объектов | Шаронин, Кирилл Анатольевич | 2014 |