Разработка методики использования широких фонетических категорий в задачах верификации диктора

Разработка методики использования широких фонетических категорий в задачах верификации диктора

Автор: Милошенко, Алексей Анатольевич

Шифр специальности: 05.13.17

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Москва

Количество страниц: 94 с. ил.

Артикул: 4876339

Автор: Милошенко, Алексей Анатольевич

Стоимость: 250 руб.

Разработка методики использования широких фонетических категорий в задачах верификации диктора  Разработка методики использования широких фонетических категорий в задачах верификации диктора 

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ РАСПОЗНАВАНИЯ ДИКТОРОВ.
1.1 Информативные параметры речевого сообщения.
1.1.1 Акустические признаки
1.1.2 Лингвистические признаки.
1.2 модель .
1.3 V модель.
1.3.1 Нелинейная V модель.
1.3.2 Многоклассовый классификатор.
1.3.3 Двоичное кодирование.
1.3.4 Каэгсдый против всех. Л..
1.3.3 Каждый против каждого
1.3.6 Алгоритм голосования x i..и..л.и,
1.3.7 Направленный нециклический граф принятия решения ii i i .
1.4 Распознавание с использованием искусственных нейронных сетей
1.5 СММ модель
1.6 Метод векторного квантования .
1.6.1 Алгоритм Ллойда алгоритм Ксредних.
1.6.2 Алгоритм i, , .
1.7 Тестовое распознавание
1.8 Метод текстонезависимой системы идентификации на основе индивидуальности произношения гласных звуков.
1.9 Выводы по главе
ГЛАВА 2. МЕТОДИКА ИСПОЛЬЗОВАНИЯ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ В ЗАДАЧАХ ВЕРИФИКАЦИИ ДИКТОРА
2.1 Широкие фонетические категории
2.2 Модель математической интерпретации математической интерпретации лингвистических признаков в задачах верификации диктора
2.3 Методика использования широких фонетических категорий в
задачах распознавания диктора
2.5 Выводы по главе
ГЛАВА 3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ МОДЕЛИ РАСПОЗНАВАНИЯ ДИКТОРА НА ОСНОВЕ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ.
3.1 Описание эксперимента
3.2 Построении модели распознавания диктора на основе
ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ.
3.2.1 ЬУО, сеть
3.2.2 Многослойный персептрон
3.3 Оценка качес тва работы сети в зависимости от выбранного правила обучения на реализациях тестовой фразы.
3.4 Оценка репрезентативности полученных результатов.
3.5 Влияние шума на качество распознавания диктора.
3.5.1 Влияние коричневого шума.
3.5.2 Влияние белого шума
3.6 Выводы ПО ГЛАВЕ
ЗАКЛЮЧЕНИЕ.
СПИСОК ЛИТЕРАТУРЫ


Это касается и вопросов пограничного контроля, криминалистической экспертизы, контроля и управления банковскими операциями, контроля доступа к охраняемым объектам * и информационным системам, обслуживания и регистрации пассажиров, проведения оперативно-розыскных мероприятий. Верификация речи диктора, являясь одной из разновидностей задачи распознавания устной речи, используется в системах контроля доступа. В общем случае, распознавание речи может состоять из нескольких задач: распознавание текста, ' . Все они относятся к статистической теории распознавания образов [; ; ; ] и^ могут быть решены с помощью соответствующего математического аппарата. Однако стоит отметить, что в системах распознавания речи* нашли применение и такие модели, как: модель гауссовых смесей (вММ модель); модель опорных векторов (БУМ модель), распознавание с использованием искусственных нейронных сетей, скрытая Марковская модель (НММ модель), метод векторного квантования, тестовое распознавание (на основе аппарата логических тестов), метод нечеткою сопоставления образов, 'метод, текстонезависимой системы идентификации диктора, на основе-индивидуальности произношения гласных звуков и др. Все перечисленные модели используют в. Возможности систем распознавания с использованием акустических параметров достигли своего предела. Признаки, отражающие индивидуальные особенности речевой активности, обусловленные работой центральной нервной системы человека - называют лингвистическими Трудность их использования в задачах распознавания заключается в том, что они характеризуются значительной вариативностью, и множества значений для различных дикторов имеют существенное пересечение. Возможности систем распознавания с использованием физических параметров достигли своего предела [], и дальнейшее их усовершенствование представляется в совместном использовании лингвистических и спектрально-временных признаков. Рассматривая речевое сообщение как последовательность сменяющихся звуков и пауз можно определить понятие широких фонетических категорий. В отечественной и зарубежной литературе выделяют следующие категории: гласные, носовые (назальные), плавные, шипящие, аффрикаты, взрывные, паузы [; ]. Таким образом, использование широких фонетических категорий, в частности изменение во времени признака тон/шум, а также пауз речевого сообщения, для задач распознавания диктора является актуальным. Цель работы заключается в разработке методики использования широких фонетических категорий речевого сообщения (распределения признаков тон/шум и пауз на фрагментах речи) в задачах верификации диктора. Задачи исследования. Обобщение и оценка результатов исследований по проблеме верификации диктора с использованием широких фонетических категорий. Объект исследовании. Предмет исследования. Принципы, способы, методы, модели, алгоритмы, методики распознавания речи дикторов. Исходная основа диссертации. IO. JI. Барабаша, . Н. Вапника, К. Фукунаги, A. JI. Горелика. В.М. Величко, Т. К. Винцюка, Н. Г Загоруйко, Г. С. Слуцкера, A. A. Пирогова, М. А. Сапожкова, , Г. Е. Кедровой, Л. А. Чистовича , Ю. А. Косарева, В. Н. Сорокина, В. A.B. Аграновского, В. П. Бондаренко, A. A. Харламова , Р. B.Я. Чучупала, В. Н. Сорокина, П. А. Скрелина, В. Б.М. Лобанова, Н. К. Обжеляиа, В. Н. Трунина-Донского, Г С. Рамишвили, Л. Р. Рабинера, Г. М. Фанта, Р. В. Шафера, Р. Якобсона, Г. Г.Р. Доддингтона, С. Фуруи, Л. Фланагана, Г. В. Горелова, А. Ф. Фомина, Л. А. Баранова, И. А. Шалимова. Методы исследования. Предложена математическая интерпретация идентификационной информативности лингвистических признаков посредством последовательности изменяющихся во времени акустических параметров речи диктора. На основе результатов исследования существующих моделей и методов распознавания дикторов, разработана модель математической интерпретации лингвистических признаков в задачах верификации диктора. Создана методика использования широких фонетических категорий в задачах верификации диктора. Получена экспериментальная оценка надежности распознавания диктора, с использованием разработанных модели и методики.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.204, запросов: 244