Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора

Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора

Автор: Ахмад Хассан Мухаммад

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Владимир

Количество страниц: 157 с. ил.

Артикул: 4243735

Автор: Ахмад Хассан Мухаммад

Стоимость: 250 руб.

Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора  Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора 

СОДЕРЖАНИЕ
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР МЕТОДОВ И СИСТЕМ РАСПОЗНАВАНИЯ ДИКТОРА.
1.1. Классификация систем определения индивидуальности диктора но
голосу
1.1.1. Идентификация и верификация
1.1.2. Текстозависимое и текстонезависимое распознавание.
1.1.3. Автоматические и экспертные системы
1.2. Научная сторона проблемы
1.2.1. Различительные признаки.
1.2.1.1. Существенно индивидуальные особенности речи и голоса.
1.2.1.2. Индивидуальные характеристики, связанные со строением и функционированием речеобразующего аппарата.
1.2.1.3. Параметризация речевого сигнала
1.2.2. Способы описания речевого сообщения в целом.
1.2.2.1. Динамическое искажение времени.
1.2.2.2. Использование векторного квантования.
1.2.3. Проблема эталона и его обновление.
1.2.4. Решающие правила
1.2.5. Шумы, помехи, искажения.
1.3. Критерии эффективности систем распознавания.
1.4. Применение систем распознавания говорящего в промышленности.
1.5. Обзор современных программных продуктов распознавания.
1.5.1. Зарубежные программы, организации, достижения
1.5.2. Состояние дел в России.
1.6. Основные проблемы создания систем распознавания диктора
1.7. Выводы к главе 1.
ГЛАВА 2. МЕТОДЫ ПОСТРОЕНИЯ ПРИЗНАКОВЫХ ОПИСАНИЙ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ГОВОРЯЩЕГО
2.1. Ввод речи и ее цифровое представление
2.2. Предварительная обработка и выделение первичных признаков
2.2.1. Дискретное преобразование Фурье
2.2.2. Цифровые фильтры.
2.2.3. Использование оконных функций
2.3. Нормализация уровня сигнала
2.4. Выделение границ фразы в речевом сигнале.
2.5. Определение высоты тона частоты основного тома.
2.6. Методы получения признакового описания сигнала.
2.6.1. Спектральные методы
2.6.2. Коэффициенты линейного предсказания
2.6.3. Кепстральное описание
2.7. Выделение наиболее информативных характеристик.
2.7.1. Последовательный прямой поиск
2.7.2. Последовательный обратный поиск
2.8. Выводы к главе 2.
ГЛАВА 3. ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ГОВОРЯЩЕГО.
3.1. Системы распознавания дикторов, основанные на сопоставлении с эталонами
3.2. Мера сходства речевого сигнала с эталоном
3.2.1. Статистический подход
3.2.2. Меры сходства.
3.3. Линейное выравнивание времени
3.4. Алгоритм динамического искажения времени ДИВ.
3.4.1. Описание алгоритма ДИВ
3.4.2. Симметричный алгоритм ДИВ.
3.4.3. Алгоритм поиска глобального наименьшего маршрута
3.4.4. Асимметричный алгоритм ДИВ
3.4.5. Система идентификации диктора с использованием
алгоритма ДИВ
3.5. Векторное квантование и построение кодовой книги при решении задач идентификации.
3.5.1. Меры искажения
3.5.2. Алгоритмы построения эталона
3.5.3. Идентификация но кодовой книге
3.5.4. Система идентификации диктора с использованием весовых
коэффициентов и кодовой книги.
3.6. Выводы к главе 3.
ГЛАВА 4. ЭКС1ЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ.
4.1. Цели и задачи экспериментов
4.2. Исследования методов признаковых описаний речевых сигналов в задачах распознавания.
4.2.1. Выбор речевых характеристик
4.2.2. Измерение частоты основного тона
4.2.3. Выделение наиболее информативных характеристик
4.3. Исследование свойств алгоритма динамического искажения времени
4.3.1. Выбор метрики расстояния
4.3.2. Исследование влияния параметра степени искажения ДИВ
на качество идентификации
4.3.3. Исследование методов параметризации речевых сигналов на
основе алгоритма ДИВ.
4.4. Результаты исследования идентификации дикторов на основе
использования векторного квантования
4.4.1. Исследование зависимости времени работы алгоритмов
идентификации и построения кодовой книги от ее размера
4.5. Сравнительные результаты тестирования систем идентификации дикторов.
4.6. Выводы к главе 4
ГЛАВА 5. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ РЕАЛИЗАЦИИ РАЗРАБОТАННЫХ МОДЕЛЕЙ СИСТЕМ ИДЕНТИФИКАЦИИ
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


В диссертационной работе используется аппарат цифровой обработки речевых сигналов преобразование Фурье, Линейное предсказание, векторное квантование, Ме1кепстральное описание, теории распознавания образов, теории построения математических моделей и пакет прикладных программ МАТЬАВ. Научная новизна. Новизной диссертационной работы является разработанные и модифицированные алгоритмы определения параметров речевого сигнала, а также разработанные модели систем распознавания дикторов, базирующихся на основе метода динамического искажения времени ДИВ и векторного квантования ВК с созданием кодовых книг голоса диктора. Модель системы распознавания дикторов на основе ДИВ. Модель системы распознавания дикторов на основе ВК с созданием кодовых книг голоса диктора. Модифицированный алгоритм векторного квантования Ллойда для текстонезависимого распознавания диктора, позволяющий существенно улучшить качество кодовых книг базы эталонов. Разработанная методика определения границ фраз при обработке речевого сигнала, позволяющая сократить время распознавания. Модифицированный алгоритм определения высоты тона в речевом сигнале, основанный на вычисление произведения гармоник спектра и снижении частоты дискретизации. Разработан алгоритм выбора наиболее информативных признаковых характеристик речевого сигнала. Разработанные и модифицированные конкретные алгоритмы положены в основу создания систем распознавания дикторов. Разработан пакет программного обеспечения для распознавания дикторов на основе исследованных и разработанных алгоритмов и моделей систем, который может быть полезным инструментом в учебном процессе по направлению Обработка и распознавания речевых сигналов. Показана возможность применения приложенных в работе алгоритмов в основу разработки коммерческих систем распознавания
диктора и платформ управления бытовой техникой и промышленным оборудованием с помощью голоса. Л также, в разработке систем оперативного контроля и управления объектами диспетчеризации с использованием голосовой информации. Проведено сравнительное экспериментальное исследование разработанных в диссертации моделей систем распознавания, позволившее выбрать наиболее эффективные модели построения систем распознавания диктора. Внедрение результатов работы. Цифровая обработка сигналов для студентов специальностей ВлГУ см. А также, приняты к использованию в проектноконструкторской деятельности предприятия ООО КОНТЭЛ г. Владимира см. Апробация работы. Международная научная конференция Математические методы в технике и технологиях ММТТ, Ярославль, РФ, г. Между народная конференция Распознавание образов и анализ изображений новые информационные технологии РОАИ8, ЙошкарОла, РФ, г. Вестник Тамбовского государственного технического университета, Тамбов, РФ, гг. Издательство ВлГУ, г. ВлГУ. Публикации. ВлГУ. Объем диссертации. Диссертация состоит из введения, пяти глав и заключения, изложенных на 0 страницах и иллюстрированных рисунками и 8 таблицами, а также списка литературы из наименований и приложений. ГЛАВА 1. В главе рассматривается классификация систем определения индивидуальности диктора по голосу, в том числе текстозависимые и текстонезвисимые системы распознавания диктора. Выбор параметров речевого сигнала, является самым важным этапом при построении систем распознавания диктора. Рассматриваются способы описания речевого сообщения в целом, а также основные подходы к построению систем принятия решений при распознавании диктора, такие как динамическое искажение времени i i i и векторное квантование. Рассматриваются основные направления применения систем распознавания диктора и проблемы создания таких систем. Системы определения индивидуальности диктора по речевым характеристикам развиваютсяв последнее время очень активно. Интерес к решению прикладных задач в этом направлении вполне понятен. Проверка прав доступа к различным информационным системам, как каналы связи, вычислительные системы, базы данных, банковские счета, служебные и индивидуальные помещения ограниченного пользования секретность, материальные ценности и т.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.268, запросов: 244