Разработка и математическое моделирование алгоритмов обнаружения речевой активности на фоне интенсивных шумов

Разработка и математическое моделирование алгоритмов обнаружения речевой активности на фоне интенсивных шумов

Автор: Хвостов, Алексей Васильевич

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Ульяновск

Количество страниц: 129 с. ил.

Артикул: 4170552

Автор: Хвостов, Алексей Васильевич

Стоимость: 250 руб.

Разработка и математическое моделирование алгоритмов обнаружения речевой активности на фоне интенсивных шумов  Разработка и математическое моделирование алгоритмов обнаружения речевой активности на фоне интенсивных шумов 

ОГЛАВЛЕНИЕ
Список сокращений, принятых в диссертации.
ВВЕДЕНИЕ
ГЛАВА 1. ЗАДАЧА ОБНАРУЖЕНИЯ РЕЧЕВОЙ АКТИВНОСТИ И ОБЗОР МЕТОДОВ ЕЕ РЕШЕНИЯ.
1.1. Постановка задачи.
1.2. Речевой сигнал
1.2.1. Представление речевого сигнала дискретными отсчетами.
1.2.2. Механизм речеобразования.
1.2.3. Математические модели речевых сигналов.
1.3. Основные характеристики речевых сигналов
1.3.1. Общие сведения.
1.3.2. Кратковременная энергия и кратковременное среднее значение сигнала.
1.3.3. Кратковременная функция среднего числа переходов через нуль.
1.3.4. Кратковременный Фурьеанализ.
1.3.5. Кепстральный анализ
1.3.6. Кратковременный вейвлетанализ.
1.4. Известные подходы к решению задачи обнаружения разладки., процесса.
1.4.1. Общий вид оптимального решающего правила различения двух гипотез.
1.4.2. Известные одноканальные методы обнаружения речевой активности, не использующие вероятностные характеристики
1.4.3. Связь вероятности обнаружения с дисперсией ошибки оценки границ
1.4.4. Сравнительный анализ известных методовГ
1.5. Выводы
ГЛАВА 2. РАЗРАБОТКА И ИСПЫТАНИЕ АЛГОРИТМОВ ОБНАРУЖЕНИЯ РЕЧЕВОЙ АКТИВНОСТИ.
2.1. Комбинация одноканальных методов
2.2. Другие одноканальные алгоритмы
2.3. Двухканальные алгоритмы.
2.3.1. Метод, основанный на изменении оценок квазипериодов
2.3.2. Метод, основанный на изменении количества переходов через нуль
2.3.3. Методы, основанные на изменении кросскорреляции
2.3.4. Метод, основанный на вейвлетдекомпозиции
2.3.5. Метод, основанный на разложении Фурье
2.3.6. Методы, основанные на энергетических характеристиках.
2.3.7. Методы, основанные на интерполяции.
2.4. Сглаживание статистик.
2.5. Сравнительные испытания двухканальных методов.
2.6. Улучшение качества распознавания при переобнаружении границ эталонов.
2.7. Выводы.
ГЛАВА 3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМОВ ОБНАРУЖЕНИЯ РЕЧЕВОЙ АКТИВНОСТИ
3.1. Структура комплекса программ.
3.2. Описание программы анализа одноканальных методов.
3.3. Описание и возможности программы обнаружения речевых
команд и анализа двухканальных методов
3.4. Аппаратные требования для комплекса.
3.5. Выводы
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ


На реальном речевом материале показано, что вероятность правильного распознавания РК можно повысить не только за счет повышения точности определения границ РК, но и за счет согласования оценок границ эталонов и границ распознаваемой РК. Последнее достигается путем повторного применения процедуры обнаружения границ к искусственно зашумленным эталонам. Достоверность. Достоверность положений диссертации обеспечивается корректным использованием математических методов и подтверждается результатами статистических экспериментов на реальном речевом материале. Практическая значимость. Представленное описание алгоритмов дает разработчикам возможность их применения при проектировании систем, требующих обнаружения речевой активности в реальном времени, в частности, систем распознавания РК на фоне интенсивных шумов. Реализация работы. Результаты работы использованы в госбюджетных и хоздоговорных НИР Ульяновского государственного технического университета и в разработках Ульяновского конструкторского бюро приборостроения, что подтверждено актом внедрения. Апробация работы. Ульяновск, ); -й Международной конференции по исследовательским системам, информатике и кибернетике «1гйег8утр-» (Германия, Баден-бадеи, ); 4-й Международной конференции по проблемам прикладной математики и вычислениям «ИСАМС-» (Болгария, Пловдив, ); 8-й Международной научно-техн. РШЛ-8- «Распознавание образов и анализ изображений: новые информационные технологии» (Йошкар-Ола, ); -й научной сессии Российского научно-технического общества радиотехники, электроники и связи им. А.С. Полона, посвященной Дшо радио (Москва, ); 9-й Международной научно-техн. РЯ1А-9- «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, ) и на ежегодных конференциях профессорско-преподавательского состава Ульяновского государственного технического университета (- гг. Публикации. По теме диссертации опубликовано статей, 3 из них опубликованы в изданиях из перечня ВАК. Объем и структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы из 8 наименований и приложения. Общий объем 9 страниц. В первой главе делается краткий обзор сведений о РС, его основных характеристиках и математических моделях. Дается обзор известных методов обнаружения РС и их классификация по используемым признакам. Представлен сравнительный анализ этих методов на одинаковых РС. Во второй главе разрабатываются новые методы обнаружения границ РК и проводится их сравнительный анализ. В третьей главе представлена программная реализация предложенных алгоритмов. Алгоритмы реализованы в единой программе, способной обнаруживать РК в режиме реального времени, а также обрабатывать заранее подготовленные записи. Имеется возможность оценки эффективности методов обнаружения РА. В заключении подведены основные итоги работы. В приложении содержится акт внедрения результатов диссертационной работы, а также графики зависимости ошибок обнаружения от отношения сигнал/шум, типичные графики статистик используемых алгоритмов. ГЛАВА 1. Пусть х(^) - шумовой сигнал. В некоторый момент времени к нему добавляется РК 5(/). Команда может состоять из нескольких слов, разделенных кратковременными паузами. Требуется как можно точнее определить моменты времени начала и конца этой команды, то есть построить детектор РА. Такой детектор должен исследовать сигнал в каждой точке. При этом возможны две гипотезы: Я0 - отсутствие РК и Я, - наличие РК. Решение должно состоять в выборе одной из этих гипотез. При этом нужно свести к минимуму количество ложных тревог и пропусков РК. Эту задачу можно рассматривать как особый вид задачи обнаружения разладки, т. Речь предназначена для общения. Возможности речи с этой точки зрения можно характеризовать по-разному. Один из количественных подходов основан на теории информации, разработанной Шенноном [5]. В соответствии с этой теорией речь можно описать ее информационным содержанием или информацией. Другой способ описания речи заключается в представлении ее в виде сигнала, т.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.245, запросов: 244