Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Топников, Артем Игоревич
05.12.04
Кандидатская
2012
Ярославль
135 с. : ил.
Стоимость:
499 руб.
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. АНАЛИТИЧЕСКИЙ ОБЗОР МЕТОДОВ АНАЛИЗА
И ОБРАБОТКИ ЗАШУМЛЕННЫХ РЕЧЕВЫХ СИГНАЛОВ
1.1. Задача повышения разборчивости и качества зашумленных
речевых сигналов
1.2. Речеобразование и особенности восприятия речи человеком
1.3. Методы подавления шума в речевых сигналах
1.4. Оценка качества речевых сигналов
1.4.1. Субъективные методы оценки качества
1.4.2. Объективные методы оценки качества
1.5. Оценка разборчивости речи
1.5.1. Методы субъективной оценки разборчивости
1.5.2. Методы объективной оценки разборчивости
1.6. Краткие выводы
ГЛАВА 2. СОЗДАНИЕ НЕЭТАЛОННОГО КРИТЕРИЯ
РАЗБОРЧИВОСТИ РЕЧЕВЫХ СИГНАЛОВ
2.1. Исследование необходимости масштабирования входного 49 сигнала
2.2. Поддиапазонная оценка разборчивости при помощи
модификации критерия SNR loss
2.2.1. Описание поддиапазонного критерия разборчивости
2.2.2. Построение профиля изменения разборчивости
2.2.3. Анализ работы метода шумоподавления на основе 55 поддиапазонной модификации критерия SNR loss
2.3. Создание неэталонного критерия разборчивости речи
2.4. Неэталонная поддиапазонная оценка разборчивости речевых
сигналов
2.5. Краткие выводы
ГЛАВА 3. РАЗРАБОТКА И АНАЛИЗ РАБОТЫ МЕТОДА
ШУМОПОДАВЛЕНИЯ
3.1. Описание предлагаемого метода шумоподавления
3.2. Выбор метрики в алгоритме к-средних
3.3. Верхняя граница улучшения качества и разборчивости
3.4. Исследование метода и сравнение его с другими
3.5. Метод постобработки в спектральной области
3.5.1. Описание предлагаемого метода постобработки
3.5.2. Анализ работы метода постобработки
3.6. Краткие выводы
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ 1. АКТЫ ВНЕДРЕНИЯ РЕЗУЛЬТАТОВ
РАБОТЫ
Введение
Актуальность темы
Речь - основной переносчик информации при естественном общении между людьми. Велика удельная доля речевой информации и в общем объеме информации, передаваемой радиотехническими системами. При распространении в воздушном пространстве, а также передаче по радиотехническим системам связи, речевые сигналы подвергаются искажениям. Сильные искажения способны не только ухудшить эстетическое качество воспринимаемых сигналов, но и привести к потере части информации, то есть снизить разборчивость. Существует значительное отличие между качеством и разборчивостью речевого сигнала, что приводит к необходимости отдельной оценки этих характеристик речевого сигнала.
В настоящее время известно множество методов подавления шума в речевых сигналах. Выбор конкретного метода связан с особенностями воздействующего на речевой сигнал шума, наиболее вероятного диапазона отношений сигнал/шум (ОСШ) и множеством другим факторов, включая аппаратную базу, используемую для реализации метода шумоподавления.
Вместе с тем, по-прежнему наблюдается потребность в создании новых и в усовершенствовании существующих методов шумоподавления. В частности, некоторые методы шумоподавления, улучшая качество зашумленного речевого сигнала, могут снижать его качество. Также для некоторых методов характерны артефакты типа "музыкальный шум", осложняющие восприятие информации, содержащейся в речевом сигнале. Другой важный вопрос, определяющий направление развития методов шумоподавления, - работа с сильно зашумленными речевыми сигналами при ОСШ ниже 0 дБ. В подобных случаях особо важным является повышение разборчивости.
С решением задачи повышения качества и разборчивости непосредственно связана необходимость в достоверных методах оценки этих
Evaluation of Speech Quality), предложенной в [77]. Предыдущая рекомендация основывалась на мере качества PSQM (Perceptual Speech Quality Measure).
Кратко рассмотрим метод PESQ. На первом этапе осуществляется выравнивание уровня и полосовая фильтрация чистого (эталонного) и оцениваемого сигналов. Затем сигналы выравниваются по времени, чтобы скомпенсировать временные задержки, а потом поступают на банк фильтров, моделирующий работу слуховой системы человека. Работа этих фильтров осуществляется в спектральной области. Получившиеся спектры эталонного и оцениваемого сигналов вычитаются друг из друга, таким образом вычисляется ошибка. В отличие от большинства методов оценки качества, которые не разделяют отрицательные и положительные ошибки, метод PESQ разделяет эти два вида ошибок, так как они по-разному влияют на ухудшения качества речевых сигналов. Положительное значение ошибки свидетельствует о дополнительной аддитивной составляющей, вызванной шумом, а отрицательное - о том, что спектральная составляющая была полностью или частично подавлена. Исходя из разного восприятия двух типов искажений, положительные и отрицательные ошибки учитываются с разными весами. Значения, характеризующие искажения в локальной частотно-временной области, усредняются по частоте и времени. На основании информации о положительных и отрицательных ошибках рассчитываются два коэффициента: симметричный и ассиметричный. На их основе вычисляется значение критерия качества PESQ:
PESQ = а() + а, dsym + а2 с1сщ,т,
где dsym - коэффициент симметричных искажений, dasym - коэффициент асимметричных искажений, а0= 4,5 , а, =-0,1 , а2 =-0,0309 . Значения критерия PESQ изменяются в пределах от -0,5 до 4,5. Стоит отметить, что данный критерий создавался, прежде всего, для оценки качества речи в IP-сетях и других телекоммуникационных системах, поэтому при его
Название работы | Автор | Дата защиты |
---|---|---|
Разработка системы распределения программ радиовещания на территории Российской Федерации на новом технологическом уровне | Ставиская, Рашель Моисеевна | 2008 |
Методы повышения быстродействия и точности стабилизации изображения в прикладных телевизионных камерах | Малашин, Дмитрий Олегович | 2014 |
Исследование и разработка универсального радиочастотного тракта приемника сотовой связи | Макаров, Евгений Валерьевич | 2010 |