Диссертация на тему "Разработка и исследование методов низкоскоростного кодирования речи на основе слуховых вейвлет", скачать бесплатно автореферат по специальности 05.12.13 - Системы, сети и устройства телекоммуникаций

ОГЛАВЛЕНИЕ

Условные обозначения (сокращения)

Введение

Глава 1 Общая характеристика цифровых систем передачи

речевых сообщений с повышенной эффективностью

1.1 Структурная схема цифровой системы передачи речи

1.2 Принцип речеобразования со слуховой обратной связью

1.3 Особенности слухового восприятия речи

1.4 Методы низкоскоростного кодирования речи

1.5 Выводы и постановка задач исследования

Глава 2 Модели и основные характеристики
периферии слуховой системы
2.1 Анализ радиотехнических моделей преобразования речи
на периферии слуховой системы
2.2 Аппроксимация нелинейных зависимостей
периферии слуховой системы
2.3 Математические модели преобразования речи
на периферии слуховой системы
2.4 Анализ пороговых зависимостей слышимости тона
при его маскировке стационарными шумами
2.5 Основные результаты
Глава 3 Методы представления речи в базисах
слуховых вейвлет и слуховых фильтров
3.1 Эффект обострения слухового восприятия звукового тона
и слуховые фильтры
3.2 Формирование слухового материнского вейвлета
3.3 Представление речи в базисе слуховых вейвлет
3.4 Представление речевого сигнала посредством
оптимального базиса слуховых фильтров
3.5 Основные результаты
Глава 4 Разработка новых методов эффективного кодирования речи в классе линейного предсказания с анализом через синтез
4.1 Метод ЛПАС кодирования речи с представлением сигнала погрешности предсказания в ортогональном базисе слуховых фильтров
4.2 Новая АР-АРСС модель линейного предсказания речи
4.3 Разработка метода оценки громкости речи
4.4 Модернизированный метод ЛПАС кодирования речи с повышенной эффективностью
4.5 Анализ эффективности ЛПАС кодеров
4.6 Основные результаты
Заключение
Список использованных источников

ДО АЪ
30 АЪ
>7 АС
ДЗ 1о

>8' Чч
,48'

>о а
,65* 63

>7 и
78 и
,84' $1
Я9 п

95Г НоН >1-2 фоЗ >13'
>16- щ

>20" '110 >28" <ЪЪ >38 АЪЦ->40 132 142 АН0

УСЛОВНЫЕ ОБОЗНАЧЕНИЯ (СОКРАЩЕНИЯ)
АДИКМ - Адаптивная дифференциальная ИКМ
АР-АР - Авторегрессия - авторегрессия
АР-АРСС - Авторегрессия - авторегрессия и скользящее среднее
АКК - Адаптивная кодовая книга
АЧХ - Амплитудно - частотная характеристика
АВЧХ - Амплитудно - высотно - частотная характеристика
БМ - Базилярная (основная) мембрана
БПФ - Быстрое преобразование Фурье
ВК - Волосковая клетка
ДЧИМ - Динамическая частотно-импульсная модуляция
ДВП - Дискретное вейвлет преобразование
ДФП - Долговременный фильтр предсказатель
ЗС - Звуковой сигнал
ИКМ - Импульсно-кодовая модуляция
КЛГ1 - Коэффициенты линейного предсказания
КФ - Корректирующий формантный фильтр
КФП - Кратковременный фильтр предсказатель
ЛПАС - Линейное предсказание с анализом через синтез
ОСШ - Отношение сигнал/шум
ОСКП - Относительная средне квадратичная погрешность
ОСИП - Отношение сигнал погрешность предсказания
PC - Речевой сигнал
СФ - Слуховой фильтр
СИ - Слуховой нерв
СМ В - Слуховой материнский вейвлет
СКК - Стохастическая кодовая книга
СПИ - Сигнал погрешности предсказания
СКП - Средне квадратичная погрешность
ТФОП - Телефонная сеть общего пользования
УЗД - Уровень звукового давления
ФНЧ - Фильтр нижних частот
ФЧХ - Фазо - частотная характеристика
ЦСПР - Цифровая система передачи речи
LLIM - Шум маскировки
CELP - Линейное предсказание с кодовым возбуждением
MOS - Оцешса среднего мнения экспертов
х - Скалярная величина
х - Вектор - столбец
х* - Транспонированный вектор
X - Матрица
ВВЕДЕНИЕ

Современный этап развития общества характеризуется увеличением потоков разнородной информации, передаваемой по телекоммуникационным системам и сетям. Значительный объем, порядка 90 %, этой информации составляет речевая информация [2]. В виду того, что речевые сигналы как носители речевой информации, обладают значительной избыточностью, существует проблема их компактного цифрового представления с целью снижения требований к пропускной способности телекоммуникационных каналов.
В различных странах мира, в том числе и в России, для решения проблемы перегрузки каналов речевой связи и устройств хранения речевых сообщений интенсивно развивается направление, заключающееся в сжатии объемов речевых данных за счет сокращения содержащейся в них избыточности. Это направление особенно привлекательно с экономической точки зрения, так как не требует создания новых дорогостоящих производственных мощностей, но предназначено для эффективного использования имеющихся ресурсов систем и сетей.
Для технического решения задачи сжатия речевых данных разработано много методов. В значительной мере они представлены в трудах H.H. Акин-фиева, С.П. Баронина, А.И. Величкина, М.Д. Венедиктова, В.И. Галунова, Е.Г. Жилякова, Ю.А. Косарева, В.И. Куля, В.Г. Михайлова, В.Е. Муравьева, М.В. Назарова, A.A. Пирогова, Ю.Н. Прохорова, В.Е. Санникова, М.А. Са-пожкова, В.А. Свириденко, И.В. Ситняковского, А.Н. Собакина, О.И. Шелу-хина, В.П. Яковлева, Б.С. Атала, Дж. Д. Гибсона, Б. Голда, А.Х. Грея, Н.С. Джайанта, Ф. Итакуры, Р.В. Кокса, П. Круна, Ж.И. Макхоула, Дж. Маркела, JI. Р. Рабинера, Ч. Рейдера, A.C. Спаниаса, Г. Фанта, Дж. Фланагана, Р.В. Шафера, М.Р. Шрёдера и других российских и зарубежных ученых.
С целью повышения качества кодеков с линейным предсказанием для передачи речевых сигналов на скоростях 4-16 (кбит/с) Международным

Работа этого класса кодеров основана на адаптивной обработке разности ек = хк -х1,к- 0,1,2
КФП моделирует кратковременную корреляцию (спектральную огибающую) в речевом сигнале и реализуется часто в виде трансверсального фильтра; его системная функция А (г) определяется через коэффициенты линейного предсказания (КПП) а = (а1,а2
ДФП моделирует долговременную корреляцию (точную структуру спектра) в речевом сигнале. Системная функция ДПФ, реализованного в виде трансверсального фильтра, равна
В процессе анализа речи значения параметров Ь~(Ь1,Ь2
(1.11)
где рА порядок фильтра, выбираемый от 8 до 16.
Системная функция КФП при синтезе речи определяется так
НА(г) = [1-А&]-
(1.12)

(1.13)

а при синтезе речи
НВЮ = [1-В(2)У
(1.14)

Название работы	Автор	Дата защиты
Разработка и исследование методов оценивания несущей частоты фазомодулированных сигналов в когерентных демодуляторах спутниковых систем связи	Брусин, Ефим Александрович	2007
Разработка метода оценки показателей производительности межсетевых экранов при функционировании в условиях приоритизации трафика	Мусатов, Владислав Константинович	2018
Модели и методы оценки вероятностно-временных характеристик коммерческих интеллектуальных телекоммуникационных систем	Беляева, Елена Владимировна	2002

Электронная библиотека диссертаций

Разработка и исследование методов низкоскоростного кодирования речи на основе слуховых вейвлет