Диссертация на тему "Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств", скачать бесплатно автореферат по специальности 05.13.17

ГЛАВА 1. АНАЛИЗ СИСТЕМ КОДИРОВАНИЯ РЕЧИ И ФОРМУЛИРОВКА ПРОБЛЕМЫ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ПАРАМЕТРИЧЕСКОГО КОДИРОВАНИЯ
1.1. Методы кодирование речевого сигнала
1.2. Кодирование формы волны речевого сигнала
1.3. Кодирование речи в гибридных кодерах
1.3.1. Рекомендация ITU-T G.723 (MP-MLQ)
1.3.2. Рекомендация ITU-T G.728 (Long-Delay CELP)
1.3.3. Рекомендация ITU-T G.729 (CS-ACELP)
1.3.4. Алгоритмы кодирования с частотным разбиением (SBC,АТС)
1.3.5. Алгоритм кодирования с многополосным возбуждением (МВБ,
IMBE, AMBE)
1.4. Принципы передачи речи с переменной скоростью
1.4.1. Кодирование речи с переменной скоростью на основе фонетической классификации
1.4.2. Кодирование речи с переменной скоростью на основе энергетической классификации
1.4.3. Кодирование речи с переменной скоростью, обеспечивающее постоянное качество синтезируемой речи
1.5. Речеэлементное кодирование
1.6. Выводы по главе, формулировка и декомпозиция проблемы повышения эффективности параметрического кодирования речи
ГЛАВА 2. ПОСТРОЕНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ЭФФЕКТИВНОГО КОДИРОВАНИЯ РЕЧИ
2.1. Описание обобщенной модели параметрического кодирования
речи
2.2. Построение сегментно-аппроксимационной модели параметрического кодирования речи и формулировка критериев эффективности
2.2.1. Критерий точности аппроксимации

2.2.2. Оценка минимальной скорости передачи в сегментно-аппроксимационной модели кодирования
2.2.3. Достоинства и недостатки сегментно-аппроксимационной
модели кодирования
2.3. Математическое определение модели параметрического кодирования речи на основе теоретико-информационного подхода
2.3.1. Критерий точности аппроксимации
2.3.2. Оценка минимальной скорости передачи в сегментнотрансформационной модели кодирования
2.4. Выводы по главе
ГЛАВА 3. РАЗРАБОТКА АВТОМАТИЧЕСКОЙ СИСТЕМЫ ОЦЕНКИ КАЧЕСТВА СИНТЕЗИРОВАННОЙ РЕЧИ
3.1. Анализ проблемы автоматического оценивания качества телефонных передач
3.2. Применение математического аппарата нейронных сетей для автоматической оценки качества синтезированной речи
3.2.1. Анализ нейросетевых технологий
3.2.2. Применение нейронных LVQ-сетей для автоматической оценки качества синтезированной речи
3.2.3. Формирование обучающих сигналов для принятия решения об оценке качества речевого сигнала
3.2.4. Реализация системы автоматической оценки качества синтезированной речи
3.3. Выводы по главе
ГЛАВА 4. РАЗРАБОТКА ПРИНЦИПОВ КОДИРОВАНИЯ, ИСПОЛЬЗУЮЩИХ КОРРЕЛЯЦИОННЫЕ СВОЙСТВА КВАЗИПЕРИОДИЧЕСКОЙ СТРУКТУРЫ РЕЧИ
4.1. Анализ квазипериодических свойств речевых сигналов на вокализованных сегментах и формулировка метода параметрического компандирования речи на базе сегментнотрансформационной модели кодирования
4.2. Классификация вокализованных, невокализованных сегментов и пауз речевого сигнала применительно к проблеме кодирования на основе квазипериодических свойств речевых сигналов

4.2.1 Особенности задачи классификации типа сегмента применительно к проблеме кодирования на основе
квазипериодических свойств речевых сигналов
4.2.2. Классификация вокализованных сегментов и оценка периода основного тона
4.2.3. Решение задачи классификации невокализованных сегментов и
пауз речи
4.3. Минимизация множества векторов параметров сигнала на периоде основного тона в соответствии с сегментнотрансформационной моделью
4.3.1. Метод выделения сигнала на одном периоде основного тона в начале интервала анализа
4.3.2. Выбор модели параметрического кодера для синтеза речевого сигнала на периоде основного тона
4.3.3. Анализ корреляционных свойств сигнала возбуждения для
сигнала на одном периоде основного тона
4.3.4. Применение нейронных сетей для кластеризации множества векторов параметров
4.3.4.1. Кластеризация множества векторов возбуждения
4.3.4.2. Поиск вектора - лидера
4.3.4.3. Определение класса произвольного вектора
4.4. Анализ функции преобразования параметров при синтезе речи
на базе сегментно-трансформационной модели
4.4.1. Исследования изменения величины периода основного тона за интервал анализа
4.4.2. Исследования изменения энергии сигнала на периоде основного тона за интервал анализа
4.4.3. Интерполяция параметров предсказания
4.5. Выводы по главе
ГЛАВА 5. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ ТЕОРЕТИКОИНФОРМАЦИОННЫХ ПРИНЦИПОВ КОДИРОВАНИЯ НА ОСНОВЕ КВАЗИПЕРИОДИЧЕСКИХ СВОЙСТВ РЕЧИ
5.1. Реализация разработанных принципов кодирования в кодерах с многоимпульсным возбуждением
5.1.1. Анализатор кодера переменной скорости с векторным кодированием сигнала многоимпульсного возбуждения на периоде основного тона
5.1.2. Синтезатор кодера переменной скорости с векторным кодированием сигнала многоимпульсного возбуждения на периоде основного тона

до половины выборки может использоваться нормализованная функция автокорреляции.
Значение функции, которое соответствует функции ошибки основного тона Р, вычисляется для всех возможных основных тонов, а затем осуществляется отслеживание основных тонов вперед и назад для выделения исходного основного тона, который в дальнейшем уточняется для получения более высокого разрешения в частотной области. Высокая точность оценки основного тона необходима для совпадения гармоник в середине для точной идентификации вокализованный/невокализованный.
Определение вокализованный/невокализованный выполняется при

рассмотрении нормализованной ошибки СТ^ между исходным спектром и спектром оценки речи в каждой частотной полосе:
£к(л)-£(и,®0)|
_ 2 _ «‘к.
n=hH
где со о уточненная основная частоты; Ьк1 и Ък1 - первая и последняя гармоники в к -й полосе; SJn)- спектр исходной речи; S{n,co0)~ восстановленный спектр речи.
При создании синтезированного спектра очень важно отрегулировать положение Wpjn) и размер используемого преобразования для уверенности, что пик окна расположен по центру гармоники и спадает до очень малой величины на ±0,5и0 относительно частоты каждой гармоники.
Как правило, спектр речи не полностью вокализованный и поэтому, даже если синтезированный спектр будет очень близок к исходному в вокализованных областях, в невокализованных областях разница будет очень большой. Поэтому для принятия решения вокализованный / невокализованный могут использоваться критерии сходства или не сходства на основании сравнения с заранее определенным порогом. Значение порога устанавливается так, чтобы задать определенную энергию смеси вокализованный и невокализованный. Для адаптации порога на значение, при котором

Название работы	Автор	Дата защиты
Синтез, анализ и практическая реализация алгоритмов распознавания и предобработки речевых сообщений	Выборнов, Сергей Владимирович	2013
Разработка онтологий информационного обеспечения автоматизированных систем диспетчерского управления	Гвоздевский, Игорь Николаевич	2019
Исследование и применение критериев проверки гипотез об отсутствии тренда и критериев однородности	Веретельникова, Ирина Викторовна	2019

Электронная библиотека диссертаций

Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств

Рекомендуемые диссертации данного раздела