Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Рогозинский, Глеб Гендрихович
05.11.18
Кандидатская
2010
Санкт-Петербург
118 с. : ил.
Стоимость:
499 руб.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1 ОБЗОР СОСТОЯНИЯ ПРОБЛЕМЫ
1.1 Основные положения психоакустики
1.2 Основные принципы перцепционного кодирования звука
1.3 Основные положения теории вейвлетов
1.4 Базисы вейвлетов в кодировании звука
2 ОПТИМИЗАЦИЯ ВЕЙВЛЕТНЫХ БАЗИСОВ
ДЛЯ ПЕРЦЕПЦИОННОГО КОДИРОВАНИЯ ЗВУКА
2.1 Постановка задачи оптимизации вейвлетных базисов
2.2 Методы увеличения частотной селективности вейвлетов
2.3 Оценка результатов оптимизации
3 ПСИХОАКУСТИЧЕСКАЯ МОДЕЛЬ В ВЕЙВЛЕТНОМ ПРОСТРАНСТВЕ
3.1 Глобальный порог маскирования в пространстве Фурье
3.2 Глобальный порог маскирования в вейвлетном пространстве
3.3 Принципы вейвлетного кодирования звука
4 ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ МОДЕЛИ ВЕЙВЛЕТНОГО КОДЕКА
4.1 Алгоритм перцепционного вейвлетного кодирования
4.2 Способ организации структуры кадра данных
4.3 Результаты экспертной оценки кодека
4.4 Описание программы на языке МаЙаЬ
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЯ
Приложение А
ВВЕДЕНИЕ
Перцепционное кодирование подразумевает способ преобразования потока данных, при котором кодированию подвергается только та часть общей информации, которую способен воспринять слуховой анализатор человека. Часть информации, которая не может быть воспринята, устраняется из потока данных. Другая часть информации, параметры которой могут восприниматься только частично, кодируется более грубо, с использованием меньшего числа информационных разрядов. Таким образом, перцепционное кодирование подразумевает невосполнимую утрату значительной части исходной информации, за счет чего и достигается эффект сжатия. Поэтому данные методы относят к методам сжатия с потерями, в отличие от методов сжатия без потерь.
Вейвлетное преобразование, получившее значительное распространение I в области прикладной« математики, находит новые области применения.
Аналогия между быстрым алгоритмом диадного дискретного вейвлетного преобразования и квадратурно-зеркальной фильтрацией сигнала делает это преобразование эффективным' инструментом в задачах субполосного
кодирования сигналов, к которым могут быть отнесены вопросы сжатия звука с потерями.
Для сокращения времени передачи данных по сетям связи, а также для увеличения полезной емкости носителей данных применяются различные методы сжатия информации. Актуальность эффективного использования и оптимизации методов сжатия постоянно возрастает в связи с увеличением объемов данных, передаваемых по каналам связи. Важное значение имеют экономические факторы. Использование информационного сжатия- позволяет передать звук с высоким или приемлемым.качеством, используя узкую полосу частот. Это, в свою очередь, делает возможным сокращение стоимости аренды
спутникового канала, уменьшение диаметров передающей и приемной антенн и т.д.
В рамках целевой правительственной программы по внедрению в Российской Федерации цифрового теле- и радиовещания решается ряд задач, в том числе, связанных с эффективным сжатием мультимедиа. К этим задачам относится и рассматриваемая в данной работе проблема, что определяет тем самым актуальность поставленной темы.
Цель и задачи исследования. Цель диссертационной работы состоит в исследовании возможности использования вейвлетного базиса в качестве частотно-временного преобразования в перцепционном кодировании звука Поставленная цель достигается решением следующих задач:
1) анализ существующих и перспективных алгоритмов перцепционного сжатия звука
2) разработка психоакустической модели слуха в вейвлетном пространстве
3) разработка эффективного алгоритма сжатия звуковых данных
4) экспериментальное апробирование результатов теоретических исследований
Методы исследования. При решении поставленных задач применялись методы теории приближения функций, методы теории вычислений, методы психоакустики, методы статистической обработки результатов эксперимента.
Научная новизна работы
1) показана возможность вычисления психоакустической модели непосредственно в вейвлетном пространстве
2) проведена адаптация метода оптимизации вейвлетов к задаче улучшения частотной селективности фильтров Добеши
3) разработан алгоритм перцепционного кодирования звука, использующий вейвлетное преобразование
при заданном числе нулевых моментов К. Под числом нулевых моментов вейвлета понимается количество нулей на г-плоскости в точке г = —1.
Рисунок 2.1 - Амплитудно-частотные характеристики пары квадратурнозеркальных фильтров
Ранее отмечалось, что для субполосного кодирования звука требуется хорошее разделение полос. Для того, чтобы оценить с этой точки зрения набор фильтров Добеши, рассмотрим передаточные функции фильтров, находящихся между точкой входа сигнала и точками выхода, расположенными в терминальных узлах дерева. Они могут быть получены путем перемножения передаточных функций предыдущих фильтров [64].
С1 (г) = Жг)Я(г)... Ни2"1 )С(Д‘") (2.6)
Обратимся к семейству амплитудно-частотных характеристик фильтров, используемых для разложения сигнала для первых двух уровней (рис. 1.10). Обратим внимание на тот факт, что имеет место взаимное проникновение полос отдельных фильтров, часто называемое элайзингом. Это связано с тем, что вейвлеты Добеши обладают плохой частотной селективностью. В то же
Название работы | Автор | Дата защиты |
---|---|---|
Разработка методов контроля и цифровой коррекции параметров изображений стереопары | Чафонова, Виктория Германовна | 2014 |
Совершенствование системы кинематографа высокого качества применением импульсного источника света | Малюхова, Татьяна Владимировна | 2002 |
Разработка модели с целью оптимизации номенклатурного ряда профессиональной кинопроекционной аппаратуры | Большаков, Владимир Иванович | 1984 |