Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах

Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах

Автор: Прохоренко, Екатерина Ивановна

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Белгород

Количество страниц: 162 с. ил.

Артикул: 3301907

Автор: Прохоренко, Екатерина Ивановна

Стоимость: 250 руб.

Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах  Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах 

Содержание
Введение.
Глава 1. Хранение и передача речевых данных в информационнотелекоммуникационных системах.
1.1. Обзор использования существующих информационно телекоммуникационных систем для обмена речевыми сообщениями и хранения речевых данных.
1.2. Анализ свойств речевых сигналов и восприятия звука слухом человека.
1.3. Компьютерная обработка речевых сигналов в информационнотелекоммуникационных системах.
1.4. Задачи исследования
Глава 2. Частотный анализ речевых сигналов.
2.1. Методы частотного анализасинтеза речевых сигналов.
2.2. Разработка нового алгоритма вычислений долей энергии отрезков речевых сигналов, соответствующих заданным частотным диапазонам частотный анализ
2.3. Оптимальные алгоритмы субполосного преобразования
2.4. Основные результаты и выводы главы.
Глава 3. Компьютерная обработка речевых сигналов при обнаружении и
кодировании пауз речи
3.1. Характеристика проблемы и методов ее решения.
3.2. Разработка процедуры обнаружения участков речевого сигнала, соответствующих паузам речи, на основе модели линейного предсказания.
3.3. Разработка процедуры обнаружения участков речевого сигнала, соответствующих паузам речи, за счет учета различий в распределении энергий шумов и звуковых данных в частотной области.
3.4. Основные результаты и выводы главы.
Глава 4 Разработка информационной технологии сжатиявосстановления речевых данных в ИТС на основе частотной обработки
4.1. Основные этапы процедуры сжатиявосстановления речевых данных.
4.2. Процедура сжатиявосстановления речевых данных
4.3. Выбор параметров процедуры сжатиявосстановления речевых данных.
4.4. Программноалгоритмическая поддержка процедуры сжатиявосстановления речевых данных.
4.5. Основные результаты и выводы главы
Заключение.
Список использованных источников


При указанных параметрах дискретизации и квантования, объем речевых данных, например, при проведении двухчасовой аудиоконферепции, составит величину, равную V= Я ¦ Т = кбит/с-с = кбит = 6, 9-8 бит, где: Я= отсчетов/с- бит/отсчет = 0 бит/с = кбит/с - результирующая скорость кода; Т= с - время проведения аудиоконференции. Для повышения эффективности использования коммуникационных и информационно-вычислительных ресурсов рассматриваемых ИТС при передаче и хранении речевых данных применяются различные методы и средства. Среди них весьма важную роль играют методы, обеспечивающие сжатие (кодирование) речи, т. В таких системах речевой сигнал, преобразованный в цифровой вид, перед записью па носитель или передачей кодируется при помощи специального алгоритма сжатия, а при воспроизведении с носителя или на приеме - декодируется. Это позволяет значительно разгрузить каналы связи и системы обработки и хранения данных за счет исключения ненужных или дублирующих сведений, что эквивалентно повышению пропускной способности систем сбора, передачи и обработки данных или увеличению емкости запоминающих устройств (ЗУ). С учетом цели данной работы, под эффективностью будем понимать коэффициент отношения объема памяти, который необходимо выделить для хранения речевых данных, поступивших на вход компьютера в единицу времени (секунду), к объему памяти, который занимают речевые данные после осуществления процедуры их сжатия(кодирования). Для кодирования объемов речевых данных, в настоящее время используются методы с потерями, которые разделяются на два основных класса, называемых кодированием волны (прямое цифровое кодирование речевых сигналов с использованием разнообразных приемов снижения скорости их передачи) и кодированием источника (моделирование голосового аппарата с применением подходящих методов оценки параметров модели). Методы без потерь для сжатия речи не используются, так как они не позволяют устранить заложенную в ней избыточность. Более детально анализ существующих подходов к кодированию речевых данных, с целью разработки на этой основе новых методов и алгоритмов их компьютерной обработки в ИТС при передаче и хранении, будет проведен в параграфе 1. Здесь же заметим, что эффективность методов в значительной степени зависит от учета свойств речевых сигналов и, прежде всего с позиций их восприятия слухом человека. Исходя из этого, представляется целесообразным подробно остановиться на рассмотрении свойств речевых сигналов. Речь является средством передачи разнообразной информации как вербальной (словесной), так и невербальной (эмоциональной) [1, 2, 3, 9]. Процесс образования и восприятия речевых сигналов, схематически показанный на рисунке 1. Формулировка сообщения]'4. Рис. Рассмотрим основные свойства речевого сигнала как объекта сжатия (кодирования) [4, 5]. Речь представляет собой колебания сложной формы, зависящие от произносимых слов, тембра голоса, интонации, пола и возраста говорящего. На приведенных ниже рисунках изображены фрагменты речевых сигналов, содержащих гласные (рис. Хорошо видна разница в характере соответствующих сигналов, а также то, что как в первом, так и во втором случаях ширина спектра сигнала не превышает 3,5 кГц. Эта существенная неравномерность спектра, является одним из факторов сжимаемости таких сигналов. Рис. Рис. Рис. Рис. Второй особенностью речевых сигналов, как это можно отметить из приведенных примеров, является неравномерность распределения вероятностей (плотности вероятности) мгновенных значений сигнала. Малые уровни сигнала значительно более вероятны, чем большие. Особенно это заметно на фрагментах большой длительности с невысокой активностью речи. Этот фактор, как известно, также обеспечивает возможность кодирования - более вероятные значения могут кодироваться короткими кодами, менее вероятные - длинными. Еще одна особенность речевых сигналов - их существенная нестационарность во времени: свойства и параметры сигнала на различных участках значительно различаются. При этом размер интерваза стационарности составляет порядка нескольких десятков миллисекунд.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.240, запросов: 244