Исследование и разработка метода сжатия речевых данных при передаче экспресс-сообщений по телекоммуникационным каналам

Исследование и разработка метода сжатия речевых данных при передаче экспресс-сообщений по телекоммуникационным каналам

Автор: Зернов, Павел Сергеевич

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2009

Место защиты: Санкт-Петербург

Количество страниц: 150 с. ил.

Артикул: 4377391

Автор: Зернов, Павел Сергеевич

Стоимость: 250 руб.

Исследование и разработка метода сжатия речевых данных при передаче экспресс-сообщений по телекоммуникационным каналам  Исследование и разработка метода сжатия речевых данных при передаче экспресс-сообщений по телекоммуникационным каналам 

Оглавление
Введение.
1. Принципы построения современных систем ЭС
1.1. Основные понятия систем ЭС.
1.2. Особенности передачи речи на базе систем ЭС в настоящее время
1.3. Протоколы систем ЭС.
1.3.1. Особенности протоколов I и ХМРР
1.3.2. Базовые принципы протоколов I и ХМРР.
1.3.3. Требуемая полоса пропускания для систем ЭС на базе I и ХМРР
1.3.4. Безопасность в системах ЭС на базе I и ХМРР
1.3.5. Выявленные преимущества и недостатки протоколов I и ХМРР
1.4. Выводы но главе 1.
2. Предлагаемый метод передачи речи на базе ЭС.
2.1. Архитектура системы ЭС
2.2. Системы распознавания и синтеза речи
2.2.1. Системы распознавания речи
2.2.2. Системы синтеза речи
2.3. Выводы по главе 2.
3. Модели обработки информации в системе ЭС, построенной согласно предлагаемому методу.
3.1. Обработка информации на передающей стороне
3.1.1. Модель обработки информации на передающей стороне.
3.1.2. Оценка объема передаваемых в канал данных и времени обработки пакета на основе модели обработки информации на передающей стороне
3.1.3. Оценка возможности обработки информации на передающей стороне в реальном масштабе времени
3.1.4. диаграммы МОИЭС на передающей стороне для их реализации на языке программирования.
3.2. Обработка информации на приемной стороне
3.2.1. Модель обработки информации па приемной стороне
3.2.2. Оценка возможности обработки информации на принимающей стороне в реальном масштабе времени.
3.3. Выводы по главе 3
4. Реализация системы ЭС, основанной на распознавании и синтезе речи по словарю
4.1. Платформа для реализации предложенного метода передачи речи на базе ЭС в компании ЗАО Поликом Про
4.2. Архитектура программноаппаратного комплекса созданного на основе предложенного МПРЭС и реализованного в компании ЗАО Поликом Про
4.3. Результаты внедрения системы.
4.4. Выводы по главе 4
Заключение.
Список используемой литературы


Классификация систем ЭС по способу организации канала передачи речи представлена на рисунке 1. В большинстве систем ЭС передача речи возможна только при прямом соединении точка-точка между клиентами. На схеме 2 (слева) показаны системы, относящиеся к этой группе: ICQ, AIM (протокол OSCAR[, , ]), MSN (протокол MSNP[]), Yahoo (протокол YMSG[i7j), Google Talk (протокол XMPP[]), Jabber (протокол XMPP). Рис 1. Рассматриваемые системы ЭС работают в пакетных сетях, в основе которых лежит 1Р протокол, определяющий два транспортных механизма -протокол пользовательских дейтаграмм 1ЮР [] и протокол управления передачей ТСР []. Как правило, когда необходимо надежное соединение, имеет смысл использовать протокол ТСР, если необходима простота, но необязательна гарантия доставки - протокол 1ЮР. В связи с чувствительностью к реальному времени голосового потока данных, для передачи голоса логично выбрать протокол 1Л)Р/1Р. UDP, обеспечивает недостаточно подробную информацию, для передачи голоса на базе IP. Для передачи в реальном масштабе времени, а также для передачи данных, чувствительных к задержке, Инженерная группа по решению конкретных задач Интернета (Internet Engineering Task Force - IETF) выбрала протокол RTP (Real-Time Transport Protocol - протокол передачи данных в реальном масштабе времени) []. Голосовые данные системы ЭС передаются поверх протокола RTP, который, в свою очередь, передается поверх протокола IJDP. Следовательно, пакет передается с заголовком пакета RTP/UDP/IP. Вне зависимости от протокола прикладного уровня, все системы ЭС для передачи речи используют протокол RTP. Протокол RTP - это стандарт для передачи чувствительных к задержке данных через пакетные сети. Протокол RTP предоставляет принимающей станции информацию, отсутствующую в не требующих установления соединения потоках UDP/IP. Два важнейших бита информации в заголовке RTP пакета - порядковый номер (sequence number) и временная метка (timestamp). Протокол RTP использует информацию о. При необходимости, протокол RTP можно использовать как для передачи мультимедийных данных, так и для интерактивных служб телефонии Интернета. Протокол RTP, впоследствии названный протоколом контроля RTP (RTP Control Protocol — RTCP) [] имеет две составляющие - часть данных (data part) и часть контроля (control part). Установление и разрыв соединения не входит в список возможностей RTP, такие действия выполняются сигнальным протоколом (например, протоколом SIP [, ]). Протокол RTP обладает рядом недостатков. Заголовки IP/UDP/RTP составляют , 8 и байт соответственно. G.9 с двумя голосовыми выборками ( мс). RTP не имеет стандартного зарезервированного номера порта. Единственное ограничение состоит в том, что соединение проходит с использование четного номера, а следующий нечетный номер используется для связи по протоколу RTCP. Тот факт, что RTP использует динамически назначаемые адреса портов, создает ему трудности для прохождения межсетевых экранов, для обхода этой проблемы, как правило, используется STUN-cepBep[]. Для уменьшения объема передаваемых в канал данных, применяются методы сжатия речевого сигнала, основанные на различных принципах кодирования. Для этого используются кодеки, обеспечивающие преобразование речевого сигнала. Общепринятыми сейчас являются два основных варианта импульснокодовой модуляции (Pulse Code Modulation - PCM) на Кбит/с[3]: Р -стандарт (используемый в Северной Америке) и а -стандарт (принятый в Европе). Оба используют логарифмический метод сжатия, чтобы достичь битового качества канала РСМ при восьмибитовых словах, а отличаются незначительными деталями. Метод Р -стандарт имеет небольшое преимущество перед методом а -стандарт по низкоуровневой производительности и отношению сигнал/шум. Другой популярный метод сжатия - адаптивная дифференциальная импульсно- кодовая модуляция (Adaptive Differential Pulse Code Modulation -ADPCM). Общепринятым стандартом ADPCM является ITU-T G. Кбит/с. В отличие от РСМ, четырьмя битами непосредственно кодируется не амплитуда голоса, а разница амплитуды (как частота изменения амплитуды).

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.247, запросов: 244