+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Модели и алгоритмы в системах анализа речевых сигналов

Модели и алгоритмы в системах анализа речевых сигналов
  • Автор:

    Трубицын, Владимир Геннадьевич

  • Шифр специальности:

    05.13.17

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Орел

  • Количество страниц:

    134 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
1.1 Процесс речеобразования. Характеристики и свойства речевых сигналов 
1.2 Существующие методы и алгоритмы сегментации речевых сигналов


СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. Анализ процесса речеобразования, характеристик, свойств и моделей речевого сигнала

1.1 Процесс речеобразования. Характеристики и свойства речевых сигналов

1.2 Существующие методы и алгоритмы сегментации речевых сигналов

для его представления и обработки


1.3 Анализ существующих методов преобразования устной речи в речевые данные (кодирование речевого источника)

1.4 Постановка задачи исследования

Выводы по главе


2. Математическая модель анализа речевых данных в системах представления устной речи
2.1 Выделение участков квазистационарности для обработки речи на основе корреляционного анализа реализаций речевого сигнала
2.2 Математическая модель анализа речевых данных в системах
представления устной речи
Выводы по главе
3. Методика формирования участков речевых отсчётов,
порояедаемых вокализованными звуками
3.1 Способы и приёмы определения значений интервалов
автокорреляции временного ряда интервалов автокорреляции, соответствующие структурным изменениям в речевом сигнале
3.2 Линейная регрессионная модель тренда временного ряда интервалов автокорреляции смежных сегментов финитного участка речевых отсчётов
3.3 Оценка временного ряда интервалов автокорреляции смежных
сегментов финитного участка речевых отсчётов
Выводы по главе

4. Алгоритм передискретизации речевых отсчётов за счёт изменения частоты выборки речевых отсчётов на выделяемых участках
4.1. Уменьшение количества речевых отсчётов в формируемых участках квазистационарности для анализа и представления речи
4.2 Алгоритм передискретизации речевых отсчётов за счёт изменения частоты выборки речевых отсчётов на выделяемых участках
4.3 Анализ корректности алгоритма передискретизации речевых отсчётов за счёт изменения частоты выборки на выделяемых
участках
4.4 Требования и ограничения применения процедур многоскоростной обработки при передискретизации речевых отсчётов
4.5 Результаты экспериментальных исследований алгоритма
передискретизации речевых отсчётов за счёт изменения частоты
выборки на выделяемых участках
Выводы по главе
5. Оценка эффективности методики формирования участков
речевых отсчётов, порождаемых вокализованными звуками и алгоритма передискретизации речевых отсчётов на выделяемых участках
5.1 Интервальные оценки использования методики по формированию участков квазистационарности вокализованных звуков и потерь
мощности речевых сигналов при передискретизации
Выводы по главе
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
Приложение А
Приложение В
Приложение С

ВВЕДЕНИЕ
Актуальность работы: В настоящее время наблюдается значительный рост исследований и разработок в области анализа, кодирования и синтеза речи. Одной из основных задач, стоящих перед речевыми технологиями является задача компактного цифрового представления устной речи для её хранения, обработки, передачи и защиты.
Интерес к системам анализа речевых данных при кодировании обусловлен повышением требований к качеству речевого сигнала в системах различного назначения:
1. В криптографических системах государственного, военного и корпоративного назначения.
2. В авиационных системах связи для реализации возможности определения психофизиологического состояния летчика по голосу.
3. В системах защиты информации по каналам диапазонов сверх длинных и длинных волн при организации связи типа "электронной речевой почты".
4. В системах хранения речи для автоматизированных, электронных, речевых справочных служб.
5. В мультимедиа ориентированных системах коммуникации.
6. В системах речевого управления.
Существующие модели речеобразования не в полной мере соответствуют их адекватному представлению в речевых данных, что ограничивает применение речевых технологий. Это связанно с возникающим противоречием: с одной стороны длительность временного участка речевых отсчётов для анализа должна быть малой, чтобы последовательность таких участков точно отражала динамику изменений в речевом сигнале, в частности появление коротких пауз и участков переходных звуков. С другой стороны длительность анализируемого участка должна быть достаточно большой, чтобы обеспечить точность оценки характеристик речевого сигнала.
Данное противоречие приводит к проблемам человеко-машинного взаимодействия и искусственного интеллекта возникающим при автоматиче-

дискретизации, предсказания, квантования и кодирования обуславливают разнообразие алгоритмов цифрового речепреобразования на основе временных методов. Признаками дальнейшей классификации в рамках описанных методов выступают режимы осуществления трёх первых процедур:
- фиксированный или адаптивный характер данных процедур;
- равномерные или неравномерные шкалы дискретизации, квантования и кодирования;
- линейная или нелинейная функция предсказания;
- скалярный или векторный способ квантования.
Временные методы непосредственного кодирования речевого сигнала имеют высокое качество соответствия цифровых данных речи и аналогового речевого сигнала и относительную простоту реализации цифрового речепреобразования. Международным союзом электросвязи (МСЭ) рекомендованы соответствующие спецификации серии G, реализующие алгоритмы РСМ со скоростью преобразования 64 кБит/с (G.711) [40] и адаптивной DPCM (G.726) со скоростями 40, 32, 24 и 16 кБит/с [74, 75, 76, 77, 78]. Основным недостатком цифровых данных, полученного методами РСМ, является существенная статистическая избыточность, сохраняющаяся в условиях дискретизации речевого сигнала, характеризующегося нестационарностью и недос-тачностью априорных сведений о его статистике, с фиксированной частотой дискретизации. Некоторому сокращению избыточности цифровых данных устной речи приводит использование DPCM и DM, которое проявляется в уменьшении требуемых информационных ресурсов, за счёт использования декоррелирующей процедуры предсказания.
Принципиально иную парадигму цифрового преобразования представляют вокодерные и гибридные методы, обеспечивающие значительную степень сжатия речи. Сутью данных методов преобразования является отказ от цифрового представления формы речевого сигнала. При этом из анализируемого сегмента речи выделяются характерные параметры, которые являются в свою очередь объектом векторного квантования и кодирования. Развитие

Рекомендуемые диссертации данного раздела

Время генерации: 0.105, запросов: 967