Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов

Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов

Автор: Федоренко, Олег Григорьевич

Шифр специальности: 05.13.13

Научная степень: Кандидатская

Год защиты: 1999

Место защиты: Таганрог

Количество страниц: 177 с. ил.

Артикул: 258969

Автор: Федоренко, Олег Григорьевич

Стоимость: 250 руб.

1. ИССЛЕДОВАНИЕ СТРУКТУРЫ РЕЧЕВЫХ СИГНАЛОВ С ЦЕЛЬЮ ОТЫСКАНИЯ КРИТЕРИЕВ РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОЙ ИНФОРМАЦИИ В РЕЧИ
1.1. Дискретные математические модели речеобразования. Базовые акустические параметры речевого сигнала.
1.2. Исследование акустических параметров речевых сигналов, обусловливающих передачу эмоциональной информации
1.2.1. Исследование интонационных и спектральных характеристик сигнала
1.2.2. Исследование временных и динамических характеристик сигнала
1.2.3. Некоторые вычислительные аспекты.
1.3. Синтез алгоритма классификации эмоциональных компонент. Комплексная оценка эмоциональности речевого потока
1.4 Выводы
2. РАЗРАБОТКА АЛГОРИТМОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ РЕЧЕВОГО СИГНАЛА В СИСТЕМАХ С ЭЛЕМЕНТАМИ РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОЙ ИНФОРМАЦИИ.
2.1. Алгоритмы сегментации речевого сигнала.
Сегментация речевого сигнала на речь и паузы. Оценивание длительности пауз в речевом сигнале
2.1.2. Алгоритм выделения вокализованных сегментов в речевом сигнале
2.1.3. Сегментация речевого сигнала на слоги. Оценивание длительности слогов и темпа речи.
2.2. Особенности алгоритма оценивания формант речевого сигнала
2.3. Определение длительности фронта и спада речевого сигнала вокализованных сегментов
2.4. Алгоритм оценивания периода основного тона речевого сигнала
2.5. Выводы.
3. РАЗРАБОТКА И ИССЛЕДОВАНИЕ ПРИНЦИПОВ ПОСТРОЕНИЯ АППАРАТНОГО МОДУЛЯ ОПРЕДЕЛЕНИЯ ЭМОЦИОНАЛЬНОЙ ИНФОРМАЦИИ В РЕЧИ, ОРИЕНТИРОВАННОГО НА ПРИМЕНЕНИЕ В ЦИФРОВОЙ АТС.
3.1. Анализ принципов построения цифровой системы связи с элементами аппаратной и программноаппаратной классификации эмоциональной информации в речи.
3.2. Разработка и анализ структуры вычислительных процессов программноаппаратного модуля классификации эмоциональной составляющей речевого сигнала.
3.3. Исследование возможностей применения нейросетевых технологий в аппаратнопрограммном модуле классификации эмоциональной ситуации
в речи
3.4. Программное моделирование нейросети, используемой для распознавания эмоциональной составляющей в речи. Анализ экспериментальных данных.
3.5. Выводы.
4. РАЗРАБОТКА ПРОГРАММНОЙ СРЕДЫ МОДЕЛИРОВАНИЯ ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССОВ СИСТЕМЫ С ЭЛЕМЕНТАМИ РАСПОЗНАВАНИЯ ЭМОЦИОНАЛЬНОЙ ИНФОРМАЦИИ В РЕЧИ.
4.1. Задачи и структура программной среды моделирования. Реализация базового набора процедур цифровой обработки речевых сигналов
4.2.Структура и особенности уровня классификации эмоциональной информации в речи.
4.3. Моделирование методов интерактивного конфигурирования аппаратного модуля классификации эмоциональной составляющей речевого сигнала. Анализ программного блока взаимодействия с ЦАТС мониторинговой системы Модуль оператора АТС
4.4. Выводы.
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


При произнесении кратковременных, например взрывных звуков модель уже не является адекватной. Рис 1. Структура обобщенной математической модели речеобразования. Второе ограничение состоит в отсутствии нулей передаточной функции, необходимых для точного описания НОСОВЫХ и фрикативных звуков. Кроме того, данная модель речеобразования является упрощенной и неориентированной на применение в конкретной задаче цифровой обработки речи. Так например, набор параметров голосового факта не конкретизирован, а передаточная функция Уг, описываемая выражением 1. Примером более точной и ориентированной на конкретные приложения ЦОРС, является модель формантного анализасинтеза приведенная в . Ее структура представлена на рис. Модель конкретизирована набором параметров и в отличии от предыдущей имеет более гибкое описание передаточной функции голосового гракта. В ней используются две передаточные функции Н9г и Ниг, активизируемые на вокализованных и невокализованных фрагментах речи соответственно. Набор параметров модели включает в себя период основного гона Т0, частоты формант Р2, Рг, , частоты полюса Рр и нуля Р. Ниг и масштабирующие множители Лу и А для управления вокализованным и иевокализованным возбуждением. Здесь также полагается, что параметры модели постоянны на интервале мс и все сигналы речи можно подразделить на вокализованные и невокализованные. Однако передаточная функция голосового тракта уже модифицирована и в моделировании невокализованных фрагментов речи учитываются полюса и нули функции . Рис 1.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.201, запросов: 244