Методы и алгоритмы повышения эффективности автоматического интонационного анализа речевых сигналов

Методы и алгоритмы повышения эффективности автоматического интонационного анализа речевых сигналов

Автор: Марьев, Александр Александрович

Шифр специальности: 05.12.04

Научная степень: Кандидатская

Год защиты: 2012

Место защиты: Таганрог

Количество страниц: 141 с. ил.

Артикул: 6523916

Автор: Марьев, Александр Александрович

Стоимость: 250 руб.

Методы и алгоритмы повышения эффективности автоматического интонационного анализа речевых сигналов  Методы и алгоритмы повышения эффективности автоматического интонационного анализа речевых сигналов 

Содержание
Введение.
Глава 1. Аналитический обзор методов интонационного анализа человеческой речи.
1.1 Постановка задачи. Математическая модель сигналов. Представление параметров сигнала.
1.2 Основные этапы разработки метода
интонационного анализа речи.
1.2.1 Измерение характеристик сигнала.
1.2.2 Снижение размерности вектора параметров.
1.2.3 Построение классификатора.
Глава 2. Информационный подход к решению задачи классификации
2.1 Необходимость предложения новых подходов к решению задачи классификации при интонационном анализе.
2.2 Принцип максимума информации. Классификатор, оптимальный в смысле принципа максимума информации
2.3 Особенности представления объектов. Состав классификатора.
2.4 Обучение классификатора.
2.5 Классификация интонаций.
Глава 3. Система интонационного анализа речи, использующая классификатор, оптимальный в смысле принципа максимума информации .
3.1 Состав системы
3.2 Измерение параметров речевого сигнала.
3.2.1 Определение границ вокализованных участков речевого сигнала.
3.2.2 Динамический диапазон и коэффициент пиковости.
3.2.3 Средняя частота следования и относительная длительность вокализованных звуков
3.2.4 Характеристики мгновенного спектра
3.2.5 Характеристики частоты основного тона.
3.2.6 Характеристики огибающих вокализованных участков
3.2.7 Параметры модели линейного предсказания.
г .
3.2.8 Мелчастотные кепстральные коэффициенты и логарифмические частотные
коэффициенты мощности
3.3 Снижение размерности пространства признаков
3.3.1 Снижение размерности вектора признаков моголом главных компонент.
3.3.2 Использование критерия срелней взаимной информации с вектором номеров классов
3.3.3 Группировка признаков с использованием критерия срелней взаимной информации между признаками.
3.3.4 Адаптивное квантование значений признаков
3.4 Обучение классификатора.
Глава 4. Исследование эффективности метода распознавания
эмоционального состояния оператора по его речи с применением
классификатора, оптимального в смысле ИМИ.
4.1 Задача распознавания эмоционального состояния оператора по ег о речи
4.2 Обучение системы
4.3 Оценка надежности распознавания.
Список литературы


Ряд известных систем-аналогов при сопоставимых результатах различали меньшее число эмоциональных состояний (шесть). Средняя вероятность верного распознавания семи состояний в аналогичном исследовании составила 0, при использовании другого типа классификатора. Использовались методы статистической радиотехники, акустики, цифровой обработки сигналов, прикладной статистики, теории эвристических решений, а также некоторые данные психоакустики и физиологии. Проверка теоретических выводов производилась путем постановки и проведения эксперимента по распознаванию семи эмоциональных состояний на материале Берлинской базы записей эмоциональной речи. Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на следующих научных конференциях и научных школах: международной научной конференции «Системы и модели в информационном мире», г. Таганрог, ; международной научной конференции «Методы и алгоритмы принятия эффективных решений», г. Таганрог, ; научной школе для молодежи «Нейробиология и новые подходы к искусственному интеллекту и науке о мозге», г. Таганрог, ; Всероссийской научной конференции «Современные исследовательские и образовательные технологии», г. Таганрог, ; Всероссийской научной конференции «Актуальные вопросы исследования общественных и технических систем», г. РАН, г. Ростов-на-Дону, ; Всероссийской научной школе для молодежи «Фундаментальные, клинические и гигиенические основы и аппаратно-методическое обеспечение системы медико-психологической реабилитации пациентов, подверженных высокому уровню напряженности труда и профессионального стресса», г. Ростов-на-Дону, ; Всероссийской научной конференции «Перспективы развития гуманитарных и технических систем», г. РАН, г. Ростов-на-Дону, ; Всероссийской научной конференции «Актуальные проблемы современности: человек, общество, техника» г. Таганрог, . Результаты диссертационной работы внедрены в госбюджетной работе № 6/1 и учебном процессе кафедры теоретических основ радиотехники, а также при выполнении НИР по гранту Российского фонда фундаментальных исследований (проект №0а). По результатам выполненных исследований опубликовано работ, в том числе 2 статьи в рецензируемых журналах из списка ВАК РФ, одна статья, депонированная в ВИНИТИ РАН, и 9 статей и тезисов докладов в материалах Всероссийских и международных научных конференций и научных школ. Структура и объем работы. Общий объем работы составляет 7 страниц машинописного текста, включая рисунков и И таблиц. Во введении обоснована актуальность темы, обозначено современное состояние исследований в области автоматического интонационного анализа, сформулированы цели исследования, отражены научная новизна и практическая значимость полученных результатов, сформулированы основные положения, выносимые на защиту. В первой главе произведена формальная постановка задачи автоматического интонационного анализа речи в классификационной форме. Приведены широко используемые математические модели речевых сигналов, обсуждена сущность процедуры отображения речевого сигнала в многомерное пространство параметров в виде точки или множества точек. Параметры в этом случае играют роль признаков речевого сигнала, на основании которых производится классификация. Отмечено, что одним из главных факторов, сдерживающих в настоящее время развитие систем автоматического интонационного анализа, является существенный недостаток априорной информации о характере связи субъективных интонационных характеристик с объективными характеристиками речевых сигналов. Приведена наиболее употребимая на сегодня методика разработки систем автоматического интонационного анализа, в которой используется метод последовательных приближений, и которая позволяет при помощи эвристических предположений и специальных процедур свести задачу автоматического интонационного анализа к задаче обучения с учителем, несмотря на существенный недостаток априорной информации. Эвристические предположения используются на этапе определения множества признаков речевого сигнала, содержащего подмножество признаков, информативных в конкретной задаче интонационного анализа.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.188, запросов: 235