+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Система разделения дикторов на основе вероятностного линейного дискриминантного анализа

Система разделения дикторов на основе вероятностного линейного дискриминантного анализа
  • Автор:

    Кудашев, Олег Юрьевич

  • Шифр специальности:

    05.13.11

  • Научная степень:

    Кандидатская

  • Год защиты:

    2014

  • Место защиты:

    Санкт-Петербург

  • Количество страниц:

    158 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
Список сокращений и условных обозначений 
1 Современные подходы к задаче разделения дикторов


Оглавление

Список сокращений и условных обозначений


Введение

1 Современные подходы к задаче разделения дикторов

1.1 Акустические признаки

1.1.1 Мел-частотные кепстральные коэффициенты

1.1.2 Коэффициенты линейного предсказания

1.1.3 Перцепционные коэффициенты линейного предсказания

1.1.4 Постобработка акустических признаков

1.2 Детектор речевой активности

1.3 Сегментация фонограммы


1.3.1 Баейсовский информационный критерий
1.3.2 Обобщенное отношение правдоподобия
1.3.3 Дивергенция Кульбака-Лейблера
1.4 Кластеризация речевых сегментов по дикторам
1.4.1 Построение голосовой модели диктора
1.4.2 Методы кластеризации дикторов
1.4.3 Метод кластеризации на основе ВА
1.5 Оценка эффективности систем разделения дикторов
1.6 Выводы
2 Система разделения дикторов на основе РЫ)А
2.1 Вероятностный линейный дискриминантныйанализ
2.2 Модель РЬБА задачи разделения дикторов
2.2.1 Оценка параметров Р1ЛЭА
2.2.2 Результаты численных экспериментов

2.3 Кластеризация речевых сегментов
2.3.1 Модельный отбор
2.3.2 Кластеризация при известном числе дикторов
2.3.3 Алгоритм кластеризации
2.4 Выводы
3 Построение системы разделения дикторов
3.1 Методика оценки эффективности систем
3.1.1 Акустические базы
3.1.2 Критерии оценки эффективности
3.2 Построение опорной системы разделения дикторов на фонограмме
3.2.1 Акустические признаки
3.2.2 Детектор речевой активности
3.2.3 Поиск точек смены дикторов на фонограмме
3.2.4 Кластеризация речевых сегментов по дикторам
3.2.5 Схема алгоритма опорной системы
3.2.6 Результаты численных экспериментов
3.3 Выбор акустических признаков
3.4 Модуль сегментации фонограммы
3.5 Модуль кластеризации
3.5.1 Кластеризация при известном числе дикторов
3.5.2 Модельный отбор
3.6 Выводы
4 Программные средства системы разделения дикторов
4.1 Структура системы разделения дикторов
4.2 Технические характеристики системы
4.2.1 Поддерживаемые архитектуры и операционные системы
4.2.2 Количество потребляемой памяти
4.2.3 Быстродействие системы
4.3 Сравнительный анализ с системой ЫЦМ
4.3.1 Описание системы ЬШМ
4.3.2 Потребление памяти и быстродействие
4.3.3 Оценка эффективности
4.4 Дальнейшая работа
4.5 Выводы Заключение Литература

Пусть дан набор данных X размера И, тогда для модели Я, описывающей распределение этих данных, значение В1С будет выражаться формулой:
где 0 - параметры модели Я; Р(Д|Омар) - функция правдоподобия; ©мар -Maximum a posteriori (МАР) - оценка параметров 0; v(@) - количество параметров модели; Л - настраиваемый параметр критерия, больший нуля.
Второе слагаемое в формуле (1.32) представляет собой штрафную функцию, которая уменьшает величину BIC при увеличении количества параметров. Таким образом, из набора моделей, одинаково точно описывающие распределение данных X, выбирается та, которая имеет наименьшее число параметров.
Применим BIC для задачи поиска точек смены дикторов на фонограмме. Пусть нам даны два речевых участка, содержащие данные Х и А2 соответственно. Рассмотрим две модели:
1. Н - данные из обоих речевых участков подчинены одному гауссову распределению (/а, £).
2. Я2 - данные первого речевого участка подчинены гауссову распределению (/xi, Ei), а данные второго речевого участка подчинены гауссову распределению (/12, Е2).
Рассмотрим величину:
В1С(Н) = 1пР(А|0Мар) - ^(©) IniV
(1.32)
ДЯ/С(ЯЬЯ2) =В1С(Нг) - В1С{Н2) =
Р(ХиХ21/1, £)
~ ПР(А1|/11,Е1)Р(А2|/12,Е2)_ - Ир 2) - г/(/11, El)) In N N + N2 ,
(1.33)
где N1, N2 - количество данных первого и второго участков соответственно.

Рекомендуемые диссертации данного раздела

Время генерации: 0.109, запросов: 967