Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи

Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи

Автор: Репалов, Сергей Анатольевич

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Ростов-на-Дону

Количество страниц: 144 с.

Артикул: 2614548

Автор: Репалов, Сергей Анатольевич

Стоимость: 250 руб.

Оглавление
Принятые обозначения и сокращения.
Введение
1 Обзор и анализ методов идентификации дикторов по их речи.
1.1 Обзор методов предобработки и представления речевого сигнала используемых
для решения задачи идентификации дикторов.
1.1.1 Математическое описание сигнала.
1.1.2 Спектральное представление дискретное преобразование Фурье.
1.1.3 Коэффициенты линейного предсказания КЛП.
1.1.3.1 Автокорреляционный метод
1.1.3.2 Ковариационный метод
1.1.4 Гомоморфная обработка речи. Кспстралыюс представление.
1.1.5 Психоакустика. Мел, Барк шкалы
1.1.6 Мелспектры2
1.1.7 Формантные характеристики.
1.2 Обзор и анализ математической модели и методов решения задачи идентификации диктора .,.
1.2.1 Методы идентификации диктора по произвольному текстуТТГГГГЗО
1.2.1.1 Векторное квантование ВК
1.2.1.2 Гауссовы смеси.3
1.2.1.3 Методы нормализации характеристик.
1.3 Недостатки и направление их разрешения.
1.4 Постановка задачи исследования.
2 Построение пространства формантных наборов и математической модели голоса диктора, использующей формантные наборы
2.1 Построение пространства формантных наборов.
2.2 Построение метрики для сравнения формантных наборов
2.3 Нахождение центральных формантных наборов, для последовательностей специального вида
2.4 Построение методов работы с множествами формантных наборов
2.4.1 Методы нахождения расстояний между множествами формантных наборов
2.4.2 Первый метод вычисления подмножества.
2.4.3 Второй метод вычисления подмножества.
3 Построение математических моделей голоса диктора и робастных алгоритмов текстонезависимой идентификации дикторов
3.1 Математические модели индивидуальности голоса диктора, не учитывающие
динамических характеристик
3.1.1 Первый метод тестонезависимой идентификации дикторов по их речи
3.1.2 Второй метод тестонезависимой идентификации дикторов по их речи
3.2 Математическая модель индивидуальности голоса диктора учитывающая
динамические характеристики
3.3 Третий метод тестонезависимой идентификации дикторов по их речи
Выводы.
4 Практическая реализация и анализ разработанных методов.
4.1 Описание алгоритмов вычисления расстояния
4.2 Сравнение временных характеристик алгоритмов вычисления расстояния.
4.3 Описание программной реализации
4.4 Сравнение робастности описанных и стандартных методов текстонезависимой
идентификации дикторов.
Выводы.
Заключение.
Литература


Производится сравнение временных характеристик построенных алгоритмов вычисления расстояния между формантными наборами. Показывается, что при плохой реализации алгоритма увеличение времени вычисления расстояния, по сравнению с наилучшей из предложенных, может достигать 0 раз. Для практической проверки свойства робастности, производится сравнение точности работы построенных методов с существующим методом, основанным на гауссовых смесях. Описывается методика проведения тестирования. Показывается, что третий из построенных методов при соотношении сигнал/шум хуже дБ, показывает точность, значительно превосходящую точность существующих методов, в том числе широко используемого метода, основанного на гауссовых смесях. В заключении обобщены итоги и результаты проведенных исследований. Данная глава посвящена обзору и анализу методов текстонезависимой идентификации дикторов. В первой части главы рассматриваются различные преобразования речевого сигнала, используемые при решении задачи текстонезависимой идентификации дикторов. Описаны как такие широко используемые преобразования, как преобразование Фурье, переводящее сигнал в последовательность спектров мощности, так и менее известные преобразования, основанные на линейном предсказании и гомоморфной обработке сигналов. Так же описаны методы вычисления мел спектров, основанные на свойствах восприятия звуковых сигналов. Рассмотрены формантные характеристики речевого сигнала. Отмечено свойство робастности, успешно используемое в криминалистической фоноскопической экспертизе. Второй пункт главы посвящен обзору и анализу математических моделей и методов решения задачи тскстонезависимой идентификации диктора. В начале пункта описано понятие задачи распознавания образов, определены компоненты методов тскстонезависимой идентификации дикторов. Рассмотрены методы, основанные как на идеях векторного квантования, так и на идеях теории вероятности. Для каждого из методов описаны решающие правила и процедуры обучения. В третьем пункте произведен анализ существующих методов текстонезависимой идентификации дикторов. Сформулированы основные недостатки данных методов. Предложены пути разрешения описанных недостатков. Произведен анализ путей разрешения недостатков с точки зрения эффективности получаемого результата. На основании третьего, в четвертом пункте производится постановка задачи исследования. Формулируется основная задача исследования, на основании которой ставятся частные задачи исследований, последовательное решение которых позволит достичь основной цели исследования. В данном пункте производится краткий обзор основных методов преобразования речевых сигналов используемые при решении задачи идентификации дикторов по их речи. Целью этих преобразований является получения характеристик более высокого уровня, чем оцифрованных речевой сигнат. Мате. Под сигналом понимают физический процесс (например, изменяющееся во времени напряжение), отображающий некоторую информацию или сообщение. Математически сигнал описывается функцией определенного типа. Одномерные сигналы описываются вещественной или комплексной функцией ха(0, определенной на интервале вещественной оси (обычно — оси времени) *'<*? Аналоговые сигналы (ЛС) описываются непрерывной (или кусочно-непрерывной) функцией ха(1), причем сама функция и аргумент / могут принимать любые значения на некоторых интервалах х'а<х„<с”а, /'<г<Л Пример АС: ха({) = Ае'а‘, А = 1. Дискретные сигналы (ДС) описываются решетчатыми функциями — последовательностями— х(пТ), где 7=соп$1 — интервал дискретизации, п—целое, л=0,1,2,. Т) может в дискретные моменты пТ принимать произвольные значения на некотором интервале. Эти значения функции называются выборками, или отсчетами функции. Другим обозначением решетчатой функции х(пТ) является х(п), или хп. На рисунке 1. Примером применения дискретных сигналов являются системы с амплитудноимпульсной модуляцией. Последовательность х(пТ) может быть и конечной, состоящей из определенного конечного числа отсчетов, например из трех отсчетов: *(0)=1, х(7)=-2, х(2Т)-3; конечную последовательность можно записать в форме х(пТ)={> -2,3}.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.237, запросов: 244