Методы и алгоритмы обработки, анализа речевого сигнала для решения задач голосовой биометрии

Методы и алгоритмы обработки, анализа речевого сигнала для решения задач голосовой биометрии

Автор: Соловьева, Елена Сергеевна

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Москва

Количество страниц: 149 с. ил.

Артикул: 4156988

Автор: Соловьева, Елена Сергеевна

Стоимость: 250 руб.

Методы и алгоритмы обработки, анализа речевого сигнала для решения задач голосовой биометрии  Методы и алгоритмы обработки, анализа речевого сигнала для решения задач голосовой биометрии 

Содержание
Список и обозначение аббревиатур.
Введение
Цель работы
Научная новизна
Практическая значимость работы.
Основные результаты работы.
Достоверность полученных результатов.
Апробации работы.
Глава 1. Г олосовая биометрия
1.1. Состояние и перспективы голосовой биометрии.
1.2. Области использования голосовой биометрии.
1.3. Коммерческие системы для решения задач голосовой биометрии
1.3.1. Коммерческие системы идентификации диктора и определения
акцента .
1.3.2. Коммерческие системы детектирования стресса.
1.3.3. Оценка технологии голосовых анализаторов стресса
1.4. Модели речеобразования
1.4.1. Линейная модсл ь
1.4.2. Нелинейная модель.
1.5. Основные подходы к идентификации диктора
1.6. Основные подходы к определению акцента
1.7. Основные подходы к определению антропометрических данных
1.7.1. Определение роста.
1.7.2. Определение пола
1.8. Основные методы исследования эмоциональной речи.
1.8.1. Субъективные методы.
1.8.2. Объективные методы
Выводы .
Глава 2. Алгоритмы для решения задач голосовой биометрии.
2.1. Идентификация диктора на основе технологии МГСС и УС.
2.1.1. Вычисление МЕСС векторов
2.1.2. Алгоритм квантования векторов.
2.2. Определение национальных особенностей диктора на основе скрытых
моделей Маркова.
2.3. Определение антропометрических характеристик диктора
2.3.1. Определение пола
2.3.2. Алгоритм определение роста
2.4. Определение психоэмоционального состояния.
2.4.1. Алгоритмы определения основного тона и его харакгеристик
2.4.2. Джиттер и шиммер
2.4.3. Расчет Формант
2.4.4. Нелинейный оператор ТЕО.
2.4.5. Однофакторный дисперсионный анализ АЫОУА
Выводы .
Глава 3. Программноаппаратный комплекс для решения задач голосовой
биометрии.
3.1. Назначение программноаппаратного комплекса.
3.1.1. Функциональное назначение
3.1.2. Основные компоненты системы
3.1.3. Основные функции.
3.1.4. Формат файлов
3.2. Общая схема программноаппаратного комплекса
3.3. Спецификация программных модулей системы
3.4. Условия использования программноаппаратного комплекса
3.4.1. Климатические условия эксплуатации.
3.4.2. Минимальный состав технических средств.
3.4.3. Минимальный состав программных средств.
3.4.4. Верификация и валидация системы
3.4.5. Инструментальные средства разработки и документирования
Выводы
Глава 4. Применение программноаппаратного комплекса для решения задач голосовой биометрии
4.1. Расчет характеристик голосового тракта с помощью 8ши1пк.
4.2. Идентификация диктора.
4.2.1. Идентификация диктора на основе формантных частот
4.2.2. Идентификация диктора на основе МРСС и У2.
4.3. Определение национальных особенностей диктора.
4.3.1. Классификация акцента на основе формантного анализа
4.3.2. Определение национальных особенностей диктора на основе
Скрытых Моделей Маркова.
4.4. Определение антропометрических характеристик диктора.
4.4.1. Определение пола дикторов.
4.4.2. Определение роста диктора на основе расчета акустических
характеристик голосового тракта.
4.4.3. Автоматическое определение роста диктора
4.4.4. Оценка точности работы модуля антропометрии.
4.5. Определение психоэмоционального состояния
4.5.1. Определение психоэмоционального состояния на основе расчета
основного тона
4.5.2. Определения психоэмоционального состояния с помощью
классификатора с несколькими входными параметрами
4.6. Автоматическая экспертная оценка записи
Выводы .
Заключение.
Список используемой литературы


С помощью однофакторного дисперсионного анализа выявлен эффективный набор речевых характеристик для определения психоэмоционального состояния диктора. Предложен оптимальный набор параметров классификатора психоэмоционального состояния на основе многослойного перцептрона. Предложен алгоритм для определения пола диктора, использующий значения Q (квантиль %) по гистограмме частоты основного тона (ЧОТ). Разработанный программно-аппаратный комплекс обеспечивает, как ручную расстановку меток фонем, так и автоматическую на основе метода Learning Vector Quantization (LVQ). Для определения роста разработан алгоритм на основе Mel frequency cepstral coefficients (MFCC векторов), квадратичной регрессии и сингулярного разложения. Определены фонемы гласных, дающие точность, достаточную для оценки роста. Предложенные методики сбора речевых баз данных и предобработки записей речевого сигнала позволяют выделять значимые участки речи и могут быть использованы для решения задач голосовой биометрии. Разработанный программно-аппаратный комплекс для регистрации, обработки и анализа речевого сигнала может быть использован для идентификации человека, а также определения его антропометрические характеристики, акцента/диалекта и психоэмоционального состояние. Разработана методика сбора голосовых баз данных и предобработки записей речевого сигнала для выделения информативных участков голосового сигнала на основе использования фонетически сбалансированных слов и фонемной разметки. Предложен эффективный набор речевых характеристик п оптимальный набор параметров классификаторов, обеспечивающий надежное использование системы для идентификации диктора, определения его акцента, антропометрических характеристик и психоэмоционального состояния. Показана невозможность использования формантного анализа и нейросетевых классификаторов в задачах классификации акцента и идентификации дикторов, так как 2-х слойные сети эффективны на небольших (до - человек) выборках. Однако, затем процент правильной классификации снижается до -%. В результате проведенных исследований реализован программно-аппаратный комплекс с использованием полученных в диссертационной работе мегодов и алгоритмов, позволяющий решать задачи голосовой биометрии. Проведено тестирование разработанных методов и алгоритмов на доступных базах. При идентификации диктора на базе данных из 8 человек, состоящей из звуковых записей, записанных с помощью одного и того же оборудования и в одинаковых акустических условиях, точность составила ,6 %. Удалось увеличить точность на 7-% по сравнению с системами, использующими характеристик речи, которые подвержены влиянию психоэмоционального состояния человека. Точность определения пола по микрофонным записям составила . Наиболее хорошо распознаются программой нейтральное состояние и эмоции гнева, их процент распознавания составляет для обучающей выборки . Рис. Достоверность полученных результатов подтверждается тестированием программы на доступных базах данных, подтвердившим надежность разработанных методов и алгоритмов. XX съезде Физиологического общества им. И.П. The 4th Russian-Bavarian Conference on Bio-Medical Engineering, , Moscow. Глава 1. Биометрической характеристикой человека (БХЧ) называется его измеряемая физическая характеристика или персональная поведенческая черта. Считается, что идеальная БХЧ должна быть универсальной, уникальной, постоянной и собираемой. Универсальность - возможность представления человека одной характеристикой. Уникальность (различимость) означает, что не должно быть двух человек с идентичными характеристиками. Постоянство (перманентность) - характерист ика не должна изменяться со временем. Собираемость (измеряемость) - возможность быстро и легко получить и детализировать характеристику от индивидуума. Перечисленные выше БХЧ используются в системах для идентификации или верификации человека. Рис. Наибольшее распространение получили системы идентификации по отпечаткам пальцев, но в последние годы наблюдается повышенный интерес к голосовой биометрии. Идентификация отличается от верификации.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.287, запросов: 244