Модели речевых сигналов для аутентификации личности по голосу

Модели речевых сигналов для аутентификации личности по голосу

Автор: Голубинский, Андрей Николаевич

Шифр специальности: 05.13.18

Научная степень: Докторская

Год защиты: 2010

Место защиты: Воронеж

Количество страниц: 411 с. ил.

Артикул: 4928228

Автор: Голубинский, Андрей Николаевич

Стоимость: 250 руб.

Модели речевых сигналов для аутентификации личности по голосу  Модели речевых сигналов для аутентификации личности по голосу 

ВВЕДЕНИЕ
ГЛАВА 1. МЕТОДЫ И МАТЕМАТИЧЕСКИЕ МОДЕЛИ АНАЛИЗА
РЕЧЕВЫХ СИГНАЛОВ В ЗАДАЧАХ АУТЕНТИФИКАЦИИ
ЛИЧНОСТИ
1.1. Системы биометрической аутентификации, особенности идентификации и верификации личности по голосу
1.2. Речевая наука, речевые технологии и системы биометрической аутентификации по голосу.
1.3. Подходы к построению математических моделей речевых сигналов в задачах аутентификации личности по голосу.
Выводы к главе 1
ГЛАВА 2. МЕТОД СИНТЕЗА И АНАЛИЗА МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ ТЕОРИИ
МОДУЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ ДЕТЕРМИНИРОВАННОГО ПОДХОДА .
2.1. Детерминированная математическая модель речевого сигнала, сущность метода синтеза и анализа на основе модуляционной теории
2.2. Математическая модель речевого сигнала в виде импульса АМколебания с несколькими несущими частотами.
2.3. Математическая модель речевого сигнала в виде амплитудномодулированного импульса с
полигармоническими несущим и модулирующим колебаниями.
2.4. Математическая модель речевого сигнала, основанная на аппроксимации спектра набором постоянных составляющих в соответствующих полосах частот.
2.5. Обобщенная математическая модель речевого сигнала в виде импульса колебания с амплитудночастотной модуляцией .
2.6. Метод выделения модулирующего колебания из огибающей речевого сигнала
Выводы к главе
ГЛАВА 3. МЕТОД СИНТЕЗА И АНАЛИЗА МАТЕМАТИЧЕСКИХ
МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ ТЕОРИИ
МОДУЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ СТОХАСТИЧЕСКОГО ПОДХОДА
3.1. Обоснование и сущность метода синтеза и анализа стохастической модуляционной математической модели речевого сигнала
3.2. Математическая модель речевого сигнала в виде импульса АМколебания с несколькими несущими частотами и случайными начальными фазами
3.3. Математическая модель речевого сигнала в виде амплитудномодулированного импульса с
полигармоническими несущим и модулирующим колебаниями при случайных начальных фазах.
3.4. Математическая модель речевого сигнала в виде суммы квази детерминированного случайного процесса и белого шума с ограниченным по полосе частот спектром
3.5. Математическая модель речевого сигнала в виде суммы квазидстерминированного случайного процесса и процесса авторегрессии
3.6. Модель авторегрессии с постоянными коэффициентами для вокализованного речевого сегмента после предварительной фильтрации
Выводы к главе
ГЛАВА 4. МЕТОДЫ РАСЧЕТА ПАРАМЕТРОВ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РЕЧЕВОГО СИГНАЛА, ПОСТРОЕННЫХ НА ОСНОВЕ ТЕОРИИ МОДУЛЯЦИИ .
4.1. Метод и характеристики аналитического расчета амплитудных параметров математических моделей
речевого сигнала, построенных на основе теории модуляции.
4.2. Методы оценки частоты основного тона речевого сигнала
4.2.1. Алгоритмы оценки частоты основного тона
речевого сигнала модифицированных
корреляционного и спектрального методов.
4.2.2. Метод, алгоритм и характеристики оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции при использовании полигармонической математической модели
4.2.3. Оценка частоты основного тона и е
характеристики методом максимального
правдоподобия при известных амплитудах и начальных фазах несущих гармоник
4.2.4. Оценка частоты основного тона и е
характеристики методом максимального
правдоподобия при неизвестных амплитудах и начальных фазах несущих гармоник
4.3. Метод и характеристики оценки формантных частот речевого сигнала на основе его полигармонической математической модели
Выводы к главе 4
ГЛАВА 5. ПРОВЕРКА АДЕКВАТНОСТИ МАТЕМАТИЧЕСКОЙ МОДЕЛИ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ
ЭКСПЕРИМЕНТАЛЫ1ЫХ ДАННЫХ .
5.1. Методика проверки математической модели речевого
сигнала на адекватность экспериментальным данным .
5.2. Методы аналитического расчета весовых
коэффициентов меры различимости.
5.2.1. Метод на основе критерия минимизации
расстояния между своими и эталоном
5.2.2. Метод на основе критерия максимизации
расстояния между чужими и эталоном
5.2.3. Метод на основе критерия минимаксного
расстояния между своими, чужими и эталоном соответственно
5.3. Меры различимости речевых сигналов и оценка порога принятия решения для задач аутентификации личности по голосу применительно к полигармонической математической модели.
5.4. Алгоритмы функционирования систем аутентификации личности по голосу
5.4.1. Способ, алгоритмы и устройство системы верификации личности по голосу на основе математической модели речевого сигнала в виде импульса АМколебания с несколькими несущими частотами
5.4.2. Оценка качества работы системы верификации
личности по голосу.
5.4.3. Система идентификации личности по голосу, основанная на полигармонической математической
модели речевого сигнала.
Выводы к главе 5.
ЗАКЛЮЧЕНИЕ .
ПРИЛОЖЕНИЕ. Автокорреляционные функции и спектральные
плотности математических моделей речевого сигнала в виде импульса колебания с амплитудночастотной модуляцией
СПИСОК ЛИТЕРАТУРЫ


Однако они не используются при автоматической идентификации говорящего, что связано с недостатком знаний о том, как в речевом сигнале кодируется лингвистическая, смысловая информация, и где в этом коде допускаются сбои, связанные с индивидуальными особенностями. Рассмотрим индивидуальные характеристики, связанные со строением и функционированием речеобразующего аппарата, исходя из общепринятой акустической модели речеобразования 0,0. Прежде всего, это характеристики голосового источника и акустического фильтра артикуляторного тракта. Лингвистическая структура речевых звуков формируется акустическим фильтром, характеристические параметры которого определяются индивидуальными особенностями артикуляторного факта, а также положением активных артикуляторных органов. Функцией голосового источника считается только возбуждение звука в речеобразующем тракте. Все указанные параметры в лабораторных условиях показали высокую информативность в отношении определения индивидуальности говорящего. Сглаживающие усредняющие по нескольким периодам методы позволяют определить только среднюю частоту основного тона и в случае зашумленного канала например, телефонного не дают устойчивых результатов. Определение собственно формы артикуляторного тракта путем решения обратной задачи. Определение характеристических параметров, тем или иным способом связанных с акустическим фильтром. Этот подход является основным при построении систем идентификации говорящего. В этом случае привязка к форме артикуляторного тракта весьма условна, так как на самом деле анализируется форма речевой волны. На основании экспериментальных данных 1, основное проявление индивидуальности речи человека следует искать в двух основных группах признаков. Они связаны с анатомическими особенностями механизма речсобразования и уникальным характером приведения его в действие артикуляционной деятельностью, обусловленным работой центральной нервной системы. Первая группа признаков основывается на распространенной модели речевого тракта 4, состоящей из передаточной функции резонансной системы и генератора импульсов сигнала возбуждения. Основными параметрами выступают характеристики четырех формантных областей средняя частота, частотный диапазон, энергия, огибающая спектра, формантные траектории и производные от этих параметров. Частота возбуждающих импульсов зависит от длины, толщины и натяжения голосовых связок. Основными параметрами здесь являются частота основного тона ЧОТ, отношение тоншум, звонкость, подъем основного тона, а также производные от этих параметров. Если первая группа признаков отражает статические свойства речеобразующего тракта, то вторая группа призвана полностью описать его поведение во времени, то есть артикуляционную динамику речи. Базовым этапом в организации процесса речеобразования является управляемый центральной нервной системой человека синтез комплекса артикуляционных движений, соответствующего сообщению, передача которого планируется в данный момент времени 6. Таким образом, индивидуальный характер результата речевой активности определен уже на уровне синтеза артикуляционных программ комплексов правил произнесения определенных структур. Эти правила относятся к управлению просодическими характеристиками речи интонацией, ритмикой, громкостью, ударением. Решающими факторами этого процесса являются социально обусловленные речевые навыки говорящего, его индивидуальный опыт, темперамент, особенности характера, интеллект. Артикуляционная программа распространяется на такую смысловую единицу речи, как синтагма ритмикомслодическая единица речи, грамматически оформленная и выражающая в пределах более сложного целого например, предложения относительно законченную мысль. В рамках одной синтагмы выделяются супрасегментные характеристики или интонационные характеристики речевого потока. Основными параметрами здесь выступают интенсивность, мелодия или движение основного тона, система ударений, временные характеристики длительность сегментов, пауз, темпа, ритмическая картина речевой фразы.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.229, запросов: 244