Математические модели и комплекс программ для автоматического распознавания дикторов

Математические модели и комплекс программ для автоматического распознавания дикторов

Автор: Адель Саллам Мохамед Хайдер

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Санкт-Петербург

Количество страниц: 216 с. ил.

Артикул: 2634958

Автор: Адель Саллам Мохамед Хайдер

Стоимость: 250 руб.

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. Обзор методов и систем распознавания дикторов.
1.1. Классификация систем определения индивидуальности говорящего по речи
1.1.1. Идентификация и верификация.
1.1.2. Групповая идентификация.
1.1.3. Текстозависимые и тскстонсзависимые распознавание.
1.1.4. Автоматические и экспертные системы.
1.2. Научная сторона проблемы.
1.2.1. Различительные признаки.
1.2.2. Способы описания речевого сообщения в целом.
1.2.3. Проблема эталона и его обновление.
1.2.4. Решающие правила
1.2.5. Шумы, помехи, искажения.
1.3. Критерии эффективности систем верификации
1.4. Обзор современных программных продуктов
1.4.1. V
1.4.2. I.
1.4.3. V
1.4.4. .
1.5. Основные проблемы создания систем распознавания дикторов.
1.6. Выводы.
ГЛАВА 2. Методы построения признаковых описаний в задаче автоматического распознавания дикторов
2.1. Ввод речи и ее цифровое представление
2.2. Предварительная обработка и выделение первичных признаков.
2.2.1. Дискретное преобразование Фурье.
2.2.2. Цифровые фильтры
2.2.3. Использование оконных функций.
2.3. Нормализация уровня сигнала
2.4. Выделение границ фразы
2.5. Методы получения признакового описания сигнала
2.5.1. Спектральные методы
2.5.2. Коэффициенты линейного предсказания
2.5.3. Кепстральное описание
2.6. Выделение наиболее информативных характеристик
2.6.1. Последовательный прямой поиск ППП
2.6.2. Последовательный обратный поиск ПОП
2.7. Выводы
ГЛАВА 3. Основные математические модели принятия решений
в задачах распознавания дикторов.
3.1. Системы распознавания дикторов, основанные на сопоставлении с эталонами
3.2. Мера сходства речевого сигнала с эталоном.
3.2.1. Статистический подход
3.2.2. Некоторые меры сходства
3.3. Линейное выравнивание времени.
3.4. Алгоритм динамического искажения времениДИВ.
3.4.1. Описание алгоритма ДИВ.
3.4.2. Принцип оптимизации Веллмана и Динамическое программирование
3.4.3. Симметричный алгоритм ДИВ
3.4.4. Алгоритм поиска глобального наименьшего маршрута
3.4.5. Ассиметричный алгоритм ДИВ.
3.5. Скрытые марковские модели.
3.5.1. Статистическое распознавание речи
3.5.2. Структура системы распознавания СММ
3.5.3. Вычисление вероятности появления последовательности наблюдений в СММ
3.5.4. Обучение СММ.
3.5.5. Распознавание при помощи СММ
3.5.6. Архитектура системы распознавания дикторов
на основе СММ.
3.6. Нейронные сети
3.6.1. Алгоритм обратного распространения ошибки
3.6.2. Алгоритм обучения
3.6.3. Полносвязная нейронная сеть
3.6.4. Нейронная сеть с локальными связями
3.7. Векторное квантование и построение кодовой книги при решении задач текстонезависимой верификацииидентификации
3.7.1. Меры искажения.
3.7.2. Алгоритмы построения эталона.
3.7.3. Идентификация по кодовой книге.
3.8. Выводы
ГЛАВА 4. Модели устранения влияния шумового окружения в задачах распознавания дикторов.
4.1. Классификация помех в речевом канале
4.2. Методы оптимальной фильтрации в задаче подавления стационарных шумовых помех
4.3. Спектральное вычитание
4.3.1. Метод
4.3.2. Описание алгоритма.
4.4. Методы адаптивной фильтрации в задаче шумоочистки
речевых сигналов.
4.5. vпрсобразованис в задаче шумоочистки
речевых сигналов.
4.5.1. Использование дискретного вейвлетпреобразования для подавления шумов в речевом сигнале
4.5.2. Совместное использование вейвлетпреобразования и оптимальной фильтрации
4.6. Выводы
ГЛАВА 5. Экспериментальные исследования
5.1. Цели и задачи экспериментов
5.2. Исследование методов верификации дикторов на основе использования нейронных сетей.
5.2.1. Общая схема разработанной системы верификации для НС
5.2.2. Выбор речевых характеристик.
5.2.3. Выделение наиболее информативных фарактеристик
5.2.4. Исследование структуры НС.
5.2.5. Исследование влияния размера входного слоя НС.
5.3. Исследование свойств алгоритмов динамического
искажения времени ДИВ
5.3.1. Выбор метрики расстояния
5.3.2. Исследование влияния параметра степени искажения
ДИВ на качество верификации
5.3.3. Исследование методов параметризации речевых сигналов
на основе алгоритма динамического искажения времени
5.4. Экспериментальное исследование верификации дикторов на основе использования скрытых марковских моделей СММ
5.4.1. Выходные параметры системы НММ Viii.
5.4.2. Оценка эффективности системы верификации критерий принятия решения в системе НММ Viii
5.4.3. Исследование методов уменьшения числа гипотез при
работе алгоритма Витерби.
5.4.4. Выбор топологии СММ.
5.4.5. Исследование влияния числа итераций при обучении на качество верификации
5.5. Результаты исследования идентификации дикторов на основе использования векторного квантования ВК
5.5.1. Исследование зависимости времени работы алгоритмов идентификации и построения кодовой книги от ее размера.
5.6. Сравнительные результаты тестирования различных систем верификации дикторов
5.7 . Исследование влияния шумовых помех на эффективность
распознавания дикторов.
5.8. Выводы
ГЛАВА 6. Разработка программного обеспечения для решения
задач распознавания дикторов.
6.1. программа для верификации дикторов
на основе модели нейронной сети
6.2. программа для исследования моделей динамического искажения времени
6.3. НММ Viii программа для моделирования распознавания дикторов на основе использования скрытых марковских моделей.
6.4. Реализация системы V ii для автоматической идентификации диктора на основе векторного квантования.
6.4.1. Особенности реализации.
6.4.2. Пользовательский интерфейс
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Наиболее типичная стратегия текстозависимой верификации диктора состоит в том, чтобы создать эталонный файл речевых сигналов в функции времени для каждого пользователя, а затем в процессе верификации сравнивать параметры речи неизвестного говорящего с параметрами эталона в эквивалентных точках временной оси. Это означает, что входной речевой сигнал, соответствующий голосу неизвестного диктора, совмещается во времени с предлагаемым системой эталонным сигналом, а затем вычисляется расстояние между соответствующими точками на оси времени, которое усредняется по всему речевому фрагмента. Такой подход очень похож на текстосвободную верификацию, за исключением того, что отождествляемый фрагмент речи фиксирован и, следовательно, усредненные по времени статистические характеристики гораздо более устойчивы по сравнению со случаем неопределенных речевых фрагментов. Все перечисленные выше виды задач верификации и идентификации могут быть разбиты на два больших класса в зависимости от используемого речевого материала текстозависимые и текстонезависимые . Разница между этими двумя классами заключается в том, является ли идентифицируемый речевой отрезок лингвистически идентичным эталонному или нет. Очевидно, что совпадение лингвистической формы 2х сравниваемых речевых сообщений облегчает процесс идентификации верификации. Однако в практических задачах такое противопоставление не является абсолютным. Вопервых, сами анализируемые сообщения могут быть достаточно продолжительными, для того, чтобы в них можно было выбрать лингвистически идентичные отрезки. Вовторых, сама процедура идентификации говорящего может оказаться принципиально текстонезависимой, хотя и опираться на идентичные по своей структуре речевые отрезки. Последняя ситуация характерна для коммерческих систем, использующих так называемые процедуры с подсказкой. В этом случае пользователь использует для вхождения в систему парольные слова, подсказываемые ему системой, но сама система из соображений экономии вычислительных мощностей а, следовательно, и времени реакции использует упрощенные текстонезависимые процедуры. По способу решения задачи идентификации могут быть разделены на автоматические системы и субъективные экспертные. Экспертные методы исходно появились в связи с присущей человеку способностью различать индивидуальные голоса . Преимуществом слухового анализа является то, что способность к определению индивидуальности на слух является имманентно присущей рсчеслуховой системе человека. К сожалению, психоакустических работ, связанных с анализом этой особенности человека очень мало. Скорее всего, анализ знакомых и незнакомых голосов использует разные процедуры. Более того, соответствующие центры в мозгу находятся в разных полушариях. Кроме того, дискриминационные возможности слуховой системы вопреки имеющемуся мнению относительно индивидуальных характеристик весьма ограничены. Слуховая система использует различительные признаки, отличающиеся от тех, которые используются большинством автоматических систем. Голоса, очень похожие субъективно, хорошо различаются автоматическими системами, и наоборот. В практических задачах может быть использована двухступенчатая процедура идентификации говорящего . На первом этапе автоматическая система производит отсев кандидатов, не допуская при этом ошибок второго рода пропуска цели. Тем самым сокращается объем работы эксперта по слуховому анализу для окончательного решения. При этом сохраняется возможность сравнивать по субъективным различительным признакам голоса плохо различимые системой автоматической идентификации говорящего. Речеслуховая система для идентификации говорящего использует, как правило, яркие отличительные черты, характерные именно дзя данного индивидуума. Для систем автоматической идентификации характерен статистический подход, который не адекватен невероятностным различительным признакам наличие какойлибо патологии голоса или речи, яркие акцентные или диалектные черты, заикание и т. При этом следует отметить, что речеслуховая система использует параллельно и индивидуальные признаки речевого сигнала, имеющие вероятностный характер высота голоса, тембр, т.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.234, запросов: 244