Диссертация на тему "Методы, алгоритмы и программы решения задач идентификации языка и диктора", скачать бесплатно автореферат по специальности 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Содержание
Введение
1 Методология обработки речевого сигнала
1.1 Общая схема обработки речевого сигнала
1.2 Акустические характеристики и особенности речевых сигналов .
1.3 Особенности описания речевых сигналов для их идентификации
1.3.1 Модель речеобразования
1.3.2 Статистические свойства речевого сигнала
1.4 Анализ методов распознавания речи, языка и диктора
1.4.1 Акустико-фонетический подход
1.4.2 Подход с точки зрения распознавания образов
1.4.3 Подход с точки зрения исусственного интеллекта
1.5 Методы выделения акустических признаков
1.5.1 Модель банка фильтров
1.5.2 Коэффициенты линейного предсказания
1.6 Кепстральные коэффициенты
1.6.1 Строение человеческого уха
1.6.2 Методы шкалирования полос
1.6.3 Спектральные огибающие
1.6.4 Кепстральная обработка речевого сигнала
1.6.5 Анализ акустических вариаций в речевых сообщениях
1.6.6 Способы компенсации длины речевого тракта

1.7 Выводы
2 Математические методы и алгоритмы, используемые для распознавания речи и диктора
2.1 Скрытые Марковские Модели
2.1.1 Математическое описание Скрытых Марковских Моделей .
2.1.2 Основный задачи, решаемые с помощью Скрытых Марковских Моделей
2.1.3 Алгоритмы решения основных задач, связанных с НММ
2.2 Методы распознавания диктора
2.2.1 Метод распознавания диктора, основанный на SVM
2.2.2 Базовая модель SVM
2.2.3 Метод SVM с ядрами
2.2.4 Метод SVM со штрафами
2.2.5 Подбор параметров распознавателя
2.2.6 Фишеровские ядра
2.3 Метод, основанный на дикторонезависимых признаках
2.3.1 Auditory Image Model
2.3.2 Расширение Грам-Шарлье
2.3.3 Алгоритм получения признаков
2.4 Выводы
3 Реализация системы идентификации языка и диктора
3.1 Общий вид системы идентификации языка и диктора
3.2 Архитектура программной реализации
3.3 Применение параллельных вычислений в задаче идентификации языка и диктора
3.4 Особенности конвейерной обработки речевого сигнала

3.5 Архитектура вычислительного комплекса
3.6 Выводы
4 Результаты экспериментов но распознаванию диктора и
моделированию речевых признаков
4.1 Данные и описание экспериментов моделирования на Фишеровских признаках
4.1.1 Обсуждение результатов
4.2 Результаты экспериментов по AIM
4.2.1 Монте - Карло эксперименты
4.2.2 Эксперименты с реальными данными
4.3 Способы определения языка по искаженному сообщению
4.3.1 Использования SVM для идентификации языка
4.3.2 Результаты экспериментов. Тексты
4.3.3 Результаты экспериментов. Речь
4.4 Выводы
Заключение
Список рисунков
Список таблиц
Литература

состоит из ушной раковины и слухового прохода. Звуковые волны проходят через наружное ухо к среднему уху. Среднее ухо состоит из барабанной перегородки, с которой сталкивается звуковая волна и заставляет её колебаться, и из трёх слуховых косточек (молоточка, наковальни и стремечка), которые преобразуют звуковые колебания в механические, одновременно усиливая их. Внутреннее ухо состоит из преддверия, улитки и полукружных каналов. Улитка представляет собой заполненный жидкостью канал, разделённый базальной мембраной. Механические колебания, сталкиваясь с овальным окном в преддверии, создают стоячие волны в жидкости внутри улитки, что заставляет базальную мембрану колебаться на частотах, соизмеримых с частотами входного сигнала, в местах связанных с этими частотами. Применение модели человеческого уха будет описано в главе 2.
1.6.2 Методы шкалирования полос
Использование банка фильтров обосновывается необходимостью моделирования процессов, происходящих в улитке внутреннего уха, которая ведёт себя как набор пересекающихся частотных фильтров. Полоса пропускания каждого фильтра называется критической полосой [28]. Два чистых звука называют лежащими в одной критической полосе, если они расположены так близко друг к другу, что существует значительное пересечение в их амплитудных огибающих в базальной мембране.
Для построения моделей перцепции, основанных на физиологии акустического восприятия человеческим ухом, были предложены две шкалы, позволяющие ввести некоторые характеристики, используемые для идентификации речи.
Шкала барков была предложена Эберхардом Цвикером и названа в
честь Генриха Баркхаузена [28]. Эта шкала является попыткой описать
, 4 ‘ *• {

Название работы	Автор	Дата защиты
Математическое и программное обеспечение составления расписания учебных занятий на основе агрегативных генетических алгоритмов	Низамова, Гузель Фанисовна	2006
Анализ использования ресурсов встроенных систем реального времени на основе графических спецификаций	Леонтьев, Андрей Евгеньевич	2005
Методы и алгоритмы поддержки процессов жизненного цикла программного продукта с большим количеством профессиональных пользователей	Бирюкова, Анна Алексеевна	2014

Электронная библиотека диссертаций

Методы, алгоритмы и программы решения задач идентификации языка и диктора

Рекомендуемые диссертации данного раздела