+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Методы, алгоритмы и программы решения задач идентификации языка и диктора

  • Автор:

    Ермилов, Алексей Валерьевич

  • Шифр специальности:

    05.13.11

  • Научная степень:

    Кандидатская

  • Год защиты:

    2014

  • Место защиты:

    Москва

  • Количество страниц:

    135 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Содержание
Введение
1 Методология обработки речевого сигнала
1.1 Общая схема обработки речевого сигнала
1.2 Акустические характеристики и особенности речевых сигналов .
1.3 Особенности описания речевых сигналов для их идентификации
1.3.1 Модель речеобразования
1.3.2 Статистические свойства речевого сигнала
1.4 Анализ методов распознавания речи, языка и диктора
1.4.1 Акустико-фонетический подход
1.4.2 Подход с точки зрения распознавания образов
1.4.3 Подход с точки зрения исусственного интеллекта
1.5 Методы выделения акустических признаков
1.5.1 Модель банка фильтров
1.5.2 Коэффициенты линейного предсказания
1.6 Кепстральные коэффициенты
1.6.1 Строение человеческого уха
1.6.2 Методы шкалирования полос
1.6.3 Спектральные огибающие
1.6.4 Кепстральная обработка речевого сигнала
1.6.5 Анализ акустических вариаций в речевых сообщениях
1.6.6 Способы компенсации длины речевого тракта

1.7 Выводы
2 Математические методы и алгоритмы, используемые для распознавания речи и диктора
2.1 Скрытые Марковские Модели
2.1.1 Математическое описание Скрытых Марковских Моделей .
2.1.2 Основный задачи, решаемые с помощью Скрытых Марковских Моделей
2.1.3 Алгоритмы решения основных задач, связанных с НММ
2.2 Методы распознавания диктора
2.2.1 Метод распознавания диктора, основанный на SVM
2.2.2 Базовая модель SVM
2.2.3 Метод SVM с ядрами
2.2.4 Метод SVM со штрафами
2.2.5 Подбор параметров распознавателя
2.2.6 Фишеровские ядра
2.3 Метод, основанный на дикторонезависимых признаках
2.3.1 Auditory Image Model
2.3.2 Расширение Грам-Шарлье
2.3.3 Алгоритм получения признаков
2.4 Выводы
3 Реализация системы идентификации языка и диктора
3.1 Общий вид системы идентификации языка и диктора
3.2 Архитектура программной реализации
3.3 Применение параллельных вычислений в задаче идентификации языка и диктора
3.4 Особенности конвейерной обработки речевого сигнала

3.5 Архитектура вычислительного комплекса
3.6 Выводы
4 Результаты экспериментов но распознаванию диктора и
моделированию речевых признаков
4.1 Данные и описание экспериментов моделирования на Фишеровских признаках
4.1.1 Обсуждение результатов
4.2 Результаты экспериментов по AIM
4.2.1 Монте - Карло эксперименты
4.2.2 Эксперименты с реальными данными
4.3 Способы определения языка по искаженному сообщению
4.3.1 Использования SVM для идентификации языка
4.3.2 Результаты экспериментов. Тексты
4.3.3 Результаты экспериментов. Речь
4.4 Выводы
Заключение
Список рисунков
Список таблиц
Литература

состоит из ушной раковины и слухового прохода. Звуковые волны проходят через наружное ухо к среднему уху. Среднее ухо состоит из барабанной перегородки, с которой сталкивается звуковая волна и заставляет её колебаться, и из трёх слуховых косточек (молоточка, наковальни и стремечка), которые преобразуют звуковые колебания в механические, одновременно усиливая их. Внутреннее ухо состоит из преддверия, улитки и полукружных каналов. Улитка представляет собой заполненный жидкостью канал, разделённый базальной мембраной. Механические колебания, сталкиваясь с овальным окном в преддверии, создают стоячие волны в жидкости внутри улитки, что заставляет базальную мембрану колебаться на частотах, соизмеримых с частотами входного сигнала, в местах связанных с этими частотами. Применение модели человеческого уха будет описано в главе 2.
1.6.2 Методы шкалирования полос
Использование банка фильтров обосновывается необходимостью моделирования процессов, происходящих в улитке внутреннего уха, которая ведёт себя как набор пересекающихся частотных фильтров. Полоса пропускания каждого фильтра называется критической полосой [28]. Два чистых звука называют лежащими в одной критической полосе, если они расположены так близко друг к другу, что существует значительное пересечение в их амплитудных огибающих в базальной мембране.
Для построения моделей перцепции, основанных на физиологии акустического восприятия человеческим ухом, были предложены две шкалы, позволяющие ввести некоторые характеристики, используемые для идентификации речи.
Шкала барков была предложена Эберхардом Цвикером и названа в
честь Генриха Баркхаузена [28]. Эта шкала является попыткой описать
, 4 ‘ *• {

Рекомендуемые диссертации данного раздела

Время генерации: 0.122, запросов: 967