+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Методы и модели распознавания русской речи в информационных системах

  • Автор:

    Гусев, Михаил Николаевич

  • Шифр специальности:

    05.13.01

  • Научная степень:

    Докторская

  • Год защиты:

    2014

  • Место защиты:

    Санкт-Петербург

  • Количество страниц:

    378 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы


Введение
Глава I. Основные методы, модели и алгоритмы распознавания речи
1.1 Классификация систем распознавания речи
1.2 Этапы распознавания речи
1.2.1 Членение речевого потока
1.2.2 Вычисление акустических признаков
1.2.3 Сравнение со звуковыми моделями
1.2.4 Способы определения произнесения слов не из словаря системы
1.2.5 Языковые модели
1.3 Выбор структуры системы
1.4 Выводы
Глава 2. Построение моделей звуков речи и подготовка речевых баз
2.1 Модели звуков речи
2.1.1 Классификация звуков речи
2.1.2 Именование звуков речи
2.1.3 Структура скрытых Марковских моделей звуков речи
2.1.4 Оптимизация структур моделей звуков речи
2.1.5 Результаты моделирования
2.2 Аннотирование речевой базы
2.2.1 Основные этапы формирования аннотации
2.2.2 Подготовительный этап
2.2.3 Формирование идеальных транскрипций
2.2.4 Предварительное обучение системы распознавания
2.2.5 Транскрипционное моделирование
2.2.6 Циклический этап
2.2.7 Коррекция границ звуков
2.2.8 Завершающий этап
2.2.9 Особенности предложекнного способа
2.3 Экспериментальная проверка
2.4 Выводы

Глава 3. Статистическая модель речи
3.1 Альтернативы
3.2 Сущность статистической модели
3.2.1 Общие положения
3.2.2 Общая структура статистической модели
3.3 Реализация статистической модели речи
3.3.1 Генерация последовательностей
3.3.2 Статистика о составе населения и ТД
3.3.3 Генерация выборки звуков
3.3.4 Определение длительностей звуков
3.3.5 Наложение интонационных контуров
3.4 Звуковые базы
3.4.1 Аллофонная звуковая база
3.4.2 Базы слитной речи
3.5 Особенности статистической модели
3.6 Области применения
3.6.1 Синтез речи
3.6.2 Оценка качества речевых сигналов
3.6.3 Исследование свойств речевых сигналов
3.7 Выводы
Глава 4. Моделирование длительности звуков речи
4.1 Основные причины вариативности длительности звуков
4.2 Зависимость вероятности появления фонем от их длительности
4.3. Учет длительностей в алгоритме распознавания
4.4 Оптимизация процесса распознавания
4.5 Результаты экспериментов
4.6 Развитие модели
4.7 Результаты экспериментов на расширенной модели
4.8 Выводы
Глава 5. Психоакустическая модель

5.1 Свойства звуковых сигналов и особенности их восприятия
5.1.1 Чувствительность слухового анализатора
5.1.2 Амплитудное распределение
5.1.3 Временные свойства слухового анализатора
5.1.4 Эффекты маскировки и критические полосы слуха
5.1.5 Временные характеристики речевого сигнала
5.2 Реализация психоакустической модели
5.3 Применение психоакустической модели в распознавании речи
5.4 Выводы
Глава 6. Речевая аналитика
6.1 Возможные подходы к построению системы
6.2 Основные элементы разработанной системы поиска ключевых слов
6.3 Минимизация фонетической сети
6.4 Режимы работы системы
6.5 Критерии оценки качества системы
6.6 Результаты тестирования
6.7 Выводы
Глава 7. Оценка.качества передачи речевых сигналов
7.1 Классификация методов оценки качества звука
7.2 Обоснование необходимости разработки новых методов
7.3 Метод А(2иА
7.4 Метод А
7.5 Метод КесЦиа1
7.6 Выводы
Заключение
Основные сокращения
Основные термины
Использованная литература

Нейронная сеть может рассматриваться как граф с взвешенными связями, в котором нейроны являются узлами. Но не всякое соединение нейронов работоспособно и целесообразно. Существует несколько работающих и реализованных программно архитектур нейронных сетей (рисунок 1.5). По архитектуре связей нейронные сети могут быть разделены на два класса: сети прямого распространения и рекуррентные сети. Графы сетей прямого распространения не содержат петель, соответственно, рекуррентные сети - это сети с обратными связями.
Сети прямого распространения подразделяются на однослойные и многослойные персептроны, а также на сети радиальных базисных функций. Нейронная сеть состоит из входного слоя и выходного слоя. Дополнительно в сети могут присутствовать так называемые скрытые слои. Нейроны скрытых слоев не имеют непосредственных входов исходных данных, их выходы связаны только с входами нейронов выходного и скрытых слоев. Скрытые слои выполняют дополнительное преобразование информации, увеличивая нелинейность модели.
В персептронах каждый нейрон использует пороговую или сигмоидальную функцию активации. Доказано, что многослойный персептрон может формировать сколь угодно сложные границы принятия решения и реализовывать произвольные булевы функции [163].

Рекомендуемые диссертации данного раздела

Время генерации: 0.143, запросов: 967