Диссертация на тему "Методы и модели распознавания русской речи в информационных системах", скачать бесплатно автореферат по специальности 05.13.01 - Системный анализ, управление и обработка информации (по отраслям)

Введение
Глава I. Основные методы, модели и алгоритмы распознавания речи
1.1 Классификация систем распознавания речи
1.2 Этапы распознавания речи
1.2.1 Членение речевого потока
1.2.2 Вычисление акустических признаков
1.2.3 Сравнение со звуковыми моделями
1.2.4 Способы определения произнесения слов не из словаря системы
1.2.5 Языковые модели
1.3 Выбор структуры системы
1.4 Выводы
Глава 2. Построение моделей звуков речи и подготовка речевых баз
2.1 Модели звуков речи
2.1.1 Классификация звуков речи
2.1.2 Именование звуков речи
2.1.3 Структура скрытых Марковских моделей звуков речи
2.1.4 Оптимизация структур моделей звуков речи
2.1.5 Результаты моделирования
2.2 Аннотирование речевой базы
2.2.1 Основные этапы формирования аннотации
2.2.2 Подготовительный этап
2.2.3 Формирование идеальных транскрипций
2.2.4 Предварительное обучение системы распознавания
2.2.5 Транскрипционное моделирование
2.2.6 Циклический этап
2.2.7 Коррекция границ звуков
2.2.8 Завершающий этап
2.2.9 Особенности предложекнного способа
2.3 Экспериментальная проверка
2.4 Выводы

Глава 3. Статистическая модель речи
3.1 Альтернативы
3.2 Сущность статистической модели
3.2.1 Общие положения
3.2.2 Общая структура статистической модели
3.3 Реализация статистической модели речи
3.3.1 Генерация последовательностей
3.3.2 Статистика о составе населения и ТД
3.3.3 Генерация выборки звуков
3.3.4 Определение длительностей звуков
3.3.5 Наложение интонационных контуров
3.4 Звуковые базы
3.4.1 Аллофонная звуковая база
3.4.2 Базы слитной речи
3.5 Особенности статистической модели
3.6 Области применения
3.6.1 Синтез речи
3.6.2 Оценка качества речевых сигналов
3.6.3 Исследование свойств речевых сигналов
3.7 Выводы
Глава 4. Моделирование длительности звуков речи
4.1 Основные причины вариативности длительности звуков
4.2 Зависимость вероятности появления фонем от их длительности
4.3. Учет длительностей в алгоритме распознавания
4.4 Оптимизация процесса распознавания
4.5 Результаты экспериментов
4.6 Развитие модели
4.7 Результаты экспериментов на расширенной модели
4.8 Выводы
Глава 5. Психоакустическая модель

5.1 Свойства звуковых сигналов и особенности их восприятия
5.1.1 Чувствительность слухового анализатора
5.1.2 Амплитудное распределение
5.1.3 Временные свойства слухового анализатора
5.1.4 Эффекты маскировки и критические полосы слуха
5.1.5 Временные характеристики речевого сигнала
5.2 Реализация психоакустической модели
5.3 Применение психоакустической модели в распознавании речи
5.4 Выводы
Глава 6. Речевая аналитика
6.1 Возможные подходы к построению системы
6.2 Основные элементы разработанной системы поиска ключевых слов
6.3 Минимизация фонетической сети
6.4 Режимы работы системы
6.5 Критерии оценки качества системы
6.6 Результаты тестирования
6.7 Выводы
Глава 7. Оценка.качества передачи речевых сигналов
7.1 Классификация методов оценки качества звука
7.2 Обоснование необходимости разработки новых методов
7.3 Метод А(2иА
7.4 Метод А
7.5 Метод КесЦиа1
7.6 Выводы
Заключение
Основные сокращения
Основные термины
Использованная литература

Нейронная сеть может рассматриваться как граф с взвешенными связями, в котором нейроны являются узлами. Но не всякое соединение нейронов работоспособно и целесообразно. Существует несколько работающих и реализованных программно архитектур нейронных сетей (рисунок 1.5). По архитектуре связей нейронные сети могут быть разделены на два класса: сети прямого распространения и рекуррентные сети. Графы сетей прямого распространения не содержат петель, соответственно, рекуррентные сети - это сети с обратными связями.
Сети прямого распространения подразделяются на однослойные и многослойные персептроны, а также на сети радиальных базисных функций. Нейронная сеть состоит из входного слоя и выходного слоя. Дополнительно в сети могут присутствовать так называемые скрытые слои. Нейроны скрытых слоев не имеют непосредственных входов исходных данных, их выходы связаны только с входами нейронов выходного и скрытых слоев. Скрытые слои выполняют дополнительное преобразование информации, увеличивая нелинейность модели.
В персептронах каждый нейрон использует пороговую или сигмоидальную функцию активации. Доказано, что многослойный персептрон может формировать сколь угодно сложные границы принятия решения и реализовывать произвольные булевы функции [163].

Название работы	Автор	Дата защиты
Исследование статистических свойств трафика информационных сетей на основе ранговых функций	Нгуен Дык Вьет	2018
Разработка и исследование параллельных приложений для оптимизации топологии беспроводных сетей	Ай, Мин Тайк	2019
Разработка методов и алгоритмов поддержки принятия решений при создании систем управления наружным освещением	Лифиренко, Максим Вячеславович	2014

Электронная библиотека диссертаций

Методы и модели распознавания русской речи в информационных системах

Рекомендуемые диссертации данного раздела