+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Разработка и исследование метода распознавания фонем русского языка на основе аппарата линейного предсказания

  • Автор:

    Кисляков, Сергей Викторович

  • Шифр специальности:

    05.12.13

  • Научная степень:

    Кандидатская

  • Год защиты:

    2004

  • Место защиты:

    Санкт-Петербург

  • Количество страниц:

    200 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

1 АНАЛИЗ ПРОКЛЕМЫ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
1Л Основные задачи построения систем распознавания
< 1.2 Восприятие устной речи
1.3 Общая структура распознающей системы
1.4 АНАЛИЗ СОСТОЯНИЯ ИССЛЕДОВАНИЙ ПО ПРОБЛЕМЕ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ речи
1.5 Обзор рынка программных средств
1.6 Сравнительный анализ методов выделения признаков речевых сигналов
1.6 Л Анализ сигнала возбуждения I олосового тракта
1.6 2 Анализ клиппированного сигнала
1.6 з Формантный анализ
1.6.4 Спектральный анализ
1.6.5 Корреляционный анализ
1.6.6 Скрытое марковское моделирование
1.6.7 ВЕЙВЛЕТ - преобразование
1.6.8 Линейное предсказание
1.7 Выводы
2 ФОРМИРОВАНИЕ РАКОЧЕГО СЛОВАРЯ ПРИЗНАКОВ ФОНЕМ
2.1 ОЦЕНКА ПАРАМЕТРОВ РЕЧЕВОГО СИГНАЛА
2.2 АНАЛИЗ ТОЧНОСТИ МОДЕЛИ ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ
2.3 Статистические свойства ЛСК
2.4 Выбор метода оценки ошибки разделения фонем в подпространствах ЛСК
2.4.1 Использование статіістичьскоі о критерия на основе гистограмм
2.4.2 Использование метода динамических сгущений
2.5 Расчет ошибки разделения фонем с использованием МДС
2.5.1 Оценка разделимости фонем в двумерном подпространстве ЛСК
2.5.2 Оценка разделимости фоньм в трехмерном подпространстве ЛСК
2.5.3 Ощ нка размерности вектора признаков
2.6 Применение преобразования Карунена-Лоэва для сокращения размерности
векторов признаков
2.7 ВЛИЯНИЕ ранжирования признаков на размерность векторов признаков
2.8 Оценка влияния параметров расчета ЛСК на качество разделения фонем
2.9 Выводы
3 ФОРМИРОВАНИЕ КЛАСТЕРОВ ФОНЕМ НА ОСНОВЕ РАБОЧЕГО СЛОВАРЯ ПРИЗНАКОВ
3.1 Поиск оптимальных параметров расчета ЛСК
3.1.1 Выбор размера временного окна
% 3.1.2 Выбор шага временного окна
3.2 ФОРМИРОВАНИЕ ПРИЗНАКОВЫХ ПОДПРОСТРАНСТВ
3.3 ЗНАЧЕНИЯ ЛСК - ПРИЗНАКИ ПЕРВОГО УРОВНЯ
3.3.1 ФОРМИРОВАНИЕ ДЕРЕВА ПРИНЯТИЯ РЕШЕНИЙ (ДПР)
3.3.2 ПОИСК СТАРТОВОГО ПОДПРОСТРАНСТВА ДПР
3.3.3 ФОРМИРОВАНИЕ УЗЛОВ (ПЕРЕХОДОВ) ДПР

3.3.4 СВЯЗЬ РАЗМЕРНОСТИ ПОДПРОСТРАНСТВ И ВЕЛИЧИНЫ ОШИБКИ В УЗЛАХ ДПР
3.4 Признаки второго уровня
3.4.1 ФОРМИРОВАНИЕ КЛАСТЕРОВ ФОНЕМ НА ОСНОВЕ СКОЛЬЗЯЩИХ СРЕДНИХ ЛСК
3.4.2 Скользящие дисперсии как дополнительные признаки фонем
3.4.3 Собственные векторы ковариационных матриц фонем - альтернативные признаковые подпространства
3.5 Выводы

4 РАСПОЗНАВАНИЕ ФОНЕМ НА ОСНОВЕ ЛСК
4.1 Метод распознавания на основе ЛСК с использованием ДПР
4.1.1 Процедура обучения
4.1.2 Исследование алгоритма распознавания
4.2 Метод распознавания на основе СС ЛСК
4.2.1 Процедура обучения
4.2.2 Исследование алгоритма распознавания
4.2.3 Нейтрализация влияния дифтонгов
4.3 Распознавание на основе комбинированного алгоритма с нейтрализацией влияния дифтонгов
4.4 Выводы
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
• ОПУВЛИКОВА1ПГЫЕ СТАТЬИ
ПРИЛОЖЕНИЯ
Приложение 1. Вычисление ЛСК
Приложение 2. Вычисление ЛСК на сигнале любой длительности
Приложение 3. Программный комплекс для анализа речевых сигналов
Приложение 4. Описание реализации программы
приложение 5. Листинг программы

До недавнего времени процесс речевого общения человека и компьютера был непременным атрибутом научно-фантастических романов и никем не воспринимался всерьез. Несколько лет назад ситуация кардинально изменилась. Сегодня использование речевых технологий в прикладных программах в качестве альтернативного средства взаимодействия в системе «человек-компьютер» приобретает все больший размах. Такой процесс носит вполне обоснованный и объективный характер в силу ряда причин. Во-первых, развитие речевых средств взаимодействия с персональным компьютером лежит в рамках мировой тенденции «очеловечивания» ПК, т.е. позволяет создавать интерфейсы, максимально дружественные пользователю. Во-вторых, миниатюризация современных средств управления и связи требует принципиально новых подходов к осуществлению взаимодействия пользователя с такого типа устройствами. Для современных технологий не представляет большого труда создание, например, мобильного телефона размером с авторучку, однако механический набор номера на таком телефоне будет сопряжен с определенными трудностями. Голосовой набор номера и авторизация в этом случае являются очевидным и наиболее подходящим выходом. В-третьих, для большого круга пользователей речевой способ общения с ПК является единственно возможным в силу ограниченности их физических возможностей (люди с нарушениями опорно-двигательного аппарата, другими физическими недостатками, слепые и т.д.) либо специфики профессии.
Большое значение приобрели также задачи, связанные с быстрым поиском и получением от больших информационно-вычислительных систем («информационных банков») нужных сведений в виде обычных речевых сообщений, передаваемых по телефонным каналам. Все это сделало проблему автоматического распознавания речи разносторонней и актуальной.
Можно указать на следующие, наиболее перспективные области применения автоматического распознавания и синтеза речи:

левым математическим ожиданием равно дисперсии этого процесса. Аналогично тому, как это было сделано выше, .можно показать, что равенства (23) и (24) остаются справедливыми также и при случайном входном сигнале рассмотренного вида.
Таким образом, соотношения для коэффициентов автокорреляции сигнала на выходе фильтра, имеющего только полюсы, остаются одними и теми же независимо от того, является ли входной сигнал единичным импульсом или случайным белым шумом. Этого и следовало ожидать, поскольку оба эти входные воздействия имеют одинаковые АКФ и, следовательно, одинаковые равномерные спектры. Эта особенность является очень важной при моделировании речи.
Как было отмечено выше, значения коэффициентов экстраполятора сц могут быть найдены путем решения некоторой системы р уравнений (12) с р неизвестными. Важным достоинством метода линейного предсказания является наличие эффективных приемов решения системы уравнений (12). При автокорреляционном методе можно воспользоваться очень эффективными итеративными алгоритмами [13, 6, 11], первоначально предложенными Левинсоном [14] и усовершенствованными Дурбиным [15].
Действительно, полезными на практике являются представления речи в виде параметрической модели (линейная дискретная динамическая система (ЛДДС) с переменньми параметрами) с передаточной функцией:
где коэффициенты {а,} несут информацию о состоянии ЛДДС на временном отрезке (кадре) и называются коэффициентами линейного предсказания (КПП), а фильтр с передаточной функцией
называют обратным фильтром или фильтром-предсказателем (ФП). Коэффициенты

А{г)= £а,г-'

Рекомендуемые диссертации данного раздела

Время генерации: 0.114, запросов: 967