Разработка математических моделей и алгоритмов поиска ключевых слов в аудио-сообщениях

Разработка математических моделей и алгоритмов поиска ключевых слов в аудио-сообщениях

Автор: Зулкарнеев, Михаил Юрьевич

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Ростов-на-Дону

Количество страниц: 128 с.

Артикул: 3043512

Автор: Зулкарнеев, Михаил Юрьевич

Стоимость: 250 руб.

Разработка математических моделей и алгоритмов поиска ключевых слов в аудио-сообщениях  Разработка математических моделей и алгоритмов поиска ключевых слов в аудио-сообщениях 

Введение.
1 Математические модели, методы и алгоритмы поиска ключевых слов, основанные на скрытых Марковских моделях
1.1 Байесовский критерий минимума средних потерь
1.2 Предобработка акустического сигнала.
1.3 Моделирование акустического сигнала при помощи скрытых Марковских
моделей
1.3.1 Определение скрытой Марковской модели
1.3.2 Моделирование акустического сигнала при помощи СММ.
1.3.3 Учет контекстной зависимости при моделировании акустического сигнала с помощью СММ.
1.3.4 Расчет акустической вероятности РЯЯ
1.4 Оценка параметров скрытых Марковских моделей
1.4.1 Метод максимального правдоподобия
1.4.2 Дискриминативные методы оценки параметров акустических моделей
1.5 Моделирование языка.
1.6 Декодирование.
1.6.1 Витербидекодирование
1.6.2 Алгоритм перемещающегося маркера.
1.6.3 Компенсация ошибок языковой и акустической моделей при помощи штрафа добавления слова и языкового множителя
1.7 Системы поиска ключевых слов, основанные на скрытых Марковских моделях .
1.7.1 Величины, характеризующие качество работы системы поиска ключевых слов
1.8 Недостатки и направление их разрешения
1.9 Постановка задачи исследования
2 Длинноконтекстные акустические модели фонем для уточненного моделирования
ключевых слов.
2.1 Длинноконтекстные акустические модели фонем.
2.2 Критерий близости скрытых Марковских моделей
2.2.1 Расчет интеграла
2.2.2 Итеративный алгоритм расчета критерия близости для скрытых Макровких моделей.
2.2.3 Аппроксимация акустической близости.
2.3 Показатель влияния контекста на параметры акустических моделей фонем
2.4 Аппроксимация длинноконтекстных акустических моделей фонем, оптимальная с точки зрения влияния контекста на параметры моделей.
2.5 Программная реализация и экспериментальные исследования системы поиска
ключевых слов, использующей длинно контекстные модели фонем.
2.5.1 Программная реализация системы поиска ключевых слов, использующей длинноконтекстные модели фонем
2.5.2 Экспериментальные исследования системы поиска ключевых слов, использующей длинноконтекстные модели фонем.
3 Словарь системы поиска ключевых слов, оптимальный с точки зрения минимума средней ошибки распознавания
3.1 Задача формирования словаря заполнения как задача разбиения слов языка на
непересекающиеся подм ножества
3.2 Целевая функция разбиения слов языка на непересекающиеся подмножества.
3.3 Расчет перекрестной энтропии пары скрытых Марковских моделей
3.3.1 Расчет интеграла 1Ху,Хпм
3.3.2 Итеративный алгоритм расчета перекрестной энтропии для скрытых Марковских моделей.
3.4 Метод кластеризации слов языка на непересекающиеся подмножества
3.5 Программная реализация и экспериментальные исследования системы поиска ключевых слов, использующей метод формирования словаря заполнения, оптимальный
с точки зрения минимума средней ошибки распознавания.
3.5.1 Программная реализация системы поиска ключевых слов, использующей оптимальный метод формирования словаря заполнения
3.5.2 Экспериментальные исследования системы поиска ключевых слов, использующей оптимальный метод формирования словаря заполнения.
Выводы Заключение Литература
Принятые обозначения и сокращения
СММ или СММмодель Скрытая Марковская модель
ДКмодель
ДКописатель
ДЦКмодель
РДКмодель
О о,от Ш

Щ,т ,и уМ
х или хт Р0Щ,Р0ХМ
Длинноконтекстная модель описатель длинноконтекстной модели действительная длинноконтекстная модель Родительская дпинноконтекстиая модель
Последовательность слов, представляющая содержание аудиосообщения.
Словарь системы распознавания речи Последовательность векторов признаков
Скрытая Марковская модель СММмодель
СММмодели слова и и последовательности слов IV соответственно
Множество состояний СММмодели
Вероятность перехода из состояния в состояние СММмодели
Плотность распределения вероятности вектора признаков о для состояния
Параметры смеси нормальных распределений, моделирующей распределение о
Множество параметров СММмоделей
Последовательность состояний скрытой Марковской модели Ш Условные плотности распределения вероятностей для
последовательности О в качестве жаргонных названий этих величин в данной диссертации используются термин акустическая вероятность и величина правдоподобия. В данной диссертации Р обозначает как вероятность, так и плотность распределения вероятностей, смысл в каждом конкретном случае ясен из контекста
В данной диссертации используется для обозначения логарифма с основанием
Введение
Актуальность


Необходимо отметить, что значительные усилия исследователей к настоящему времени привели к серьезным успехам при создании систем распознавания речи , , , . В таблице 1 приводятся характеристики некоторых из них. Из таблицы видно, что очень хорошие результаты достигнуты при создании систем распознавания речи с малыми словарями, в частности систем распознавания последовательностей цифр 0. Немного отстают от них системы транскрибирования новостных программ и распознавания читаемой речи 2. В связи с этим, несмотря на достигнутые успехи, весьма актуальными в настоящее время остаются работы, направленные на повышение точности систем распознавания речи вообще и для этих условий работы в частности. Распознавание цифр I Спонтанная 0. Распознавание цифр i Спонтанная И 2. Распознавание цифр 1 Разговорная 5. Читаемая речь 2. I ii v ii Спонтанная 2. Читаемая речь 0 6. В данной диссертационной работе рассматривается одна из задач распознавания речи задача поиска ключевых слов в аудиосообщениях , . В отличие ог распознавания речи, под которым обычно понимается преобразование речевого сигнала в текстовое сообщение, при поиске ключевых слов необходимо обнаружить наличие в речевом сигнале слов из некоторого набора ключевых слов. Объект исследований. Объектом исследования является система распознавания ключевых слов, основанная на скрытых Марковских моделях. Цель и задачи работы. Разработать программную реализацию и выполнить экспериментальные исследования системы поиска ключевых слов, использующей разработанный метод формирования словаря заполнения. Методы исследования. Для решения поставленных задач используются методы теории случайных процессов цени Маркова, Байесовская теория принятия решений, теория информации, методы статистической обработки сигналов. Научная новизна. В процессе исследований предложен новый подход к созданию акустических моделей ключевых слов с использованием длинноконтекстных акустических моделей фонем, отличающихся от известных контекстнозависимых моделей переменной длиной учитываемого контекста. Впервые поставлена и решена задача формирования словаря заполнения, оптимального с точки зрения средней ошибки распознавания. Выполнен ряд экспериментов, подтверждающих эффективность предлагаемых методов. Разработана программная реализация и выполнены экспериментальные исследования системы поиска ключевых слов, использующей разработанный метод формирования словаря заполнения. Создана программная реализация системы, предназначенной для оценки параметров длинноконтекстных акустических моделей фонем, а также проведены экспериментальные исследования предлагаемого метода аппроксимации длинноконтекстных акустических моделей фонем. Метод и алгоритм обучения длинноконтекстных моделей фонем, позволяющие строить более точные по сравнению с существующими акустические модели ключевых слов. Метод и алгоритм расчета критерия близости скрытых Марковских моделей, который позволяет рассчитать близость скрытых Марковских моделей в пространстве признаков. Метод и алгоритм расчета показателя влияния контекста на параметры акустических моделей фонем. Программная реализация системы поиска ключевых слов, использующей длиниоконтекстные модели фонем. Метод и алгоритм формирования словаря заполнения, оптимального с точки зрения минимума средней ошибки распознавания. Метод и алгоритм расчета перекрестной энтропии для СММмоделей. Программная реализация системы поиска ключевых слов, использующей предложенный метод формирования словаря заполнения. Использование результатов работы. НИР Течь0, заказчик ФГНУ НИИ Спсцвузавтоматика. Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на седьмой международной научнопрактической конференции Интеллекзуальные и многопроцессорные системы Кацивели, Украина, , на XVI сессии Российского акустического общества Москва, , на международной конференции СанктПетербург, , на международной научной конференции , , , на шестой международной научнопрактической конференции Интеллектуальные и многопроцессорные системы поселок Дивноморскос, Геленджикский район, г. Новороссийск, . Основные положения, выносимые на защиту.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.253, запросов: 244