+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Алгоритмы распознавания речевых команд в управляющих системах

  • Автор:

    Литвиненко, Сергей Леонидович

  • Шифр специальности:

    05.11.16

  • Научная степень:

    Кандидатская

  • Год защиты:

    2006

  • Место защиты:

    Волгоград

  • Количество страниц:

    180 с.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

1 Анализ систем и методов распознавания речевого сигнала
1.1 Анализ структур систем распознавания речи
1.2 Анализ методов спектрального представления речевого сигнала
1.3 Анализ методов подавления помех в речевом сигнале
1.4 Анализ методов сегментации речевого сигнала
1.5 Анализ методов распознавания речи
2 Математическое описание частотно-временной структуры речевого
сигнала
2.1 Анализ речевого сигнала на разных частотно-временных масштабах
2.2 Пакетное вейвлет-преобразование как способ представления сигнала на
разных частотно-временных масштабах
2.3 Метод сегментации спектрограмм речевого сигнала
3 Разработка алгоритмов распознавания речевых команд
3.1 Разработка алгоритмов получения пакетной вейвлет-спектрограммы
речевого сигнала
3.2 Разработка алгоритмов формирования эталона
3.3 Разработка алгоритмов сравнения текущего образа с эталоном
4 Экспериментальное исследование работы алгоритмов
распознавания
4.1 Методика и средства проведения экспериментов
4.2 Цель экспериментальной работы и выбор критериев качества
4.3 Исследование работы алгоритмов, выполняющих распознавание путем
сопоставления спектрограмм пакетного вейвлет-преобразования
4.4 Исследование работы алгоритмов, выполняющих распознавание путем
сопоставления функций ошибки моделирования спектрограмм пакетного вейвлет-преобразования
4.5 Исследование работы алгоритмов, выполняющих распознавание путем
сопоставления функций ошибки моделирования при двухмасштабном частото-временном представлении сигнала
4.6 Результаты экспериментов по распознаванию изолированных слов
Заключение
Библиографический список
ПРИЛОЖЕНИЕ 1 Вейвлеты, рассматриваемые в экспериментах
ПРИЛОЖЕНИЕ 2 Примеры отчетов о результатах экспериментов,
генерируемых программным экспериментальным комплексом
На всех этапах развития техники делаются попытки возложения на машины функций выполняемых человеком. Сначала это были только наиболее трудоемкие функции, связанные с большими затратами энергии. Затем, с дальнейшим развитием техники, появилась возможность выполнения машинами различных интеллектуальных функций, т.е. в некоторых областях интеллектуальной деятельности, например обработки больших объемов информации, человек заменяется машиной. Какие бы не были простые или сложные эти технические средства всегда существует необходимость управления ими. Человек может передавать управляющее воздействие с помощью органов движения и речи. Наиболее простым оказалось решение задачи передачи управляющего воздействия с использованием рук человека. Однако более удобной и естественной для человека является речевая коммуникация. Поэтому уже много десятилетий развивается область науки связанная с проблемой организации речевого управления техническими системами. Попытка решения этой проблемы привела к формулировке и решению огромного числа задач связанных с моделированием и обработкой, передачей и распознаванием человеческой речи.
Системы распознавания речи получают, в настоящее время, все более широкое распространение в тех приложениях, где естественный речевой диалог позволяет повысить удобство управления и обмена информацией с различными информационными системами. Повышение достоверности распознавания ведет, как правило, к усложнению систем распознавания и стоимости их изготовления. Вместе с тем в некоторых приложениях требуется реализовать компактную и простую систему распознавания речевых команд с небольшим словарем, которую достаточно просто реализовать аппаратно и встроить в уже имеющуюся или разрабатываемую систему. Такие системы распознавания могут потребоваться, например, для речевого запроса информации в какой-либо информационной системе; для запроса оперативной информации о
состоянии объекта управления; для подачи речевых команд системе управления, в тех случаях, когда руки оператора заняты контролем других функций управляемого процесса; или в случае, когда оператор находится в скафандре и ему неудобно руками воздействовать на органы управления. Для таких систем требуется узко специализированный словарь командного языка и контекстно-зависимая грамматика, а от блока распознавания требуется высокая достоверность идентификации команды.
В настоящее время сложные системы распознавания речи, имеющие большой словарный запас, основываются на применении скрытых Марковских моделей в качестве средства стохастического моделирования сложного речевого сигнала, для обучения которых используются обширные базы данных сегментированной речи, а свободно распространяемых русскоязычных обучающих баз данных для создания таких систем в России нет. В случае же создания системы для распознавания определенного набора команд, состоящих из изолированных слов, требуется небольшой словарь, порядка сотни слов, с контекстно-зависимой грамматикой. Эти два фактора сильно облегчают создание системы распознавания. В то же время система должна иметь возможность быть быстро перенастроена на другую задачу. Указанные факторы позволяют создавать в данном случае системы без использования Марковских моделей, но в этом случае существующие методы распознавания не дают такого высокого качества распознавания.
В связи с вышеизложенным, представляется актуальной задача разработки алгоритмов распознавания речевого сигнала просто реализуемых аппаратно и позволяющих достигнуть высокой достоверности распознавания.
Развитие области знаний, связанной с анализом и распознаванием речевого сигнала началось с решения задач передачи человеческой речи по узкополосным каналам связи с полосой пропускания меньшей, чем у обычной телефонной линии. Решение этой задачи привело к созданию вокодеров, устройств выполняющих сокращение частотной полосы речевых сигналов для линий дальней связи. Первым успехом в данной области считается полосный

подход не требует создания математической модели, необходимо лишь обучить сеть распознаванию сигнала, однако здесь тоже существует проблема сложности сети, а так же проблема, связанная с сильным возрастанием времени обучения сети в зависимости от ее сложности.
Процесс обучения рассматривается как настройка архитектуры сети и весов связей для эффективного выполнения специальной задачи. Обычно нейронная сеть должна настроить веса связей по имеющейся обучающей выборке. Функционирование сети улучшается по мере итеративной настройки весовых коэффициентов. Свойство сети обучаться на примерах делает их более привлекательными по сравнению с системами, которые следуют определенной системе правил функционирования, сформулированной экспертами.
Существуют три парадигмы обучения: "с учителем", "без учителя" (самообучение) и смешанная. В первом случае нейронная сеть располагает правильными ответами (выходами сети) на каждый входной пример. Веса настраиваются так, чтобы сеть производила ответы как можно более близкие к известным правильным ответам. Усиленный вариант обучения с учителем предполагает, что известна только критическая оценка правильности выхода нейронной сети, но не сами правильные значения выхода. Обучение без учителя не требует знания правильных ответов на каждый пример обучающей выборки. В этом случае раскрывается внутренняя структура данных или корреляции между образцами в системе данных, что позволяет распределить образцы по категориям. При смешанном обучении часть весов определяется посредством обучения с учителем, в то время как остальная получается с помощью самообучения.
Теория обучения рассматривает три фундаментальных свойства, связанных с обучением по примерам: емкость, сложность образцов и вычислительная сложность. Под емкостью понимается, сколько образцов может запомнить сеть, и какие функции и границы принятия решений могут быть на ней сформированы. Сложность образцов определяет число обучающих примеров, необходимых для достижения способности сети к обобщению.

Рекомендуемые диссертации данного раздела

Время генерации: 0.166, запросов: 967