Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Тыщенко, Григорий Анатольевич
05.13.16
Кандидатская
2000
Волгоград
156 с. : ил.
Стоимость:
499 руб.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ОБЩИЕ ПРОБЛЕМЫ ПОСТРОЕНИЯ СИСТЕМ ЕСТЕСТВЕННОГО ДИАЛОГА '
§ 1Л. Анализ проблем создания систем естественного диалога
§1.2. Модельное представление процессов речеобразования, выявление наиболее информативных параметров
§1.3. Общие проблемы распознавания речи и ее сегментации, методы распознавания речевого сигнала
ПОСТАНОВКА ЗАДАЧИ
ГЛАВА 2. ФОРМИРОВАНИЕ РЕЧЕВЫХ ОБРАЗОВ И ИХ РАСПОЗНАВАНИЕ
§2.1. Фонемо-слоговая сегментация речевого сигнала
§2.2. Фонемо-слоговый анализ распознавания речевой информации
§2.3. Распознавание речевой информации в потоке слитной речи с использованием лингвистического анализатора
§2.4. Выводы
ГЛАВА 3. ПОСТРОЕНИЕ СИСТЕМЫ КОМПЬЮТЕРНОГО АНАЛИЗА ЕСТЕСТВЕННОЙ РЕЧИ НА ОСНОВЕ СЕМАНТИЧЕСКИХ СЕТЕЙ
§3.1. Анализ вводимых данных и вопросов
§3.2. Генерация ответов по заданному вопросу
§3.3. Выводы
ЗАКЛЮЧЕНИЕ
БЛАГОДАРНОСТИ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ
ВВЕДЕНИЕ
Быстрый технический прогресс и повсеместное проникновение вычислительной техники в научную и повседневную деятельность за последние десятилетия сделали актуальной проблему создания средств общения между человеком и вычислительной техникой в режиме естественного диалога. Решение данной задачи предполагает создание речевых интерфейсов ввода-вывода, с помощью которых вычислительная техника будет способна не только распознавать сказанное человеком, но и анализировать полученную информацию. В основе этой проблемы лежит практическая необходимость создания систем передачи информации с повышенной эффективностью и высокой помехоустойчивостью, систем автоматического управления машинами с помощью голоса, информационно-справочных систем с распознаванием речевых сигналов и речевым ответом, переводчиков с голоса, медицинских систем диагностики и т. д. На текущий день задачи, связанные с распознаванием и анализом естественной речи, еще далеки от полного решения в отличие от синтеза речи.
В настоящее время существуют и частично внедрены в практику системы высококачественной цифровой передачи речевых сигналов, разработаны системы вокодерной передачи, промышленностью и рядом коммерческих фирм выпускаются устройства распознавания и синтеза речевых сигналов, разработаны системы идентификации личности по речевым сигналам, информационно-справочные системы, экспертные системы [1-12]. Экспертной является система, которая располагает экспертными правилами, не прибегая к слепому поиску, работает хорошо, рассуждает путем оперирования с символами, владеет фундаментальными принципами из предметной области и прибегает к более слабым методам рассуждений в тех случаях, когда не срабатывают экспертные правила и когда необходимо строить объяснения.
граммирования, в котором возможная последовательность сегментов сравнивается с последовательностями классов сегментов, приводит к наиболее правдоподобной последовательности классов входных отсчетов, однако этот метод требует много вычислений [76].
При разработке систем автоматического распознавания речи все большее распространение получает метод использования слоговой информации. В настоящее время широко известны три подхода к автоматическому распознаванию речи с опорой на слог [65, 72, 77]:
1) речь, поступающая на вход системы, сегментируется на участки, подобные слогу, которые далее сопоставляются с хранящимися в памяти эталонами слогов;
2) синтезированные из слогоподобных сегментов слова сопоставляются с вводимыми в систему словами;
3) речевой сигнал, поступающий на вход системы, анализируется, разбивается на звукоподобные сегменты, которые затем объединяются в слоговые единицы.
В первом случае при сегментации возникает много ошибок, во втором и третьем случаях увеличивается сложность обработки.
Недостатками существующих методов слоговой сегментации являются: размытость границ между слогами; отсутствие информации о числе фонем внутри слога и о локализации этих фонем на временной оси; эвристический подход при объединении сегментов в слоговые единицы; относительная сложность аппаратной реализации имеющихся методов; недостаточная информативность самих параметров, не связанных прямо с характеристиками речеобразующего тракта.
В настоящее время для распознавания речевого сигнала широкое применение нашли следующие методы распознавания: вероятностные, методы динамического программирования, .обучаемые нейронные сети, скрытые Марковские модели.
Название работы | Автор | Дата защиты |
---|---|---|
Разработка и исследование математических моделей оценки качества распознавания и совершенствование обучающихся алгоритмов | Бельчусов, Анатолий Александрович | 1998 |
Математическая модель деформирования во времени многослойных составных цилиндрических оболочек | Овчинникова, Ирина Юрьевна | 2000 |
Расширенный модифицированный рекуррентный метод наименьших квадратов в задачах анализа данных | Теклина, Лариса Григорьевна | 1999 |