Математические модели и комплекс программ для автоматической оценки качества речевого сигнала

Математические модели и комплекс программ для автоматической оценки качества речевого сигнала

Автор: Николаев, Алексей Николаевич

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2002

Место защиты: Екатеринбург

Количество страниц: 174 с. ил

Артикул: 2307969

Автор: Николаев, Алексей Николаевич

Стоимость: 250 руб.

Математические модели и комплекс программ для автоматической оценки качества речевого сигнала  Математические модели и комплекс программ для автоматической оценки качества речевого сигнала 

Оглавление
Введение
1. Состояние вопроса, обзор литературы и постановка основных задач диссертационного исследования
1.1. Оценка качества речи в системах передачи речи.
1.2. Качество речи с точки зрения восприятия речи человеком
1.3. Традиционные средства для проверки качества речи в логопедии и при изучении иностранного языка.
1.3.1. Системы Видимая речь и Визуальный тренажер произношения
1.3.2. Профессор Хиггинс. Английский без акцента.
1.4. Основные подходы к распознаванию речи.
1.5. Методы оценки качества речи на основе систем распознавания речи.
1.5.1. Бельгийская система
1.5.2. Американская система .
1.5.3. Японская система i.
1.6. Постановка задачи.
2. Теоретические основы распознавания речи.
2.1. Динамическое программирование.
2.2. Скрытое марковское моделирование
2.2.1. Определение
2.2.2. Алгоритм прямого хода
2.2.3. Алгоритм Витерби.
2.2.4. Обучение скрытой марковской модели, алгоритм БаумУэлча
2.2.5. Виды скрытых марковских моделей
2.2.6. Проблема моделирования длительности состояний
2.3. Предсказывающие системы.
2.4. Применение нейронных сетей для классификации образов
2.4.1. Нейронные сети основные положения
2.4.2. Функционирование нейронной сети.
2.4.3. Обучение нейронной сети.
2.4.4. Выбор архитектуры многослойной нейронной сети.
2.4.5. Распознавание образов с помощью многослойной нейронной сети.
2.5. Выводы.
3. Выбор признаков описании речевого сигнала
3.1. Особенности речевого сигнала с точки зрения речеобразования
3.2. Особенности речевого сигнала с точки зрения восприятия человека
3.3. Предварительная обработка речевого сигнала.
3.4. 1 ризнаки речевого сигнала
3.5. Выбор признаков описания речи
3.6. Эксперимент по сравнению двух систем признаков описания речи
3.7. Выводы.
4. Распознавание изолированных слов и сегментация на фонемы на основе эталонов
4.1. Выбор словаря системы распознавания речи.
4.2. Предварительная сегментация речевого материала.
4.3. Сегментация в результате распознавания при моделировании на основе эталонов
4.4. Качество системы распознавания речи на основе эталонов в зависимости от размера обучающей выборки
4.5. Выводы.
5. Распознавание изолированных слов и сегментация на фонемы на основе скрытых марковских моделей и нейронных сетей.
5.1. Выбор оптимальной нейронной сети для распознавания речиI
5.2. Выбор оптимальной архитектуры скрытой марковской модели
5.3. Качество системы распознавания речи на основе скрытых марковских моделей в зависимости от размера обучающей выборки
6. Автоматическая опенка произношения
6.1. Алгоритмы оценки качества произношения отдельной фонемы
6.2. Сравнение автоматической оценки произношения отдельных фонем на основе различных систем распознавания речи.
6.3. Использование автоматической оценки произношения для задачи обучения иностранному языку
6.4. Использование автоматической оценки произношения для сравнения систем передачи речи.
6.5. Программный комплекс автоматической оценки качества произношения. .
6.6. Выводы
Заключение.
Список литературы


Невозможно уверенно воспринимать речь, не используя при этом закономерности фонетического уровня, закономерности грамматики и семантики языка, не учитывая при этом сведения о предмете разговора, о личности говорящего и о текущей ситуации. Результаты эксперимента 6 показали, что нехарактерные для родного языка звукосочетания воспринимаются распознаются человеком гораздо хуже, чем характерные. При этом звуки воспринимались таким образом, чтобы получилась принятая в данном языке последовательность звуков. Представляется невозможным объяснить данное явление исходя лишь из абсолютной различимости звуков. По всей вероятности, эти особенности восприятия связаны со знанием правил сочетаемости фонем распознаваемою языка. Другой пример того, что человек не может осуществлять уверенное распознавание фонем только на основе акустической информации, показан в работе 1, где были проведены психоакустические испытания, при которых слушателей просили записать по буквам бессмысленные звукосочетания. Слушатель, не владеющий лексиконом, не имеющий возможности использовать смысловые закономерности речи, незнакомые слова например, редкие фамилии, случайно выбранные слова воспринимает с частыми ошибками. Устная речь, формируемая в мозгу и артикуляционном аппарате говорящего, обычно имеет некоторые субъективные отклонения от языковых норм и правил фонетические, грамматические, смысловые неточности. Степень этих отклонений зависит от стремления и умения говорить правильно. Если отклонения находятся в допустимых пределах, то речь может быть в принципе понята. Эту ситуацию можно сравнить с той, которая существует при передаче дискретной информации корректирующим кодом, когда переданное сообщение может быть в той или иной степени искажено помехами и возможность правильного декодирования зависит от величины этих искажений. Нельзя не обратить внимание на фактор исходной неопределенности устной речи. Часто в целях экономии энергии говорящий и не стремится к более качественной артикуляции. Следовательно, ошибки идентификации звуков на фонемном уровне есть не какойто досадный, редко проявляющийся фактор, а неотъемлемая закономерность процесса речевой коммуникации 7. Одна из главных закономерностей в изменчивости фонем это влияние соседних звуков. С учетом аллофонов звуковой состав речи может насчитывать и более различных звуков 7. Другие систематические факторы изменчивости фонем индивидуальные особенности артикуляции, диалекты, пол, возраст. Существует и множество случайных факторов степень утомления говорящего, его эмоциональное состояние и желание говорить попятно, влияние отвлекающих факторов. Так называемый полный стиль произношения употребляется редко в речи профессиональных дикторов, артистов, педагогов, лекторов. На практике имеется много переходных форм речи от полного стиля до небрежной скороговорки, при этом фонемы постепенно теряют свои отличительные свойства. Иногда фонемы и даже слоги пропадают явление редукции. При этом разброс параметров звуков зависит также от неконтролируемых флюктуаций процесса артикуляции. При артикуляционных испытаниях получены интересные зависимости между различными видами разборчивости речи Г9 фонемная, ХУ словесная, 8 слоговая, . I . У при 0, т. Для этого случая из 0 слов длиной в 5 фонем в среднем только окажутся безошибочными после фонемной транскрипции поскольку вероятность безошибочной передачи в этом случае равна 0, 0,. Рис. Из выше сказанного можно сделать вывод, что по изолированным звукам достаточно сложно судить о качестве их произношения. Для проверки качества произношения согласных в логопедии 8 примерно таким же образом поступают и при изучении иностранного языка применяют следующий прием. Качество произнесения согласного проверяют не на изолированном звуке, а на звуке в составе специально подобранных слов простая слоговая структура, отсутствие других трудно произносимых звуков. При таком подходе хорошо различима на слух разница в произношении анализируем ы х з ву ков. Приведенный перечень не претендует на полноту, а служит лишь иллюстрацией многообразия аспектов, под которыми рассматривается проблема качества речи. Рассмотрим средства для проверки качества речи в логопедии и при изучении иностранного языка.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.235, запросов: 244