Диссертация на тему "Математические методы исследования фонационно-артикуляционных параметров речи", скачать бесплатно автореферат по специальности 10.02.21

ГЛАВА I
ЛИНЕЙНАЯ МОДЕЛЬ РЕЧЕОБРАЗОВАНИЯ И ЕЕ ПАРАМЕТРЫ. ПОСТАНОВКА ЗАДАЧИ АНАЛИЗА И СИНТЕЗА РЕЧИ ПО ПАРАМЕТРАМ

§ 1.1. Модель речеобразования. Окно анализа

§ 1.2. Параметры модели речеобразования

§1.3. Анализ речи

§ 1.4. Параметрический синтез речи

Выводы к главе

ГЛАВА II

ОЦЕНИВАНИЕ ПАРАМЕТРОВ РЕЧЕВОГО ТРАКТА ПО ЗВУКОВОЙ ВОЛНЕ

§ 2.1. Обратная фильтрация речи. Окно анализа. Параметры речевого тракта

§ 2.2. Математические методы обратной фильтрации

§ 2.3. Спектральные методы анализа речевого тракта
§ 2.4. Прямые расчетные методы исследования речевого тракта по речевой волне
Выводы к главе
ГЛАВА III
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ ФОНАЦИОННЫХ ХАРАКТЕРИСТИК
§ 3.1. Постановка задачи. Краткий обзор методов выделения основного тона
по речевому сигналу
§ 3.2. Математический метод преобразования речевых колебаний
в импульсную последовательность
§ 3.3. Выделение импульсов основного тона по речевому сигналу
§ 3.4. Исследование голосового источника с использованием линейного предсказания
§ 3.5. Параллельный анализ основного тона на основе корреляционной матрицы
Выводы к главе
ГЛАВА IV
АДАПТИВНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ РЕЧИ
§4.1. Общие положения
§ 4.2. Адаптивные методы вычисления параметров речевого тракта
§ 4.3 Адаптивные структуры определения параметров речевого тракта
на сфере в различных метрических пространствах
§ 4.4. Определение основного тона речи адаптивным методом
Выводы к главе
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
На русском языке
На иностранном языке
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ

История человечества отмечена целым рядом научно-технических открытий и изобретений. Одним из фундаментальных фактов в этом ряду исследований является осознание несомненной важности в организации и существовании сообществ людей информационных потоков между членами сообщества. Без обмена информацией между людьми невозможны процессы сохранения и накопления знаний, совместных и согласованных действий в трудовой деятельности и, вообще говоря, развития и сохранения цивилизации.
В повседневной деятельности человек часто использует речь как средство общения, поэтому сам процесс речевой коммуникации ему представляется достаточно простым и о сложности его он часто не подозревает. Речь как способ общения является для нас столь привычным явлением, что мы часто не задумываемся о сущности этого процесса, его реализации и характеристиках. Сказанное о речи относится к большинству людей, но, естественно, не ко всему человечеству в целом. Важность исследования этого явления осознавалось человеком с незапамятных времен.
Платон, Гиппократ, Авиценна придавали большое значение звучащей речи, а произнесенное «слово», по их мнению, имело оттенок даже мистического воздействия на человека. Это хорошо известно религиозным деятелям, мистикам всех родов, политикам и г.д. Слово в понимании древних1 могло оказывать на человека сложное воздействие (увеличивать защитные силы человека и лечить его: «...по вере твоей...», нести в себе недобрые намерения, угнетать человека и т.п.). В этом смысле речь человека больше чем просто информационный канал, служащий для передачи смысла сказанного говорящим слушателю.
1 Следует оговориться, что современные представления о воздействии речи на человека не до конца изучены и во многих аспектах не опровергают древних. Лингвопрограммирование, например, использует приемы древних в своей практической деятельности.

Помимо подспудного (неосознанного) содержания, речь включает в себя непосредственную информационную компоненту, которая должна дойти до получателя (слушателя) несмотря на возможные внешние шумовые воздействия. Другими словами, речь должна быть весьма сильно защищена от различных природных и технических шумов и должна обладать своими особыми свойствами и характеристиками, отличающими ее от иных звуков. В речи такая помехозащищенность присутствует в виде избыточности и приобретается на основе адаптации речеобразующих и слуховых органов человека в процессе своего развития. Понятно, что умение говорить и понимать речь не является врожденным качеством человека, а приобретается им в первые годы жизни.
Избыточность звучащей речи позволяет нам, с одной стороны, понимать сказанное в достаточно сложной шумовой обстановке, а с другой, - передавать нам большее количество информации о говорящем, чем просто понимание смысла сказанного. Мы воспринимаем индивидуальность голоса диктора, часто его эмоциональное и физическое состояние, стиль и тип высказывания и т. п.
Благодаря избыточности мы извлекаем речевую информацию из искаженного речевого сигнала по нескольким его параметрам и характеристикам, обладающими соответствующими компенсационными свойствами по отношению друг к другу. Например, значение основного тона гласной, временная огибающая (интенсивность) и длительность слога определяют его ударность. При этом взаимовлияние этих характеристик речи на ударность слога не представляется в виде однозначной зависимости, и аудитор регистрирует ударность слога при их определенном и достаточно сильном искажении.
Другой отличительной характеристикой речи, обусловленной особенностями артикуляционного аппарата человека и адаптационными свойствами нервной системы человека, является ее вариативность. Практически невозможно дважды повторить одно и то же высказывание так, чтобы временная организация звучания была бы в них идентична. Физические параметры, их значения и временная организация в этих высказываниях отличаются друг от друга, что отрицательно влияет на построение тех или иных систем распознавания речи и не позволяет
матическом плане к исследованию граничных задач для уравнений в частных производных [Сорокин 1985], со многими априори неизвестными параметрами и характеристиками.
В этой области предложены одномерные, двумерные и даже трехмерные модели работы голосовых связок в процессе речеобразования [Фланаган 1968; Сорокин 1985], содержащие множество неизвестных параметров и характеристик. Оценить эти неизвестные априори величины, опираясь на анализ только речевого сигнала, в настоящее время не представляется возможным. Поэтому в данной работе это направление исследований, крайне важное для понимания внутренней микроструктуры речи, не рассматривается, и мы будем в качестве модели работы голосовых связок опираться на упрощенную модель в виде линейной системы ФИ с положительным откликом на единичный импульс возбуждения. Последний класс линейных систем может быть положен в первом приближении в основу описания работы голосового источника.
В дальнейшем изложение будет основываться на упрощенном, модельном представлении работы голосовых связок и форме, порождаемых ими импульсов.
Форма импульсов, соответствующих времени размыкания голосовых связок (интервал [0, 1]]), построена без учета сложных аэродинамических эффектов, отмеченных выше, и характеризует только площадь раскрытия голосовых связок во времени (см. Приложение, рис. 1.5). Временной интервал [^ То] при этом соответствует смыканию голосовых связок и можно считать, что сигнал возбуждения на этом участке отсутствует.
Следует признать, что отмеченное обстоятельство замены реального процесса возбуждения речевого тракта на его упрощенный вариант является достаточно смелым и требует своего подтверждения при анализе речевого сигнала. Другими словами, необходимо показать, что упрощенные модельные представления сигнала возбуждения соответствуют структуре естественного речевого сигнала. Состоятельность такого представления подтверждается современными алгоритмами и методами анализа и синтеза речевых колебаний.

Название работы	Автор	Дата защиты
Принципы глоссирования для корпуса младописьменного языка : морфологическая структура языка пулар	Косогорова, Мария Александровна	2012
Компрессия научного текста: методы и модели	Дубинина, Екатерина Юрьевна	2013
Содержание терминологического поля в многоязычной терминографии : Применительно к исторической терминологии в английском, французском, немецком и русском языках	Хохлова, Елена Леонидовна	2005

Электронная библиотека диссертаций

Математические методы исследования фонационно-артикуляционных параметров речи