+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Методы создания и использования речевых баз данных и инструментальных средств анализа и исследования речи для развития речевых технологий

  • Автор:

    Богданов, Дмитрий Степанович

  • Шифр специальности:

    05.13.01

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Москва

  • Количество страниц:

    128 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Список условных обозначений и сокращений
Глава 1. Обзор состояния речевых технологий и анализ существующих
инструментальных средств для их разработки
1.1. Факторы развития речевых технологий
1.2. Речевой ввод/ввод как развитие человеко-машинных интерфейсов
1.2.1. Речевой канал ввода/вывода
1.2.2. Прикладные аспекты использования речевого интерфейса
1.3. Современное состояние речевых технологий в мире
1.4. Современное состояние исследований в России и предложений речевых технологий для русского языка
1.5. Научные подходы в распознавании речи
1.6. Обзор современных инструментальных средств для исследования речи и разработки речевых технологий
1.6.1. Звуковые редакторы
1.6.2. Специальные редакторы для исследования речевых
файлов
1.6.3. Выводы по результатам обзора средств анализа и визуализации речевых данных
1.7. Проблема речевых баз данных: определения, классификация, обзор существующих речевых корпусов
1.7.1. Речевые базы данных - необходимый элемент разработки речевых технологий
1.7.2. Определения и классификация речевых баз данных
1.7.3. Проблемы создания и унификации речевых корпусов
1.7.4. Обзор существующих речевых корпусов русского языка
1.8. Выводы

Глава 2. Методы создания инструментальных средств для исследования
речевых сигналов и разработки речевых технологий
2.1. Предварительные рассуждения для постановки задачи обработки, анализа и визуализации речевых сигналов
2.2. Инструментальная система для исследования и обработки речевых сигналов и создания речевых баз данных
2.2.1. Архитектура системы
2.2.2. Унифицированное описание объекта
2.2.3. Классы операций
2.2.4. Технический класс
2.2.5. Базовый класс
2.2.6. Пользовательский класс
2.2.7. Системный класс
2.2.8. Подсистема ручной сегментации сигнала
2.3. Метод выделения периодов основного тона в речевом
сигнале
2.3.1. Инженерный подход к анализу вокальных участков речевого сигнала
2.3.2. Суть метода
2.3.3. Описание алгоритма
2.3.4. Проблема выбора локальных минимумов
2.3.5. Использование метода
2.3.6. Результаты тестирования метода
2.4. Инструменты для построения речевого диалога в системах с речевым управлением
2.4.1. Сценарий речевого диалога с компьютером
2.4.2. Язык описания сценария
2.4.3. Программная реализация речевого диалога
Глава 3. Методы создания и использования речевых баз данных для
развития речевых технологий

3.1. Технология создания речевых корпусов
3.1.1. Требования к составу речевой базы данных
3.1.2. Проблемы реализации требований фонетической
полноты и сбалансированности речевой базы данных
3.2. Программное обеспечение для формирования речевых баз данных
3.2.1. Потоковая запись дикторов для формирования речевого корпуса
3.2.2. Автоматизированное рабочее место эксперта для верификации и разметки речевых фрагментов
3.2.3. Обработка результатов верификации
3.2.4. Корректировка полей информационного файла
3.2.5. Подсчет количества вхождений монофонов и Трифонов
3.3. Практические результаты - разработка речевых корпусов русского языка
3.3.1. Описание речевого корпуса 18АВА8Е
3.3.2. Описание речевого корпуса ЯиЗреесй
Заключение: выводы по результатам исследования
Список литературы

• дат и времени (часов, минут)
• фонетически представительных предложений
• коротких рассказов на заданную и свободные темы
Каждый ответ в ходе интервью записан в отдельный аудио файл и сопровождается аннотацией. Речевая часть включает записи 100 дикторов.
Система аннотирования речевых файлов выбрана совместимой с системой аннотирования для баз данных TIMIT, за исключением расширенной системы меток фонем для русского языка, а также описания неречевых акустических событий.
60% речевой части корпуса данных записано в двухканальном варианте:
• телефонный канал (полоса до 4 кГц, проводные (135 и 137 станции) и сотовые каналы связи.
• микрофонный сигнал (полоса до 11кГц, микрофоны Shure SM10 и Koss SB35).
Размер речевой части - 2,1Гбайт. В речевой корпус входят:
• сам корпус данных (аудио файлы и файлы с аннотацией)
• произносительный словарь корпуса данных
• сопутствующее программное обеспечение.
Объем речевого корпуса данных TeCoRus составляет 2.7 Гбайт
1.7.4.4. Речевой корпус центра перспективных разработок компании Ectaco
Речевой корпус непрерывной русской речи, сорзданный компанией Ectaco обладает следующими характеристиками:
• количество дикторов
• количество произнесенных предложений
• Среднее количество фонем в предложении
• Общее время записи 7.75 hours
• Sample rate: 16000 Hz
• Sampling format: 1 channel 16-bit linear

Рекомендуемые диссертации данного раздела

Время генерации: 0.119, запросов: 967