+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Фонетические аспекты речевых технологий

  • Автор:

    Скрелин, Павел Анатольевич

  • Шифр специальности:

    10.02.19

  • Научная степень:

    Докторская

  • Год защиты:

    1999

  • Место защиты:

    Санкт-Петербург

  • Количество страниц:

    76 с.; 20х14 см

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Введение
Речевые технологии - это одно, из направлений информационных технологий, которое занимается проблемами общения человека с компьютером (или человека с человеком посредством компьютера) на основе использования естественного языка в звуковой его форме. Для лингвиста речевые технологии - это способ моделирования системы языка и речевой деятельности человека, это основа для практического применения знаний о звуковых средствах языка, это способ получения новых сведений, важных для развития фонетики и фонологии. К настоящему времени лингвистика накопила огромное количество сведений о принципах организации и функционирования звуковой формы естественных языков. Эти сведения получены в ходе теоретических и экспериментальнофонетических исследований и носят преимущественно описательный характер. Однако действительная ценность и полнота полученных данных может быть проверена путем экспериментов по моделированию естественных процессов порождения и восприятия речи. Наблюдения за функционированием моделей естественных процессов показывают, какие сведения об этих процессах оказались достаточно полными, а каких данных пока недостаточно для их адекватного отражения в модели. Бурное развитие речевых технологий вызвано насущными потребностями современного общества в решении ряда практических задач. При этом для решения таких задач создаются специальные программные и технические средства, которые позволяют существенно увеличить эффективность научных исследований принципов организации и функционирования естественного языка. Данная работа выполнена на кафедре фонетики и методики преподавания иностранных языков Санкт-Петербургского государственного 'нивепситета. Естественно, что такая работа основана на изучении свойств ре-
.ных несенной в
КНИГА ИМЕЕТ : юэкспе-
Актуальность данной работы определяется значительным углублением знаний о свойствах звуковых единиц естественной человеческой речи; эти знания существенно изменяют оценку общефонологических моделей и тем самым влияют на представления о свойствах системы языка вообще. С другой стороны, бурное развитие информационных технологий настоятельно требует использования фонетических сведений при построении современных средств речевого общения со сложными техническими устройствами, занимающими все более значительное место в разных сферах жизни общества.
Апробация исследований. Результаты исследований излагались на международной конференции ИНФО’89 (Минск, 1989), АРСО-16 (Суздаль, 1991), на международном симпозиуме “Антропоморфные системы автоматического синтеза зг распознавания речи” (Санкт-Петербург, 1993), на международной конференции “Linguistic Databases” (Гронинген, Голландия, 1995), на Международном конгрессе фонетических наук (Сан Франциско, 1999), на международных симпозиумах SPECOM - Speech and Computer - (Санкт-Петербург, 1996; Клуж-Напока, Румыния, 1997; Санкт-Петербург, 1998), на международной конференции “Преподавание языка и языковые технологии” (Гронинген, Голландия, 1997). на российско-финском фонетическом семинаре (Хельсинки, 1997; Санкт-Петербург, 1998; Ювяскюля, Финляндия, 1999), на Герценовских чтениях (Санкт-Петербург, 1997), на международных конференциях “Текст, речь, диалог” (Брко, Чехия, 1998; Марнанске Лаз tie, Чехия, 1999), ка Международной конференции “Фонетика сегодня: актуальные проблемы и университетское образование” (Звенигород, 1998), на заседаниях кафедры фонетики и методики преподавания иностранных языков, на Межвузовских конференциях преподавателей и аспирантов филологического факультета СПбГУ (па протяжении последних 10 лет). По теме доклада опубликовано 25 работ, общим объемом около 21 п.л.
В состав речевых технологий входят следующие направления исследований: разработка систем автоматического распознавания и синтеза речи, формирование корпусов речевых данных (акустических баз данных), автоматическая обработка речевого сигнала (выделение частоты основного тона, определение траекторий движения формант, автоматическая сегментация и т.д.), идентификация и
ских слогов во всех возможных ритмических позициях. Текст введен в реализации 4 нормативных дикторов: двух мужчин и двух женщин, представителей московского и петербургского вариантов русской произносительной нормы.
У пользователя есть следующие возможности работы с такой базой данных:
- найти все реализации слога по его графическому или транскрипционному представлению
- получить транскрипцию и звучание фрагмента текста по его орфографическому представлению в реализации указанным(и) диктором(ами).
Для обеспечения возможности озвучивания выбранного фрагмента текста и получения его транскрипционного описания было сделано следующее. В процессе ввода в компьютер текст сегментировался на открытые слоги, и каждый слог записывался в отдельный файл, в названии которого отмечался и его порядковый номер в тексте. В качестве инварианта использовалось орфографическая запись текста, не зависящая от дикторской реализации. Озвучивание указанного пользователем фрагмента текста происходит путем формирования звуковой последовательности из звуковых файлов в том порядке, в каком они следуют в тексте. Аналогичным образом формируется и транскрипционное описание фрагмента текста: из соответствующих полей базы данных в порядке, определяемом по орфогр афической записи, оерутся транскрипционные описания слогов в составе этого фрагмента. Прослушанный фрагмент текста может быть записан в звуковой файл для дальнейшего анализа акустических характеристик (Skrelin, Talanov, 1999).
Звуковой материал введен в формате 16 разрядов ИКМ с частотой дискретизации 20 кГц. База данных выполнена с использованием MS Access 2.0.
На рис. 4 показана реальная фонетическая транскрипция фрагмента (первые четыре фразы) фонетически представительного текста.
Использование материалов этой базы данных позволило получить новые сведения о звуковой реализации аллофонов русских фонем в различных фразовых позициях [Kuznetsov, Sherstinova, 1998].
В настоящее время в эту базу данных вводится звуковой материал по интерферированной речи: чтение фонетически представительного текста болгарами, финнами, американцами, корейцами, в разной степени владеющими русским языком, а также носителями региональных вариантов русского языка. Сама база

Рекомендуемые диссертации данного раздела

Время генерации: 0.134, запросов: 967