Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Овчинников, Павел Евгеньевич
01.04.03
Кандидатская
2009
Нижний Новгород
102 с. : ил.
Стоимость:
499 руб.
Используемые сокращения
ИНС - искусственная нейронная сеть.
МСП - многослойный персептрон.
ОРО — обратное распрос гранение ошибки.
НСЗВ - нейронная сеть с задержками времени. ОСШ - отношение сигнал/шум.
РБФ - радиальные базисные функции.
СОК — самоорганизующаяся карта.
GMDH - group method of data handling.
RCE - restricted Coulomb energy.
RBF - radial basis function.
ФМ — фазоманипулированный.
ЧМ - частотно-манипулированный.
АРУ - автоматическая регулировка усиления. АЦП - аналогово-цифровой преобразователь. КИХ - конечная импульсная характеристика. КПР - коэффициент правильного распознавания.
Используемые сокращения
Глава 1. Применение ИНС в задачах обработки сигналов (литературный обзор)
1.1. ИНС, основные понятия
1.1.1. Узлы искусственных нейронных сетей
1.1.2. Топологии нейронных сетей
1.2. Классификация образов при помощи ИНС
1.2.1. Вероятностные классификаторы
1.2.2. Гиперплоскостные классификаторы (Hyperplane Classifiers)
1.2.2.1. Сеть прямого распространения (многослойный персептрон)
1.2.2.1.1. Обучение
1.2.2.2. Классифицирующие деревья
1.2.2.3. Сети высокого порядка
1.2.3. Ядерные классификаторы (Kernel Classifiers)
1.2.3.1. Классификаторы с радиальными базисными функциями
1.2.4. Классификаторы по образцу
1.2.4.1. Карты признаков
1.2.4.2. Обучающиеся векторные квантователи
1.2.4.3. Гиперсферные классификаторы
1.2.5. Выбор классификатора
1.3. Приложения ИНС в задачах обработки сигналов
1.3.1. Фильтрация
1.3.2. Фазовая автоподстройка частоты
1.3.3. Определение типа модуляции
1.3.4. Детектирование
1.3.5. Распознавание речи
1.4. Выводы
Глава 2. Применение ИНС в задаче детектирования фонем без сегментирования речевого сигнала
2.1. Определение размеров нейросетевого классификатора
2.2. Формирование набора параметров сигнала для распознавания фонем
2.2.1. Коэффициенты линейного предсказания
2.2.2. Частотно-временной анализ (банк фильтров)
2.2.3. Кепстральные коэффициенты
2.2.4. Коэффициенты вейвлет-преобразования
2.3. Влияние способа параметризации на эффективность распознавания
2.4. Анализ пространств признаков речевого сигнала
2.5. Распознавание фонем без сегментирования речевого сигнала
2.5.1. Обучение, не требующее сегментации
2.5.2. Экспериментальное применение метода обучения без сегментации
2.6. Выводы
Глава 3. Применение ИНС в задачах обнаружения и детектирования модулированных сигналов в условиях непостоянства параметров
3.1. Детектирование фазоманипулированных сигналов
3.1.1. Нейросетевой метод детектирования
3.1.2. Символьная синхронизация
3.1.3. Определение параметров сети
3.1.4. Выбор способа параметризации сигнала
3.1.5. Формирование выборки для обучения, исследование устойчивости к шуму и сдвигу частоты
3.1.6. Влияние полосы пропускания на эффективность детектирования
3.2. Детектирование частотно-манипулированных сигналов
3.3. Обнаружение фазоманипулированных сигналов
3.4. Выводы
Глава 4. Реализация нейросетевых алгоритмов и эксперимент на реальных сигналах
4.1. Реализация нейросетевых алгоритмов обработки сигналов
4.1.1. Метод ускорения обучения с минимизацией энтропии ошибки
4.1.2. Исследование метода обучения и результаты
4.2. Эксперимент на реальных сигналах
Заключение
Литература
Приложение
Процедура Дурбина для вычисления коэффициентов линейного предсказания
вычислялся коэффициент правильного распознавания (КПР). В результате были получены кривые зависимостей КПР от ширины интервала начальных значений весов а, как описано выше. Каждая точка на кривой является результатом усреднения КПР по серии из 10 обучений и распознаваний. Эти кривые характеризуют эффективность распознавания звуков в зависимости от способа параметризации. Поскольку исходная информация (речевой сигнал) была одинаковой для всех способов параметризации, то по результатам сравнения эффективности распознавания можно судить об адекватности того или иного способа задаче распознавания речи.
На рис. 13 представлены зависимости коэффициента правильного распознавания от начального разброса весов а для перечисленных выше методов подготовки данных. Вертикальными интервалами показаны величины стандартного отклонения в соответствующих точках, вычисленные по формуле (52). Видно, что коэффициент правильного распознавания выше для методов выделения характеристик, основанных на банке фильтров. Такой результат можно объяснить тем, что из сравниваемых методов банк фильтров более всего соответствует процессу обработки акустического сигнала в человеческой слуховой системе, где по существу выполняется спектральное преобразование [135].
Использование в банке фильтров логарифмической шкалы по энергии обеспечило небольшой (1-2%) прирост коэффициента правильного распознавания и значительное уменьшение времени обучения. На рис
начальный разброс весов
Рис. 13. Зависимости коэффициента распознавания фонем от начальных условий процедуры обучения для разных способов выделения характеристик. FB - банк фильтров, logFB - банк фильтров с логарифмической шкалой по энергии, cepstrum -кепстральные коэффициенты, wavelet - характеристики, полученные на основании вейвлет-преобразования, LPC - коэффициенты линейного предсказания. Вертикальные интервалы - удвоенные величины стандартного отклонения в соответствующих точках
Название работы | Автор | Дата защиты |
---|---|---|
Моделирование характеристик рассеяния волн групповыми отражателями и отражателями сложной структуры | Скородумова, Елена Александровна | 2007 |
Теория пространственно-временной модуляции светового поля волновыми акустическими пучками и пакетами в кристаллах | Задорин, Анатолий Семенович | 1999 |
Эффекты мультистабильной динамики в системах взаимодействующих биологических осцилляторов | Гордлеева, Сусанна Юрьевна | 2015 |