Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Лексин, Василий Алексеевич
01.01.09
Кандидатская
2011
Москва
94 с. : ил.
Стоимость:
499 руб.
Оглавление
Введение
1 Задачи и методология анализа клиентских сред
1.1 Структура исходных данных
1.2 Прикладные задачи, потребности
1.3 Методология анализа клиентских сред
2 Обзор методов коллаборативной фильтрации
2.1 Корреляционные алгоритмы
2.2 Модельные алгоритмы
2.2.1 Латентный семантический анализ
2.2.2 Вероятностный латентный семантический анализ
2.2.3 Иерархический вероятностный латентный семантический анализ
2.3 Методы задания начального приближения профилей
3 Вероятностный латентный семантический анализ
3.1 Восстановление скрытых профилей клиентов и объектов
3.1.1 Вероятностная модель порождения данных
3.1.2 Модификация стандартного подхода
3.1.3 Симметризованный подход
3.1.4 Сравнение подходов
3.2 Оценка скорости сходимости £?М-алгоритма
3.2.1 Оценка асимптотической скорости сходимости
3.2.2 Условие суперлинейной сходимости
3.3 Методы улучшения сходимости ЕМ-алгоритма
3.3.1 Задание начального приближения профилей
3.3.2 Метод сглаженной корреляции
3.3.3 Начальное приближение профилей по представительным объектам
3.3.4 Обнуление малых компонент скрытых переменных и профилей
4 Эксперименты
4.1 Описание наборов данных
4.1.1 Моделирование данных
4.1.2 Данные поисковой машины
4.1.3 Данные интернет-магазина
4.2 Функционалы качества
4.2.1 Сравнение профилей
4.2.2 Функционал качества на модельных данных
4.2.3 Функционалы качества на реальных данных
4.3 Описание экспериментов
4.3.1 Сравнение различных алгоритмов АКС
4.3.2 Начальное приближение
4.3.3 Методика обнуления малых компонент скрытых переменных
4.3.4 Карта сходства всех объектов
4.3.5 Локальная карта сходства объектов
4.3.6 Интерпретации и выводы
Заключение
Список иллюстраций
Литература
Здесь и далее в статье используется мнемоническое правило: через р обозначаются все вероятности, связанные с клиентами, а через q — все вероятности, связанные с объектами.
Вероятность р(и,г) выбора объекта г клиентом и в формуле (3.1) получается следующим интуитивно понятным образом. Априорная вероятность ри того, что выбор будет сделан клиентом и умножается на вероятность ptu его интереса к теме t и на апостериорную вероятность q(rt) принадлежности объекта г к этой же теме t. Такие произведения суммируются по всем темам t £ Т. Модели (3.2) и (3.3) выражаются через (3.1) по формуле Байеса.
Задача вероятностного латентного семантического анализа — оценить по транзакционным данным Т> или по матрице кросстабуляции F профили клиентов и объектов, используя одно из представлений вероятностной модели (3.1)-(3.3).
Стандартный метод PLSA, представленный в работах [23, 17, 22] описан в главе 2. Далее будет рассмотрена модификация стандартного подхода и симметризованный подход PLSA.
3.1.2 Модификация стандартного подхода
Рассмотрим модель (3.1), записанную в другом виде:
р{и, г) = puqr 2 qtrPtu/Pt (3.4)
По известному протоколу Т> легко оценить априорные вероятности
S(u) S(r)
Ри = иеЫ; qr= — , г еп, (3.5)
Название работы | Автор | Дата защиты |
---|---|---|
Анализ сложности и разработка алгоритмов решения задач календарного планирования и теории расписаний | Сервах, Владимир Вицентьевич | 2009 |
Исследование паттернов в текстах на основе динамических моделей | Кижаева, Наталья Александровна | 2018 |
Задача оптимального управления в модели эпидемии | Овсянникова, Наталья Игоревна | 2009 |