Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Корж, Василий Вадимович
05.13.06
Кандидатская
2000
Москва
161 с.
Стоимость:
250 руб.
ВВЕДЕНИЕ . ГЛАВА 1. Особенности решения задачи классификации текстовых документов . Нейрокомпьютинг способ решения сложных задач. ВЫВОДЫ ПО ПЕРЕСЙ ГЛАВЕ. ГЛАВА 2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ. Определение информативности признаков и границ разделения частот признаков в методе бионной системы кодирования текстов . Отбор и группирование информативных признаков в методе бионной системы кодирования текстов . Формирование входов нейронных сетей з методе бионной системы кодирования текстов. Метод самокастраиваюдегося словаря ключевых слов. Формирование слов формирование признаков классов и кодирование текстов в метоле самонастраивающегося словаря ключевых слов . Кейросетевсй подход к решению задачи классификации. Формирование классификаторов. Выводы по второй главе. ГЛАВА 3. ИНЖЕНЕРНОЕ РЕШЕНИЕ ЗАДАЧИ ПОСТРОЕНИЯ АСКТ. Программноалгоритмическое обеспечение решения задачи классификации текстов. Выходы программы подготовки данных АСКТ на основе метода самонастраивающегося словаря ключевых слов.
Таким образом, необходимо учитывать оба подхода к определению важности термина. В модели, учитывающей различительную силу термина , хорошим термином считается такой, который, будучи приписан документу при индексировании, делает документы разных классов максимально непохожими друг на друга. Плохим считается такой термин, который делает документы белее похожими друг на друга, вследствие чего их различить становится труднее. Чем менее похожими будут зекторы индексационных терминов, соответствующие текстам, тем легче будет различать тексты. В модели, оснозанной на оценке информативности термина , в качестве входной информации используются оценки релевантности, полученные экспертами. Каждому термину присваивается специальный параметр, называемый информативностью. В начальный момент для всех терминов значения информативности равны 1. Если термин найден в списании класса и з документе, оцененном как релевантный, его значение информативности медленно повышается вплоть до максимального значения 2. Если же документ оценивается как нерелевантный, значение информативности термина постепенно снижается до 0. Во всех моделях индексирования специально предусматривается исключение некоторых высокочастотных терминов, которые не считаются ценными с точки зрения отражения содержания документа. Так, для исключения таких слов обычно применяются стопсписки и отрицательные словари. После исключения общеупотребительных слоз из оставшихся терминов можно удалить термины со значимостью ниже некоторого порога.
| Название работы | Автор | Дата защиты |
|---|---|---|
| Синтез и применение алгоритмов идентификации как замкнутых динамических систем | Агеев, Дмитрий Анатольевич | 2013 |
| Микропроцессорные системы управления и распознавания для агротехнологий | Ерков, Аркадий Александрович | 2005 |
| Автоматизация калибровки бесплатформенных инерциальных навигационных систем на волоконно-оптических гироскопах | Ермаков, Владимир Сергеевич | 2007 |