- бизнес-книги
- детские книги
- дом, дача
- зарубежная литература
-
знания и навыки
- изучение языков
- компьютерная литература
- научно-популярная литература
- словари, справочники
-
учебная и научная литература
- безопасность жизнедеятельности
- военное дело
- гуманитарные и общественные науки
- естественные науки
- задачники
- монографии
- научные труды
- практикумы
- прочая образовательная литература
- сельское и лесное хозяйство
-
технические науки
- высокие технологии
- горное дело
- информатика и вычислительная техника
- конструкции
- легкая промышленность
- материаловедение
- машиностроение
- нормативная документация
- общетехнические дисциплины
- основы производства
- пищевая промышленность
- приборостроение
- проектирование
- промышленность
- радиоэлектроника
- строительство
- техническая литература
- технологии металлов
- транспорт
- химическая технология
- эксплуатация промышленного оборудования
- энергетика
- учебники и пособия для вузов
- учебники и пособия для ссузов
- учебно-методические пособия
- история
- комиксы и манга
- легкое чтение
- психология, мотивация
- публицистика и периодические издания
- родителям
- серьезное чтение
- спорт, здоровье, красота
- хобби, досуг
М. И. Дли — Rubrication of text documents based on fuzzy difference relations
Понравилась книга? Поделись в соцсетях:
Автор: М. И. Дли
Издатель: Синергия
Год: 2020
Описание: Одним из ключевых направлений информатизации деятельности органов государственной власти является разработка и внедрение систем автоматизированной обработки электронных обращений (заявлений, жалоб, предложений) физических и юридических лиц, поступающих на официальные веб-сайты и порталы органов власти федеральных округов, администраций областей и других территориальных образований. Важную роль при решении данной задачи играет рубрицирование, которое заключается в распределении обращений по тематическим рубрикам, определяющих направления деятельности департаментов, осуществляющих их обработку и подготовку соответствующего ответа. Результаты анализа специфических особенности таких текстовых сообщений (небольшой размер, отсутствие разметки, наличие ошибок, нестационарность тезауруса и т. п.) подтвердили невозможность применения традиционных подходов к рубрицированию и обосновали целесообразность применения методов интеллектуального анализа данных. В статье предложен новый подход к анализу и рубрицированию электронных неструктурированных текстовых документов, поступающих на официальные веб-сайты и порталы органов государственной власти. Он предполагает формирование древовидной структуры рубричного поля, основанной на нечетких отношениях различия между синтаксическими характеристиками документов. Анализ основывается на определении нечеткого соответствия этих документов по синтаксическим характеристикам со значениями центров кластеров, проводимого последовательно от корня к листьям построенного нечеткого дерева решений. Предлагаемый метод рубрицирования программно реализован и апробирован при автоматизированной обработке и анализе обращений (заявлений, жалоб и предложений) граждан, поступающих в Администрацию Смоленской области. Это позволило обеспечить оперативную и качественную актуализацию рубрик и анализ документов в условиях нестационарности состава тезауруса и значимости слов рубрик.