- бизнес-книги
- детские книги
- дом, дача
- зарубежная литература
-
знания и навыки
- изучение языков
- компьютерная литература
- научно-популярная литература
- словари, справочники
-
учебная и научная литература
- безопасность жизнедеятельности
- военное дело
- гуманитарные и общественные науки
- естественные науки
- задачники
- монографии
- научные труды
- практикумы
- прочая образовательная литература
- сельское и лесное хозяйство
-
технические науки
- высокие технологии
- горное дело
- информатика и вычислительная техника
- конструкции
- легкая промышленность
- материаловедение
- машиностроение
- нормативная документация
- общетехнические дисциплины
- основы производства
- пищевая промышленность
- приборостроение
- проектирование
- промышленность
- радиоэлектроника
- строительство
- техническая литература
- технологии металлов
- транспорт
- химическая технология
- эксплуатация промышленного оборудования
- энергетика
- учебники и пособия для вузов
- учебники и пособия для ссузов
- учебно-методические пособия
- история
- комиксы и манга
- легкое чтение
- психология, мотивация
- публицистика и периодические издания
- родителям
- серьезное чтение
- спорт, здоровье, красота
- хобби, досуг
М. И. Дли — Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов
Понравилась книга? Поделись в соцсетях:
Автор: М. И. Дли
Издатель: Синергия
Год: 2020
Описание: Одним из приоритетов государственной политики России выступает практическая реализация концепции электронного правительства. Важным элементом этой концепции является организация эффективного взаимодействия органов власти и граждан, которая, помимо оказания государственных услуг, должна включать в себя обработку электронных обращений (заявлений, жалоб, предложений и т.п.). Исследования показывали, что скорость и оперативность обработки обращений в значительной степени зависит от качества определения тематических рубрик, т.е. решения задачи рубрицирования. Проведенный анализ обращений граждан, поступающих на электронную почту и официальные сайты различных органов власти, выявил ряд специфических особенностей (небольшой размер, наличие ошибок в тексте, свободный стиль изложения, рассмотрение нескольких проблем), которые не позволяют успешно применять традиционные подходы к их рубрицированию. Для решения указанной проблемы было предложено использовать различные методы интеллектуального анализа неструктурированных текстовых данных (в частности, нечетко-логические алгоритмы, нечеткие деревья решений, нечеткие пирамидальные сети, нейро-нечеткие классификаторы, сверточные и рекуррентные нейронные сети). В статье описаны условия применимости шести интеллектуальных классификаторов, предложенных для рубрицирования электронных обращений граждан. В их основе лежат такие факторы, как размер документа, степень пересечения тематических рубрик, динамичность их тезаурусов и объемом накопленной статистической информации. Для ситуации, когда конкретная модель не может произвести однозначный выбор тематической рубрики, предложено использовать метод голосования классификаторов, который позволяет существенно снизить вероятность ошибок рубрицирования на основе взвешенного агрегирования решений, полученных несколькими моделями, отобранными с помощью нечетко-логического вывода.