- бизнес-книги
- детские книги
- дом, дача
- зарубежная литература
-
знания и навыки
- изучение языков
- компьютерная литература
- научно-популярная литература
- словари, справочники
-
учебная и научная литература
- безопасность жизнедеятельности
- военное дело
- гуманитарные и общественные науки
- естественные науки
- задачники
- монографии
- научные труды
- практикумы
- прочая образовательная литература
- сельское и лесное хозяйство
- технические науки
- учебники и пособия для вузов
- учебники и пособия для ссузов
- учебно-методические пособия
- история
- комиксы и манга
- легкое чтение
- психология, мотивация
- публицистика и периодические издания
- родителям
- серьезное чтение
- спорт, здоровье, красота
- хобби, досуг
Ю. Н. Орлов — Определение жанра и автора литературного произведения статистическими методами
Понравилась книга? Поделись в соцсетях:
Автор: Ю. Н. Орлов
Издатель: Синергия
Год: 2010
Описание: В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.