- Бизнес-Книги
- Боевики
- Детективы
- Детские книги
- Дом, Семья
- Зарубежная литература
- Искусство
- Классика
- Книги по психологии
- Компьютеры
- Любовные романы
- Наука, Образование
- Периодические издания
- Повести, рассказы
- Поэзия, Драматургия
- Приключения
- Публицистика
- Религия
- Современная проза
- Справочники
- Фантастика
- Фэнтези
- Юмор
Ю. Н. Орлов — Определение жанра и автора литературного произведения статистическими методами
Понравилась книга? Поделись в соцсетях:
Автор: Ю. Н. Орлов
Издатель: Синергия
Год: 2010
Описание: В работе решается задача кластеризации литературных текстов по авторам и жанрам статистическими методами. Основным инструментом анализа являются функции распределения текста по буквам и буквосочетаниям, а также выборочные буквенные распределения, построенные по фрагментам текстов. Для набора текстов, объём наименьшего из которых достаточен для того, чтобы считать буквенное распределение каждого из них стационарным с ошибкой не более 3%, вычисляются расстояния между распределениями букв в пространстве суммируемых функций. Критерий кластеризации, основанный на близости между двухбуквенными распределениями текстов, позволяет правильно идентифицировать автора с ошибкой не более 5%, а жанр – с ошибкой не более 15%. Однобуквенные распределения дают ошибку 15% и 25% соответственно.