- бизнес-книги
- детские книги
- дом, дача
- зарубежная литература
-
знания и навыки
- изучение языков
- компьютерная литература
- научно-популярная литература
- словари, справочники
-
учебная и научная литература
- безопасность жизнедеятельности
- военное дело
- гуманитарные и общественные науки
- естественные науки
- задачники
- монографии
- научные труды
- практикумы
- прочая образовательная литература
- сельское и лесное хозяйство
- технические науки
- учебники и пособия для вузов
- учебники и пособия для ссузов
- учебно-методические пособия
- история
- комиксы и манга
- легкое чтение
- психология, мотивация
- публицистика и периодические издания
- родителям
- серьезное чтение
- спорт, здоровье, красота
- хобби, досуг
Ю. И. Бутенко — Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов
Понравилась книга? Поделись в соцсетях:
Автор: Ю. И. Бутенко
Издатель: Синергия
Год: 2021
Описание: В статье представлен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов на основе структурных моделей терминологических словосочетаний. Описаны существующие подходы к извлечению терминов на основе метода извлечения устойчивых словосочетаний, статистических и гибридных методов, а также отмечены лингвистические аспекты терминоведения, не охваченные перечисленными методами. Охарактеризован лексический состав научно-технических текстов, приведена классификация специальной лексики в научно-технических текстах. Изучены структурные особенности терминологической лексики. Представлены наиболее продуктивные модели многокомпонентных терминологических словосочетаний в русском языке. Предложен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов, а также описаны его этапы. Показано, что на первом этапе проводится морфолого-синтаксический анализ текста путем приписывания каждому слову его грамматических характеристик. Затем происходит исключение частей речи, которые не могут входить в состав русскоязычных многокомпонентных терминов, а также стоп-слов, которые вместе с термином образуют свободные словосочетания. Полученные цепочки слов далее соотносятся с шаблонами терминологических словосочетаний, имеющихся в базе структурных моделей терминов, а также с терминологическим словарем на предмет наличия исследуемого термина-кандидата. Обоснована необходимость привлечения терминолога для разрешения неоднозначных случаев. Каждый этап метода извлечения русскоязычных многокомпонентных терминов из научно-технических текстов проиллюстрирован примерами. Перечислены перспективы исследования, а также обоснована необходимость усложнения методов извлечения терминов путем дальнейшей классификации терминологической лексики по формальной и семантической структурам, видам антропоморфных терминов, номенклатурным названиям, нормативности/ненормативности терминологических единиц.