Кратко опишем лингвистические предпосылки, заложенные в основу TextAnalyst.
В структуре языковой семантики выделяются две взаимосвязанные составляющие значений языковых единиц - грамматические и лексические значения.
Лексические компоненты значений представляются корневыми морфемами и их цепочками, а грамматические - флективными морфемами на уровне поверхностного синтаксиса и классами флективных морфем, эквивалентных с точки зрения передачи основных аспектов значения, а также их цепочками на уровне семантического синтаксиса.
Объединяясь, лексические и грамматические значения образуют семантическую сеть. Элементы семантической сети соответствуют лексическим значениям, связи между элементами отражают смысловые взаимосвязи, а грамматические значения определяют характер связей.
Анализ текста реализуется как динамический процесс его отображения на семантическую сеть, в ходе которого лексические и грамматические компоненты значений языковых единиц актуализируют соответствующие элементы и связи. При этом производится глубинное синтаксическое членение текста на сверхфразовые единства (СФЕ) с формированием тема-рематической иерархии, характеризующей его смысловую структуру. |