ЗАКЛЮЧЕНИЕ
В первой
части книги рассмотрены основные теоретические вопросы и проблемы, связанные с формализацией
знаний в современных информационных системах и их представлением в
словарно-тезаурусной форме. Кроме того, частично приведены результаты
экспериментов, выполненных авторами, по исследованию естественно-языкового
описания предметной области, представленной корпусом текстов еженедельника
“Computer Week”.
Целью
экспериментов было определение возможности создания автоматизированной методики
построения семантического словаря-тезауруса как наиболее удобной и практичной
формы представления знаний. Фактически проведенные исследования показали, что с
помощью формальных методов можно зафиксировать объективные связи между
естественно-языковыми единицами в тексте. Полученный результат имеет
практическое значение для решения инженерных задач, например, в области
построения информационно-поисковых систем и справочных систем, предметных
словарей или энциклопедий, а также может использоваться для снижения “уровня
субъективности” при определении связей между понятиями.
В ходе
проведенных исследований были решены задачи, которые являются ключевыми при
автоматизированном построении семантического словаря-тезауруса:
·
разработаны
формальные модели естественно-языковых объектов различных уровней и определены
их свойства;
·
разработаны
формальные методы, работающие с моделями естественно-языковых объектов и
позволяющие получать количественные значения их характеристик;
·
разработаны
основы методики автоматизированного построения семантического
словаря-тезауруса;
·
разработан
программный комплекс, реализующий отдельные операции, алгоритмы, а также шаги
разработанной методики;
·
получены
экспериментальные карты понятий, включающие максимум характеристик,
потенциально используемых в семантических словарях-тезаурусах.
При
проведении исследований авторами использовался программный комплекс
“Интерлекс”, в котором реализованы практически все описанные в первой части
книги формальные методы и алгоритмы работы с естественно-языковой информацией.
Данный комплекс может быть использован в дальнейшем в учебно-методических и
исследовательских целях и позволяет на практике проверить правильность
предположений и гипотез, сделанных в первой части этой книги. Полное его
описание приведено во второй части.
На
основе теоретических разработок и анализа практических результатов стала
возможной разработка практической (инженерной) методики автоматизированного
построения семантического словаря-тезауруса. Такой словарь был построен и
приведен в третьей части этой книги.