ЗАКЛЮЧЕНИЕ

В первой части книги рассмотрены основные теоретические вопросы и проблемы, связанные с формализацией знаний в современных информационных системах и их представлением в словарно-тезаурусной форме. Кроме того, частично приведены результаты экспериментов, выполненных авторами, по исследованию естественно-языкового описания предметной области, представленной корпусом текстов еженедельника “Computer Week”.

Целью экспериментов было определение возможности создания автоматизированной методики построения семантического словаря-тезауруса как наиболее удобной и практичной формы представления знаний. Фактически проведенные исследования показали, что с помощью формальных методов можно зафиксировать объективные связи между естественно-языковыми единицами в тексте. Полученный результат имеет практическое значение для решения инженерных задач, например, в области построения информационно-поисковых систем и справочных систем, предметных словарей или энциклопедий, а также может использоваться для снижения “уровня субъективности” при определении связей между понятиями.

В ходе проведенных исследований были решены задачи, которые являются ключевыми при автоматизированном построении семантического словаря-тезауруса:

·          разработаны формальные модели естественно-языковых объектов различных уровней и определены их свойства;

·          разработаны формальные методы, работающие с моделями естественно-языковых объектов и позволяющие получать количественные значения их характеристик;

·          разработаны основы методики автоматизированного построения семантического словаря-тезауруса;

·          разработан программный комплекс, реализующий отдельные операции, алгоритмы, а также шаги разработанной методики;

·          получены экспериментальные карты понятий, включающие максимум характеристик, потенциально используемых в семантических словарях-тезаурусах.

При проведении исследований авторами использовался программный комплекс “Интерлекс”, в котором реализованы практически все описанные в первой части книги формальные методы и алгоритмы работы с естественно-языковой информацией. Данный комплекс может быть использован в дальнейшем в учебно-методических и исследовательских целях и позволяет на практике проверить правильность предположений и гипотез, сделанных в первой части этой книги. Полное его описание приведено во второй части.

На основе теоретических разработок и анализа практических результатов стала возможной разработка практической (инженерной) методики автоматизированного построения семантического словаря-тезауруса. Такой словарь был построен и приведен в третьей части этой книги.