А.В.Белоус

CASE–средства наполнения баз знаний
для экспертных систем

В функциональной схеме экспертной системы (ЭС) можно выделить пять основных модулей: базу знаний (БЗ), машину логического вывода, семантический интерфейс, модули объяснения и накопления знаний.

Данная работа посвящена вопросам построения модуля накопления знаний. Этот модуль играет роль посредника между ядром ЭС и пользователем — экспертом, наполняющим БЗ. Посредник выполняет преобразование первичной семантической информации во вторичную, адекватную первичной и пригодную для автоматизированной обработки на компьютере. Кроме того, он обеспечивает актуализацию знаний, хранящихся в БЗ, и решение задач в изменяющихся условиях функционирования ЭС [Соломатин, 1994]. Модуль накопления знаний нами рассматривается исключительно в контексте получения знаний от эксперта и не включает процедуру обработки и извлечения знаний из другой первичной информации.

Формально экспертная система может быть представлена следующим образом [Малыгин, 1996]:

{Y, M, P}, где

Y – система управления знаниями;
M – система знаний, или декларативная составляющая знаний;
P – система получения данных, процедурная составляющая знаний.

Система управления знаниями Y представляет собой множество формальных определений для представления и манипулирования знаниями, а также соответствующих им механизмов.

Система знаний M представляет собой множество взаимосвязанных моделей знаний (или моделей предметной области) {m}. Это конкретные знания.

Система получения данных Р представляет собой множество процедур получения информации:

Р = {P1, P2, P3 }, где

P1 процедура взаимодействия с пользователем;
P2 процедура взаимодействия с базой данных;
P3 процедура анализа состояния предметной области.

Рассматриваемый нами модуль накопления знаний относится к процедурам взаимодействия с пользователем:

P1 = { P11, P12, P13}, где

P11 модуль накопления знаний;
P12 модуль интерактивного ввода текущих данных;
P13 модуль объяснения.


В свою очередь P11 представляет собой совокупность следующих элементов: {I, {K}, {T}, V}, где

I – интерфейс взаимодействия с пользователем;
{K} – множество моделей представления вводимых данных, включая модели на которых основывается непосредственно БЗ;
{T} – множество процедур трансляции из одной модели К в другую;
V – процедура верификации введенных данных.

Согласно [Осуга, 1990], в зависимости от способности системы к формализации можно выделить следующие уровни приобретения знаний:

А. Получение информации без логических выводов.

          1. Ввод программ.

          2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в форме знаний.

          1. Получение готового набора знаний, представленных во внутреннем формате.

          2. Получение знаний, представленных во внутреннем формате, в режиме диалога.

          3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

          1. Параметрическое обучение.

          2. Обучение на основе выводов по аналогии.

          3. Обучение на основе выводов по индукции — эвристическое обучение.

Г. Приобретение знаний на метауровне.

Современные ЭС используют методы приобретения знаний категорий Б (TEIRESIAS, Image Expert [IMAGE EXPERT, 1992; Филиппович, 1994]) и В (Meta-Dendral, Expert-Easy). Однако все они предусматривали использование отдельного специалиста — инженера по знаниям — для непосредственного взаимодействия с модулем накопления знаний. При этом предполагалось, что инженер по знаниям обладает необходимым комплексом знаний и навыков для работы с экспертной системой, а именно: практические навыки по организации опроса экспертов и обработке его результатов, знания о принятой модели представления знаний, опыт представления полученных в результате опроса данных в принятой модели, и, в то же время, имеет определенные знания в предметной области создаваемой экспертной системы.

Однако со временем стало очевидным, что использование инженеров по знаниям в качестве проводников знаний от экспертов к экспертной системе не достаточно эффективно. В работе [Show, 1987] выделены следующие причины такого положения:

Кроме того, отказ от использования инженера по знаниям как посредника между экспертом и ЭС даст возможность повысить доверие специалистов к заключениям ЭС и, что особенно интересно, позволит использовать ЭС как своего рода "записную книжку" эксперта. Подобное использование ЭС, как показал опыт работы над рядом экспертных систем в среде Image Expert, представляет интерес для высококвалифицированных специалистов, так как позволяет им структурировать свои знания, выявить противоречия и пробелы и, наконец, облегчить процесс вхождения в проблематику предметной области после перерыва в работе.

Существо проблемы состоит в том, что невозможно просто убрать инженера по знаниям из процесса наполнения БЗ. Более продуктивным представляется путь сочетания обоих методов. При этом встает проблема разбиения общей задачи наполнения БЗ на отдельные сегменты, в пределах которых недостатки использованного метода компенсируются его преимуществами. Синтез критериев разбиения задачи на сегменты в общем случае процедура неформальная и решаться она должна совместно инженером по знаниям и экспертами исходя из специфики предметной области, используемых средств наполнения БЗ и степени владения экспертами технологией экспертных систем. При этом экспертом должен выполняться основной объем работы по формализации, а роль инженера по знаниям сводится к участию в постановке задач и стыковке отдельных фрагментов, созданных экспертами. Для того чтобы основной объем работы мог выполняться экспертами требуется создание специальных инструментальных средств, позволяющих неспециалисту в области экспертных систем достаточно свободно работать над созданием БЗ. В работе [Show, 1987] подобные средства носят название knowledge support systems (KSS) — системы поддержки инженерии знаний.

Основные требования к KSS:

  1. KSS должна быть независима от предметной области.
  2. KSS должна быть применима непосредственно экспертами без посредников.
  3. KSS должна допускать доступ к различным источникам знаний, включая текст, опросы экспертов, наблюдения за поведением эксперта.
  4. KSS должна содержать возможность ввода неполной или противоречивой информации от различных экспертов.
  5. KSS должна поддерживать различные формы знаний и связей между знаниями.
  6. KSS должна иметь возможность представлять знания из различных источников с помощью связей происхождения, логических и структурных связей.
  7. Пользователи KSS должны иметь возможность применять знания в различных близких областях и свободно экспериментировать с их сочетаниями.
  8. KSS должна обеспечивать проверку приобретенных знаний.
  9. По возможности KSS должна быть основана на хорошо разработанных и ясных теориях приобретения, извлечения и представления знаний.
  10. Развитие KSS должно вести к интегрированной системе.

При создании современных KSS наиболее перспективным представляется использование бурно развивающейся в последнее время технологии CASE–систем. Действительно, программные средства, характерные для CASE–систем, такие как наглядный графический интерфейс, интегрированная база данных для хранения спецификаций, средства анализа спецификаций и прототипирования, позволяют эффективно работать над созданием БЗ как индивидуально, так и коллективом. Набор используемых средств описания в обычных CASE–системах уже в достаточной степени устоялся. Сюда входят функциональные и структурные диаграммы, диаграммы переходов состояний и ряд других. Однако в силу специфичности задач, стоящих перед экспертом при наполнении БЗ, при применении в KSS требуется некоторая доработка этих средств, а также создание новых.

Рассмотрим средства описания, используемые в разрабатываемой в настоящее время CASE–системе наполнения БЗ системы Image Expert IE–CASE.

В данной системе предусмотрено использование двух видов диаграмм. Диаграмма нижнего уровня в графическом виде отражает модель представления знаний, принятую в Image Expert (рис. 1). В системе Image Expert определены три типа моделей знаний.

  1. Модель типа МЕНЮ используется для организации в единую систему различных. как правило, не связанных по информации, но объединенных общей тематикой информационных единиц (моделей, процедур на языке обработки изображений и внешних модулей).
  2. Модель типа НЕЙЛОР позволяет организовывать процедуру логического вывода, представляющую собой итерационный процесс принятия решения, каждый шаг которого частично изменяет (подтверждает/ опровергает) вероятности гипотез.
  3. Модель типа ЛОГИКА может быть использована для решения задач, характеризующихся полнотой описания предметной области, то есть в тех случаях, когда имеется возможность применить решающие правила.

Модель знаний имеет четыре уровня:

Рис. 1. Пример диаграммы нижнего уровня

Блоки данной диаграммы соответствуют уровням модели знаний. Связи между блоками характеризуют отношения между уровнями. В рамках приведенной в начале классификации уровней приобретения знаний данную диаграмму можно отнести к уровню Б.1 (получение готового набора знаний, представленных во внутреннем формате). Использование этой диаграммы дает возможность пользователю более свободно оперировать структурными единицами БЗ, наглядная форма представления позволяет в большей степени, чем принятая изначально в системе Image Expert текстовая форма, работать с БЗ в целом, чем достигается уменьшение количества ошибок и повышение общей эффективности работы.

Диаграмма верхнего уровня не связана с принятой в системе Image Expert моделью представления знаний и служит для абстрактного описания предметной области (рис. 2).

Рис. 2. Пример диаграммы верхнего уровня

Данная диаграмма базируется на системе описания SSONET (Structured Semantic Object Network) [Mohan, 1993].

SSONET имеет три различных концептуальных уровня. Верхний уровень, называемый абстрактным, включает специфические знания о предметной области. Ниже находится уровень соответствующий уровню схем в объектно-ориентированных базах данных. Нижний уровень — уровень отдельных экземпляров соответствует уровню данных в различных базах данных. Существует пять основных типов объектов 1 – Class, 2 – LinkType, 3 – Instance, 4 – ClassLink, 5 – InstanceLink. Полный набор LinkType определяет различные семантические связи, относящиеся к предметной области модели. Предполагается, что счетное множество элементарных типов связей описывает семантику определенной предметной области. Связи могут быть как направленными, так и не направленными. Верхние два уровня среды состоят из объектов Class, ClassLink и LinkType. Class и ClassLink присутствуют на обоих уровнях, но LinkType только на абстрактном.

Эта диаграмма относится к уровню Б3 (получение знаний, представленных во внешнем формате, и их понимание) классификации уровней приобретения знаний. При помощи данной диаграммы эксперт создает модель предметной области: задает типы объектов, связи между ними, описывает структуру целей экспертизы и их содержание.

При работе с диаграммами как верхнего, так и нижнего уровня пользователю доступны средства верификации, позволяющие выявлять неполноту и противоречивость описания. Законченные части описания могут быть занесены в базу данных с тем, чтобы затем использовать их далее как единые блоки.

Работа эксперта с IE-CASE строится следующим образом.

  1. Создается диаграмма верхнего уровня.
  2. В автоматизированном режиме диаграмма верхнего уровня транслируется в диаграмму нижнего уровня.
  3. Диаграмма нижнего уровня редактируется и дополняется до окончательного вида.
  4. Диаграмма нижнего уровня транслируется в текстовую БЗ, которая и используется Image Expert.

Предлагаемые средства для работы над созданием БЗ конечно же требуют от эксперта определенных специальных знаний о принятой в экспертной системе модели знаний и навыков работы по созданию формализованных описаний, однако эти требования, как представляется, не выходят за рамки разумных. Подобное усложнение работы эксперта по сравнению, например, с системой KITTEN (Knowledge Initiation & Transfer Tools for Experts and Novices) [Show, 1987], в которой от эксперта требуется лишь ранжировать объекты по различным признакам, дает возможность резко улучшить выразительные средства описания предметной области и расширить область применения системы.

В заключение рассмотрим соответствие предлагаемой системы приведенным ранее требованиям к KSS.

  1. Данная система независима от конкретной предметной области, модели данных не содержат каких бы то ни было специфических структур.
  2. Опыт применения таких методологий как SADT, IDEF0-2 и подобных специалистами различных областей дает возможность утверждать, что предлагаемая KSS может применяться непосредственно экспертами.
  3. В настоящее время в системе не предусмотрена возможность использования других источников знаний, кроме введенных экспертом моделей и описаний на языке представления знаний системы Image Expert. Однако нет принципиальных ограничений на дополнение системы средствами работы с другими источниками.
  4. Использование CASE–технологии предусматривает возможность одновременной работы над проектом группы экспертов. Использование единого словаря дает возможность объединять модели разных экспертов.
  5. Использование диаграмм двух уровней обеспечивает представление знаний в двух принципиально разных, но логически связанных формах.
  6. Как отмечено в п.3, система на сегодняшний день ограничена в количестве источников знаний, с добавлением новых источников соответственно будут добавлены и специальные средства представления знаний из них.
  7. Система не налагает ограничения на описания. Возможен экспорт моделей в другие проекты.
  8. Встроенные средства верификации введенных данных дают возможность выявлять неполноту и противоречивость описания.
  9. Используются хорошо известные и апробированные на практике модели представления и приобретения знаний:
  10. Предлагаемая система позволяет дополнить ее средствами конструирования экранных форм, интерфейсов и т.п.

Таким образом, IE–CASE удовлетворяет большинству выдвигаемых к KSS требований, что позволяет предположить ее жизнеспособность и полезность, причем как экспертам, так и инженерам по знаниям.