А

А.В.Белоус

CASE–средства наполнения баз знаний
для экспертных систем

В функциональной схеме экспертной системы (ЭС) можно выделить пять основных модулей: базу знаний (БЗ), машину логического вывода, семантический интерфейс, модули объяснения и накопления знаний.

Данная работа посвящена вопросам построения модуля накопления знаний. Этот модуль играет роль посредника между ядром ЭС и пользователем — экспертом, наполняющим БЗ. Посредник выполняет преобразование первичной семантической информации во вторичную, адекватную первичной и пригодную для автоматизированной обработки на компьютере. Кроме того, он обеспечивает актуализацию знаний, хранящихся в БЗ, и решение задач в изменяющихся условиях функционирования ЭС [Соломатин, 1994]. Модуль накопления знаний нами рассматривается исключительно в контексте получения знаний от эксперта и не включает процедуру обработки и извлечения знаний из другой первичной информации.

Формально экспертная система может быть представлена следующим образом [Малыгин, 1996]:

{Y, M, P}, где

Y – система управления знаниями;
M – система знаний, или декларативная составляющая знаний;
P – система получения данных, процедурная составляющая знаний.

Система управления знаниями Y представляет собой множество формальных определений для представления и манипулирования знаниями, а также соответствующих им механизмов.

Система знаний M представляет собой множество взаимосвязанных моделей знаний (или моделей предметной области) {m}. Это конкретные знания.

Система получения данных Р представляет собой множество процедур получения информации:

Р = {P₁, P₂, P₃ }, где

P₁–процедура взаимодействия с пользователем;
P₂–процедура взаимодействия с базой данных;
P₃–процедура анализа состояния предметной области.

Рассматриваемый нами модуль накопления знаний относится к процедурам взаимодействия с пользователем:

P₁= { P₁₁, P₁₂, P₁₃}, где

P₁₁–модуль накопления знаний;
P₁₂–модуль интерактивного ввода текущих данных;
P₁₃–модуль объяснения.

В свою очередь P₁₁представляет собой совокупность следующих элементов: {I, {K}, {T}, V}, где

I – интерфейс взаимодействия с пользователем;
{K} – множество моделей представления вводимых данных, включая модели на которых основывается непосредственно БЗ;
{T} – множество процедур трансляции из одной модели К в другую;
V – процедура верификации введенных данных.

Согласно [Осуга, 1990], в зависимости от способности системы к формализации можно выделить следующие уровни приобретения знаний:

А. Получение информации без логических выводов.

1. Ввод программ.

2. Ввод фактических данных.

Б. Получение извне информации, уже представленной в форме знаний.

1. Получение готового набора знаний, представленных во внутреннем формате.

2. Получение знаний, представленных во внутреннем формате, в режиме диалога.

3. Получение знаний, представленных во внешнем формате, и их понимание.

В. Обучение по примерам.

1. Параметрическое обучение.

2. Обучение на основе выводов по аналогии.

3. Обучение на основе выводов по индукции — эвристическое обучение.

Г. Приобретение знаний на метауровне.

Современные ЭС используют методы приобретения знаний категорий Б (TEIRESIAS, Image Expert [IMAGE EXPERT, 1992; Филиппович, 1994]) и В (Meta-Dendral, Expert-Easy). Однако все они предусматривали использование отдельного специалиста — инженера по знаниям — для непосредственного взаимодействия с модулем накопления знаний. При этом предполагалось, что инженер по знаниям обладает необходимым комплексом знаний и навыков для работы с экспертной системой, а именно: практические навыки по организации опроса экспертов и обработке его результатов, знания о принятой модели представления знаний, опыт представления полученных в результате опроса данных в принятой модели, и, в то же время, имеет определенные знания в предметной области создаваемой экспертной системы.

Однако со временем стало очевидным, что использование инженеров по знаниям в качестве проводников знаний от экспертов к экспертной системе не достаточно эффективно. В работе [Show, 1987] выделены следующие причины такого положения:

падение цен на аппаратное и программное обеспечение для экспертных систем привело к внедрению этой технологии на массовый рынок быстрее, чем это первоначально предполагалось;
рост потребности в экспертных системах происходит быстрее, чем готовятся опытные инженеры по знаниям;
падающие цены на технологию экспертных систем делают труд инженера по приспосабливанию технологии для отдельных применений чрезмерно дорогим и все более напряженным;
использование трудоемкой технологии, такой как инженерия знаний, противоположно общим тенденциям компьютерной индустрии;
в частности, это противопоставлено тенденции внедрения техники автоматического программирования;
роль инженера по знаниям как стыкующего звена между экспертом и экспертной системой находится под вопросом не только из соображений стоимости, но также связана с ее недостаточной эффективностью — знания могут быть потеряны в процессе передачи, и недостаток знаний эксперта о технологии экспертных систем может быть меньше ущерба наносимого инженером знаниям о предметной области.

Кроме того, отказ от использования инженера по знаниям как посредника между экспертом и ЭС даст возможность повысить доверие специалистов к заключениям ЭС и, что особенно интересно, позволит использовать ЭС как своего рода "записную книжку" эксперта. Подобное использование ЭС, как показал опыт работы над рядом экспертных систем в среде Image Expert, представляет интерес для высококвалифицированных специалистов, так как позволяет им структурировать свои знания, выявить противоречия и пробелы и, наконец, облегчить процесс вхождения в проблематику предметной области после перерыва в работе.

Существо проблемы состоит в том, что невозможно просто убрать инженера по знаниям из процесса наполнения БЗ. Более продуктивным представляется путь сочетания обоих методов. При этом встает проблема разбиения общей задачи наполнения БЗ на отдельные сегменты, в пределах которых недостатки использованного метода компенсируются его преимуществами. Синтез критериев разбиения задачи на сегменты в общем случае процедура неформальная и решаться она должна совместно инженером по знаниям и экспертами исходя из специфики предметной области, используемых средств наполнения БЗ и степени владения экспертами технологией экспертных систем. При этом экспертом должен выполняться основной объем работы по формализации, а роль инженера по знаниям сводится к участию в постановке задач и стыковке отдельных фрагментов, созданных экспертами. Для того чтобы основной объем работы мог выполняться экспертами требуется создание специальных инструментальных средств, позволяющих неспециалисту в области экспертных систем достаточно свободно работать над созданием БЗ. В работе [Show, 1987] подобные средства носят название knowledge support systems (KSS) — системы поддержки инженерии знаний.

Основные требования к KSS:

KSS должна быть независима от предметной области.
KSS должна быть применима непосредственно экспертами без посредников.
KSS должна допускать доступ к различным источникам знаний, включая текст, опросы экспертов, наблюдения за поведением эксперта.
KSS должна содержать возможность ввода неполной или противоречивой информации от различных экспертов.
KSS должна поддерживать различные формы знаний и связей между знаниями.
KSS должна иметь возможность представлять знания из различных источников с помощью связей происхождения, логических и структурных связей.
Пользователи KSS должны иметь возможность применять знания в различных близких областях и свободно экспериментировать с их сочетаниями.
KSS должна обеспечивать проверку приобретенных знаний.
По возможности KSS должна быть основана на хорошо разработанных и ясных теориях приобретения, извлечения и представления знаний.
Развитие KSS должно вести к интегрированной системе.

При создании современных KSS наиболее перспективным представляется использование бурно развивающейся в последнее время технологии CASE–систем. Действительно, программные средства, характерные для CASE–систем, такие как наглядный графический интерфейс, интегрированная база данных для хранения спецификаций, средства анализа спецификаций и прототипирования, позволяют эффективно работать над созданием БЗ как индивидуально, так и коллективом. Набор используемых средств описания в обычных CASE–системах уже в достаточной степени устоялся. Сюда входят функциональные и структурные диаграммы, диаграммы переходов состояний и ряд других. Однако в силу специфичности задач, стоящих перед экспертом при наполнении БЗ, при применении в KSS требуется некоторая доработка этих средств, а также создание новых.

Рассмотрим средства описания, используемые в разрабатываемой в настоящее время CASE–системе наполнения БЗ системы Image Expert IE–CASE.

В данной системе предусмотрено использование двух видов диаграмм. Диаграмма нижнего уровня в графическом виде отражает модель представления знаний, принятую в Image Expert (рис. 1). В системе Image Expert определены три типа моделей знаний.

Модель типа МЕНЮ используется для организации в единую систему различных. как правило, не связанных по информации, но объединенных общей тематикой информационных единиц (моделей, процедур на языке обработки изображений и внешних модулей).
Модель типа НЕЙЛОР позволяет организовывать процедуру логического вывода, представляющую собой итерационный процесс принятия решения, каждый шаг которого частично изменяет (подтверждает/ опровергает) вероятности гипотез.
Модель типа ЛОГИКА может быть использована для решения задач, характеризующихся полнотой описания предметной области, то есть в тех случаях, когда имеется возможность применить решающие правила.

Модель знаний имеет четыре уровня:

уровень гипотез;
уровень свидетельств;
уровень фактов;
уровень запросов.

Рис. 1. Пример диаграммы нижнего уровня

Блоки данной диаграммы соответствуют уровням модели знаний. Связи между блоками характеризуют отношения между уровнями. В рамках приведенной в начале классификации уровней приобретения знаний данную диаграмму можно отнести к уровню Б.1 (получение готового набора знаний, представленных во внутреннем формате). Использование этой диаграммы дает возможность пользователю более свободно оперировать структурными единицами БЗ, наглядная форма представления позволяет в большей степени, чем принятая изначально в системе Image Expert текстовая форма, работать с БЗ в целом, чем достигается уменьшение количества ошибок и повышение общей эффективности работы.

Диаграмма верхнего уровня не связана с принятой в системе Image Expert моделью представления знаний и служит для абстрактного описания предметной области (рис. 2).

Рис. 2. Пример диаграммы верхнего уровня

Данная диаграмма базируется на системе описания SSONET (Structured Semantic Object Network) [Mohan, 1993].

SSONET имеет три различных концептуальных уровня. Верхний уровень, называемый абстрактным, включает специфические знания о предметной области. Ниже находится уровень соответствующий уровню схем в объектно-ориентированных базах данных. Нижний уровень — уровень отдельных экземпляров соответствует уровню данных в различных базах данных. Существует пять основных типов объектов 1 – Class, 2 – LinkType, 3 – Instance, 4 – ClassLink, 5 – InstanceLink. Полный набор LinkType определяет различные семантические связи, относящиеся к предметной области модели. Предполагается, что счетное множество элементарных типов связей описывает семантику определенной предметной области. Связи могут быть как направленными, так и не направленными. Верхние два уровня среды состоят из объектов Class, ClassLink и LinkType. Class и ClassLink присутствуют на обоих уровнях, но LinkType только на абстрактном.

Эта диаграмма относится к уровню Б3 (получение знаний, представленных во внешнем формате, и их понимание) классификации уровней приобретения знаний. При помощи данной диаграммы эксперт создает модель предметной области: задает типы объектов, связи между ними, описывает структуру целей экспертизы и их содержание.

При работе с диаграммами как верхнего, так и нижнего уровня пользователю доступны средства верификации, позволяющие выявлять неполноту и противоречивость описания. Законченные части описания могут быть занесены в базу данных с тем, чтобы затем использовать их далее как единые блоки.

Работа эксперта с IE-CASE строится следующим образом.

Создается диаграмма верхнего уровня.
В автоматизированном режиме диаграмма верхнего уровня транслируется в диаграмму нижнего уровня.
Диаграмма нижнего уровня редактируется и дополняется до окончательного вида.
Диаграмма нижнего уровня транслируется в текстовую БЗ, которая и используется Image Expert.

Предлагаемые средства для работы над созданием БЗ конечно же требуют от эксперта определенных специальных знаний о принятой в экспертной системе модели знаний и навыков работы по созданию формализованных описаний, однако эти требования, как представляется, не выходят за рамки разумных. Подобное усложнение работы эксперта по сравнению, например, с системой KITTEN (Knowledge Initiation & Transfer Tools for Experts and Novices) [Show, 1987], в которой от эксперта требуется лишь ранжировать объекты по различным признакам, дает возможность резко улучшить выразительные средства описания предметной области и расширить область применения системы.

В заключение рассмотрим соответствие предлагаемой системы приведенным ранее требованиям к KSS.

Данная система независима от конкретной предметной области, модели данных не содержат каких бы то ни было специфических структур.
Опыт применения таких методологий как SADT, IDEF0-2 и подобных специалистами различных областей дает возможность утверждать, что предлагаемая KSS может применяться непосредственно экспертами.
В настоящее время в системе не предусмотрена возможность использования других источников знаний, кроме введенных экспертом моделей и описаний на языке представления знаний системы Image Expert. Однако нет принципиальных ограничений на дополнение системы средствами работы с другими источниками.
Использование CASE–технологии предусматривает возможность одновременной работы над проектом группы экспертов. Использование единого словаря дает возможность объединять модели разных экспертов.
Использование диаграмм двух уровней обеспечивает представление знаний в двух принципиально разных, но логически связанных формах.
Как отмечено в п.3, система на сегодняшний день ограничена в количестве источников знаний, с добавлением новых источников соответственно будут добавлены и специальные средства представления знаний из них.
Система не налагает ограничения на описания. Возможен экспорт моделей в другие проекты.
Встроенные средства верификации введенных данных дают возможность выявлять неполноту и противоречивость описания.
Используются хорошо известные и апробированные на практике модели представления и приобретения знаний:

логика высказываний;
байесовский подход;
методология SSONET, адекватная хорошо известным методологиям SADT, IDEF0, IDEF1X;
продукционные правила.

Предлагаемая система позволяет дополнить ее средствами конструирования экранных форм, интерфейсов и т.п.

Таким образом, IE–CASE удовлетворяет большинству выдвигаемых к KSS требований, что позволяет предположить ее жизнеспособность и полезность, причем как экспертам, так и инженерам по знаниям.

А.В.Белоус

CASE–средства наполнения баз знаний для экспертных систем

Рис. 1. Пример диаграммы нижнего уровня

Рис. 2. Пример диаграммы верхнего уровня

CASE–средства наполнения баз знаний
для экспертных систем