Имя материала: Информационные системы в экономике

Автор: Балдин К. В

4.2. методы представления знаний

 

Выше уже частично рассматривались такие понятия, как "знания" и "системы, основанные на знаниях", и отмечалась их особая значимость в теории искусственного интеллекта. Сделаем еще одно весьма важное замечание: в настоящее время в области разработки систем искусственного интеллекта сложилась следующая аксиома: никакой, самый сложный и изощренный алгоритм извлечения информации (так называемый механизм логического вывода) из интеллектуальной системы не может компенсировать "информационную бедность" ее базы знаний.

 

4.2.1. Знания и их свойства

Несмотря на широкое распространение и использование понятия "знания" в различных научных дисциплинах и на практике, строгого определения данного термина нет.

Довольно часто используют так называемый прагматический подход: говорят, что знания — это формализованная информация, на которую ссылаются и/или которую используют в процессе логического вывода. Однако такое определение ограничено: оно фиксирует сознание на уже существующих методах представления знаний и, соответственно, механизмах вывода, не давая возможности представить себе другие ("новые").

Возможен и другой подход: попытаться на основе определения уже рассмотренного понятия "данные" (см. подразд. 4.1), выявить их свойства и особенности, сформировать дополнительные требования к ним и уже затем перейти к понятию "знания".

Напомним, что данными называют формализованную информацию, пригодную для последующей обработки, хранения и передачи средствами автоматизации профессиональной деятельности.

Какие же свойства "превращают" данные в знания? На рис. 4.2.1 представлены шесть основных свойств знаний (часть из них присуща и данным).

Кратко охарактеризуем эти свойства.

Внутренняя интерпретация (интерпретируемость). Это свойство предполагает, что в ЭВМ хранятся не только "собственно (сами) данные", но и "данные о данных", что позволяет содержательно их интерпретировать (см. рис. 4.2.2). Имея такую информацию, можно ответить на вопросы типа "Где находится НПО "Энергия"?" или "Какие предприятия выпускают космическую технику?". При этом в первой строке таблицы на рис. 4.2.2 находятся "данные о данных" (метаданные), а в остальных — сами данные.

Наличие внутренней структуры связей. Предполагается, что в качестве информационных единиц используются

не отдельные данные, а их упорядоченные определенными отношениями (родовидовыми, причинно-следственными и др.) структуры (эти отношения называют классифицирующими). Пример: факультет — курс — учебная группа — студент.

Наличие внешней структуры связей.

Внутренняя структура связей позволяет описывать отдельный объект (понятие). Однако объекты (понятия) способны находиться и в других отношениях (вступать в ситуативную связь). Пример: объекты "курс Государственного университета управления им. С. Орджоникидзе" и "урожай овощей в совхозе "Зареченский" могут находиться в ситуативной связи "принимает участие в уборке".

Возможность шкалирования.

Эта возможность предполагает введение соотношений между различными информационными единицами (т. е. их измерение в какой-либо шкале — порядковой, классификационной, метрической и т. п.) и упорядочение информационных единиц путем измерения интенсивности отношений и свойств. Пример: "97/ЭИ. 6-01 учебная группа занимает первое место на курсе по успеваемости".

Наличие семантической метрики.

Шкалирование позволяет соотнести информационные единицы, но прежде всего для понятий, имеющих "количественное" толкование (характеристики). На практике довольно часто встречаются понятия, к которым не применимы количественные шкалы, но существует потребность в установлении их близости (например, понятия "искусственный интеллект" и "искусственный разум"). Семантики классифицируются следующим образом:

♦ значение, т. е. объективное содержание;

контекстуальный смысл, определяемый связями данного понятия с другими, соседствующими в данной ситуации;

личностный смысл, т. е. объективное значение, отраженное через систему взглядов эксперта;

прагматический смысл, определяемый текущим знанием о конкретной ситуации (например, фраза "информация получена" может иметь как негативную, так и позитивную оценку — в зависимости от того, нужно это было или нет) [22].

6. Наличие активности.

Данное свойство принципиально отличает понятие "знание" от понятия "данные". Например, знания человека, как правило, активны, поскольку ему свойственна познавательная активность (обнаружение противоречий в знаниях становится побудительной причиной их преодоления и появления новых знаний, стимулом активности является неполнота знаний, выражается в необходимости их пополнения). В отличие от данных, знания позволяют выводить (получать) новые знания. Будучи активными, знания позволяют человеку решать не только типовые, но и принципиально новые, нетрадиционные задачи.

Кроме перечисленных, знаниям присущи такие свойства, как омонимия (слово "коса" может иметь три смысла, связанных с определениями: девичья; песчаная; острая) и синонимия (знания "преподаватель читает лекцию" и "студенты слушают лекцию" во многих случаях являются синонимами) и др.

Классифицировать знания можно по самым различным основаниям.

По способу существования различают факты (хорошо' известные обстоятельства) и эвристики (знания из опыта экспертов).

По способу использования в экспертных системах — фактические знания (факты) — знания типа "А — это А"; правила — знания для принятия решений ("Если... — то..."); метазнания (знания о знаниях — указывают системе способы использования знаний и определяют их свойства). Классическими примерами метазнаний являются народные пословицы и поговорки, каждая из которых характеризует знания (рекомендации по деятельности) в широком классе конкретных ситуаций (например, пословица "Семь раз отмерь, один — отрежь" применима не только в среде хирургов или портных).

По формам представления знания подразделяются на декларативные (факты в виде наборов структурированных данных) и процедуралъные (алгоритмы в виде процедур обработки фактов).

По способу приобретения знания бывают научные (полученные в ходе систематического обучения и/или изучения) и житейские, бытовые (полученные в "ходе жизни").

Дадим еще ряд определений, часто встречающихся в литературе [21].

Интенсиональные знания — знания, характеризующие или относящиеся к некоторому классу объектов.

Экстенсиональные знания — знания, относящиеся к конкретному объекту из какого-либо класса (факты, сведения, утверждения и т. д.)

Заметим: отношения интенсиональных и экстенсиональных знаний — это родовидовые отношения. Например, понятие "технологическая операция" — это интенсионал, а понятие "пайка" — это экстенсионал, так как пайка — одна из технологических операций. Очевидно, что эти понятия относительны. Так понятие "пайка", в свою очередь, можно считать интенсионалом по отношению к понятиям "пайка серебром" и "пайка оловом". Как правило, такого рода знания относятся к декларативным.

Физические знания — знания о реальном мире.

Ментальные знания — знания об отношениях объектов.

Мир задачи — совокупность знаний, используемых в задаче.

Мир пользователя — совокупность знаний пользователя. Мир программы — совокупность знаний, используемых в программе.

Морфологические и синтаксические знания — знания о правилах построения структуры описываемого явления или объекта (например, правила написания букв, слов, предложений и др.).

Семантические знания — знания о смысле и значении описываемых явлений и объектов.

Прагматические знания — знания о практическом смысле описываемых объектов и явлений в конкретной ситуации. (Например, редкая монета для нумизмата и филателиста имеет различную прагматическую ценность.)

Предметные знания — знания о предметной области, объектах из этой области, их отношениях, действиях над ними и др.

 

4.2.2. Классификация методов представления знаний

Для того чтобы манипулировать всевозможными знаниями из реального мира с помощью компьютера, необходимо осуществить их моделирование.

При проектировании модели представления знаний следует учесть два требования:

однородность представления;

простота понимания.

Выполнение этих требований позволяет упростить механизм логического вывода и процессы приобретения знаний и управления ими, однако, как правило, создателям интеллектуальной системы приходится идти на некоторый компромисс в стремлении обеспечить одинаковое понимание знаний и экспертами, и инженерами знаний, и пользователями.

Классификация методов моделирования знаний с точки зрения подхода к их представлению в ЭВМ показана на рис. 4.2.3.

Дадим общую характеристику основных методов представления знаний с помощью моделей, основанных на эвристическом подходе.

Модели представления знаний

На основе эвристического подхода

На основе теоретического подхода

 

тройкой

на базе формальной логики предикатов

 

продукционные

на базе "человеческой" логики

 

фреймовые

модели модальной логики

 

сетевые

модели многозначной логики

 

Рис. 4.2.3. Классификация моделей представления знаний

1. Представление знаний тройкой "объект — атрибут — значение" — один из первых методов моделирования знаний. Как правило, используется для представления фактических знаний в простейших системах.

Примеры:

 

Объект

Атрибут

Значение

Студент

Успеваемость

Отличник

Дом

Цвет

Белый

Пациент

Температура

Нормальная

 

Очевидно, что для моделирования знаний даже об одном объекте (например, о "студенте" или "доме") из предметной области необходимо хранить значительное число "троек".

2. Продукционная модель (модель правил; модель продукций — от англ. production — изготовление, выработка). В настоящее время наиболее проработанная и распространенная модель представления знаний, в частности — в экспертных системах.

Модель предусматривает разработку системы продукционных правил (правил продукций), имеющих вид:

ЕСЛИ А, И А, И ... А , ТО В, ИЛИ В, ИЛИ...ИЛИ В ,

1          2          n'         1          2 т'

где А.иВ. — некоторые высказывания, к которым применены логические операции И и ИЛИ. Если высказывания в левой части правила (ее часто называют антецедент — условие, причина) истинно, истинно и высказывание в правой части (консеквент — следствие).

Полнота базы знаний (базы правил) определяет возможности системы по удовлетворению потребностей пользователей. Логический вывод в продукционных системах основан на построении прямой и обратной цепочек заключений, образуемых в результате последовательного просмотра левых и правых частей соответствующих правил, вплоть до получения окончательного заключения.

Пусть в некоторой области памяти хранятся следующие правила (суждения):

правило 1 — ЕСЛИ в стране происходит падение курса национальной валюты;

ТО материальное положение населения ухудшается;

правило 2 — ЕСЛИ объемы производства в стране падают;

ТО курс национальной валюты снижается;

правило 3 — ЕСЛИ материальное положение населения ухудшается;

ТО уровень смертности в стране возрастает. Если на вход системы поступит новый факт "В стране высокий уровень падения объемов производства", то из правил можно построить цепочку рассуждений и сформулировать два заключения:

факт 1 — правило 2 — правило 1 — заключение 1 — правило 3 — заключение 2,

где заключение 1 (промежуточный вывод) — "Материальное положение населения ухудшается"; заключение 2 (окончательный вывод) — "В стране возрастает уровень смертности".

Отметим, что в современных экспертных системах в базе знаний могут храниться тысячи правил, а коммерческая стоимость одного невыводимого (нового, дополнительного) правила весьма высока.

Главными достоинствами продукционных систем являются простота пополнения и изъятия правил; простота реализации механизма логического вывода и наглядность объяснений результатов работы системы.

Основной недостаток подобных систем — трудность обеспечения непротиворечивости правил При их большом числе, что требует создания специальных правил (так называемых метаправил) разрешения возникающих в ходе логического вывода противоречий. Кроме того, время формирования итогового заключения может быть достаточно большим.

3. Фреймовая модель. Сравнительно новая модель представления знаний. Само понятие "фрейм" (англ. frame — рама, рамка, скелет, сгусток, сруб и т. д.) было введено в 1975 г. Марком Минским (М. Minsky, США).

Фрейм — это минимальная структура информации, необходимая для представления знаний о стереотипных классах объектов, явлений, ситуаций, процессов и др. С помощью фреймов можно моделировать знания о самых разнообразных объектах интересующей исследователя предметной области — важно лишь, чтобы эти объекты составляли класс концептуальных (повторяющихся: стереотипных) объектов, процессов и т. п. Примерами стереотипных жизненных ситуаций могут служить собрание, совещание; сдача экзамена или зачета; защита курсовой работы и др. Примеры стереотипных бытовых ситуаций: отъезд в отпуск; встреча гостей; выбор телевизора; ремонт и др. Примеры стереотипных понятий: алгоритм; действие; методика и др. На рис. 4.2.4 представлен фрейм технологической операции "соединять" [21].

Данный фрейм описывает ситуацию "Субъект X соединяет объект Y с объектом Z способом W". На рисунке обозначены:

♦ вершины X, Y, Z, W — слоты (англ. slot — прорез; щель; пустота — составляющие фрейма);

дуги — отношения;

Dx, Dy, Dz, Dw — так называемые шанции — области возможных значений соответствующих слотов.

Наполняя слоты конкретным содержанием, можно получить фрейм конкретной ситуации, например: "Радиомонтажник соединяет микросхему с конденсатором способом пайки". Заполнение слотов шанциями называют активизацией фрейма.

С помощью фреймов можно моделировать как процедурные, так и декларативные знания. На рис. 4.2.4 представлен пример представления процедурных знаний.

На рис. 4.2.5 приведен пример фрейма "технологическая операция", иллюстрирующий представление декларативных знаний для решения задачи проектирования технологического процесса.

По содержательному смыслу фрейма выделяют [21]:

фреймы-понятия;

фреймы-меню;

♦          фреймы с иерархически вложенной структурой. Фрейм-понятие — это фрейм типа И. Например, фрейм

"операция" содержит объединенные связкой И имена слотов

что делать , что это дает , как делать , кто делает , "где делать" и т. д., а фрейм "предмет" — слоты с именами "назначение", "форма", "вес", "цвет" и т. д.

Фрейм-меню — это фрейм типа ИЛИ. Он служит для организации процедурных знаний с помощью оператора "выбрать". Например, фрейм "что делать" может состоять из объединенных связкой ИЛИ слотов "решить уравнение", "подставить данные", "уточнить задачу" и т. д., причем каждый из этих слотов может иметь несколько значений.

Фрейм с иерархически вложенной структурой предполагает, что в нем в качестве значений слотов можно использовать имена других фреймов, слотов и т. д., т. е. использовать иерархическую структуру, в которой комбинируются другие виды фреймов (в итоге получают так называемые фреймы-сценарии).

 

Технологическая операция

 

Имя операции

 

Состав операции

Требуемое оборудование

Шанции слотов

Требуемые материалы

 

Имя последующей операции

 

Рис. 4.2.5. Фрейм понятия "технологическая операция"

Значения слотов могут содержать ссылки на так называемые присоединенные процедуры. Различают два вида присоединенных процедур:

процедуры-де/иомы;

процедуры-слуги.

Процедуры-дежомы присоединяются к слоту и активизируются при изменении информации в этом слоте (выполняют вспомогательные операции — например, автоматически корректируют информацию во всех других структурах, где используется значение данного слота) — см. рис. 4.2.6.

Процедуры-слуги активизируются при выполнении некоторых условий относительно содержимого слотов (часто по запросу). Данные процедуры определяются пользователем при создании фрейма. Например, во фрейме "Учебная аудитория" можно предусмотреть слоты "длина" и "ширина", а по их значениям вычислять значение слота "площадь".

Фреймы позволяют использовать многие свойства знаний и достаточно широко употребляются. Их достоинства и недостатки схожи с достоинствами и недостатками семантических сетей, которые будут рассмотрены ниже.

4. Модель семантической сети (модель Куилиана).

Семантическая сеть — это направленный граф с поименованными вершинами и дугами, причем узлы обозначают конкретные объекты, а дуги — отношения между ними [21]. Как следует из определения, данная модель представления знаний является более общей по отношению к фреймовой модели (иными словами, фреймовая модель — частный случай семантической сети). Семантическую сеть можно построить для любой предметной области и для самых разнообразных объектов и отношений.

В семантических сетях используют три типа вершин:

вершины-понятия (обычно это существительные);

вершины-события (обычно это глаголы);

вершины-свойства (прилагательные, наречия, определения).

Дуги сети (семантические отношения) делят на четыре класса:

лингвистические (падежные, глагольные, атрибутивные);

логические (И, ИЛИ, НЕ);

теоретико-множественные (множество — подмножество, отношения целого и части, родовидовые отношения);

квантифицированные (определяемые кванторами общности V и существования 3).

(Напомним, что кванторы — это логические операторы, переводящие одну высказывательную форму в другую и позволяющие указывать объем тех значений предметных переменных, для которых данная высказывательная форма истинна.)

Приведем два примера.

На рис 4.2.7 представлена семантическая сеть для предложения (ситуации) "Студент Табуреткин добросовестно изучает новый план счетов на 2002 год перед сдачей экзамена по дисциплине "Бухгалтерский учет".

Кто?

Табуреткин

Изучает

Рисунок 4.2.8 содержит фрагмент семантической сети для понятия "автомобиль" (обозначения: IS-A — есть, является; HAS-PART — имеет часть). Из приведенных примеров понятно, почему многие специалисты по искусственному интеллекту считают фрейм частным случаем семантической сети со строго структурированными знаниями.

HAS-PART

Автомобиль

IS-A

HAS-PART

IS-A

 

Грузовой автомобиль

Трансмиссия

Легковой автомобиль

Двигательная установка

 

HAS-PART

_t        

IS-A

IS-A

HAS-PART ♦

Кузов

"ЗИЛ"

"Волга"

Блок цилиндров

 

Рис. 4.2.8. Фрагмент семантической сети понятия "автомобиль"

Основное достоинство методов моделирования знаний с помощью семантических сетей и фреймов — универсальность, удобство представления как декларативных, так и процедура льных знаний. Имеют место и два недостатка:

громоздкость, сложность построения и изменения;

потребность в разнообразных процедурах обработки, связанная с разнообразием типов дуг и вершин.

В рамках реализации теоретического подхода применяют логические модели, прежде всего использующие представления знаний в системе логики предикатов. Преимущества такого подхода очевидны: единственность теоретического обоснования и возможность реализации системы путем введения формально точных определений и правил получения выводов. Однако в полной мере претворить в жизнь данный подход даже для "простых" задач оказалось весьма сложно. Поэтому появились попытки перейти от формальной логики к так называемой человеческой логике (модальной логике, многозначной логике и др.), модели которой в большей или меньшей степени учитывают "человеческий фактор", т. е. являются в определенном смысле компромиссными "в плане использования и теоретического, и эвристического подходов.

Очень коротко остановимся на ставшей классической предикатной модели представления знаний. Первые попытки использовать такую модель относятся к 50-м гг. прошлого века. Дадим несколько определений.

Пусть имеется некоторое множество объектов, называемое предметной областью. Выражение Р{хх, х2,...,хп), где x{(i — 1,..,п) — так называемая предметная переменная, а Р принимает значения 0 или 1, называется логической функцией или предикатом.

Предикат P(xvx2,...,xn) задает отношение между элементами Xj, х2,...,хп и обозначает высказывание, что "xv х2,...,хп находятся между собой в отношении Р". Например, если А — множество целых чисел, а Р(а) — высказывание "а — положительное число", то Р(о) = 1 при а > 0 и Р(о) = 0 при о < 0.

Из подобного рода элементарных высказываний с помощью логических связок образуют более сложные высказывания, которые могут принимать те же значения — "истина" и "ложь". В качестве связок используются конъюнкция, дизъюнкция, импликация, отрицание, эквивалентность.

Предикат от п переменных называют п-местным.

Одноместные (унарные) предикаты отражают свойства определенного объекта или класса объектов. Многоместные предикаты позволяют записывать отношения, которые существуют между группой элементов.

Если о — тоже предикат, то Р(о) — предикат 2-го порядка, и т. д. до п-го порядка.

Приведем примеры различных предикатов.

1. Унарный предикат (высказывание) "Река впадает в Каспийское море" имеет значение 1, если "Река" = "Волга", и значение 0, если "Река" = "Днепр".

Двухместный предикат "х1 не меньше х2" может иметь значение 1 или 0 в зависимости от значений xt и х2. Если значение предиката тождественно равно 1 при любых значениях предметных переменных, он называется тавтологией.

В аппарат исчисления предикатов входят также символы функций (обычно обозначаемые латинскими буквами /, g, h и т. д.), задаваемых на множестве предметных переменных, и кванторы общности V и существования 3.

Представление с помощью предиката знаний, заключенных в теореме Пифагора: P{gf[/(x), /(у)], f(z)}, где предикат Р — "быть равным", функция д(х, у) = х + у; функция /(х) = х2.

Иногда используется такая форма записи: РАВНЫ [СУММА (КВАДРАТ (х), КВАДРАТ (у)), КВАДРАТ (2)].

Предикат Р равен 1, если х, у, z — соответственно длины катетов и гипотенузы прямоугольного треугольника.

Как уже отмечалось, предикаты удобны для описания декларативных знаний (фактов, событий и т. п.). Их главные достоинства — возможность реализации строгого вывода знаний (исчисления предикатов) и сравнительная компактность модели. К сожалению, предикаты мало пригодны для записи процедурольных знаний. Кроме того, опыт показал, что человеческое знание по своей структуре много сложнее структуры языков предикатного типа, поэтому требуются специальные навыки "подгонки" структуры реального знания под структуру модели (как правило, значительно обедняющей исходные знания).

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 |