Имя материала: Базы знаний интеллектуальных систем

Для иллюстрации возможностей этого языка рассмотрим содержательный пример XML-документа, описывающего домашнюю страницу исследователя Иванова.

 

<?xml version="1.0"?>

<Homepage>

<Nаme>Домашняя страница Иванова</Namе>

<Person>

<firstName>Ivan</firstName >

<lastName>Ivanov</lastName >

<marriedTo Homepage="http://www.anywhere.ru">

Mariya Ivanova</marriedTo> 

<employee Homepage="http://www.ccas; ru">

CCAS of Russia</employee>

<publications>

<book title="First Book"/>

<book title="Second Book"/>

……………………………………………………………

</publications> 

</Person>

</Homepage>

 

Этот XML-документ структурирован существенно лучше, чем был бы аналогичный ему HTML-текст, но пока не имеет «смысла», так как из него не следует, как интерпретируются единицы типа Person, publications, book и т. п. Для решения этого вопроса используется специальная спецификация определения типа документа DTD (document type definition). По сути дела, это грамматика языка разметки, в рамках которой определяются, какие элементы могут присутствовать в документе, какие атрибуты они имеют и как элементы соотносятся друг с другом. Понятно, что для стандарта XML такие спецификации уже разработаны самими авторами языка, но в нашем случае используется специальный его диалект, и потому именно мы должны специфицировать DTD нашего документа. Такая спецификация может быть следующей:

 

<!ELEMENT Homepage (Name, Person)>

<!ELEMENT Name (#PCDATA)>

<!ELEMENT Person (firstName, lastName, marriedTo?,

employee?, publications?, Homepage?)>

<!ATTLIST Person Homepage xml:link CDATA>

<!ELEMENT firstName (#PCDATA)>

<!ELEMENT lastName (#PCDATA)>

<!ELEMENT marriedTo (Person)>

<!ELEMENT employee (organization)>

<!ATTLIST organization Homepage xml:link CDATA>

<!ELEMENT publications (book*, paper*, report*)>

<!ATTLIST book title COATA «REQUIRED, coauthor Person,

publisher CDATA, year CDATA)>

<!ELEMENT paper (title, coauthor*, journal, year, vol?,

number?)>

<!ELEMENT report (title, coauthor*, organization, year)>

………………………………………………………………

 

Как следует из приведенного описания, в DTD специфицировано «сведение» конструкций нашего XML-документа к стандартным XML-конструкциям, понимаемым броузерами нового поколения.

В настоящее время уже разработаны DTD для различных предметных областей, и каждая такая спецификация, по сути дела, определяет новый язык разметки. Известным примером развития DTD для спецификации общих ресурсов является RDF (Resource Description Framework) [RDF, 1999], разрабатываемый W3C. Этот формат может использоваться для добавления в документы метаинформации, которая, в частности, может быть представлением семантики документа.

Использование собственных диалектов XML является важным шагом на пути формирования пространств знаний в сети Интернет. Но, по сути дела, это лишь первый шаг в этом направлении. Действительно, какие средства дает язык XML для представления знаний? Очевидно, что это, в первую очередь, средства спецификации декларативной компоненты развитых систем представления знаний. И то в ограниченном объеме. Каким же образом авторы этого языка и его расширений предполагают подключение процедур обработки XML-конструкций? На сегодняшний день в предложениях W3C явно прослеживается лишь одна идея: поскольку XML-документы не что иное, как портабельные данные, а язык Java имеет портабельный код, следует их использовать совместно. Для этого предлагаются специальные интерфейсы, например SAX (Simple API for XML), которые уже сейчас могут поддерживать многие Java-анализаторы. Основная идея здесь достаточно проста — анализатор просматривает узлы дерева документа из XML-файла и вызывает соответствующие методы, определенные пользователем. Для того чтобы этот механизм работал, программист должен создать класс, реализующий соответствующий интерфейс. Методы этого класса будут вызываться всякий раз, когда на входе распознавателя появляется нужная конструкция (тег, входная строка и т.п.). Собственно обработка информации при этом целиком в руках программиста, а среда лишь поддерживает общее функционирование и обработку исключительных ситуаций.

Такой подход имеет много общего и с подходом Ontobroker, и с подходом SHOE. Авторы обоих этих проектов активно приветствуют усилия W3C, но вместе с тем отмечают, что в предложениях соответствующих рабочих групп еще много недостатков. В первую очередь — это отсутствие стандартов на интеллектуальную обработку XML-конструкций, сравнительно небольшой практический опыт семантической разметки Интернет-документов и достаточно ограниченные средства логической обработки, используемые при этом.

Вот почему, как показывает анализ литературы и Интернет-ресурсов по данной тематике, в настоящее время:

• эффективная обработка информации на Web связывается, в первую очередь, с использованием ИИ-технологий;

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 |