Имя материала: Базы знаний интеллектуальных систем

[paragraph is_aprototype, if_added PARAGRAPH ();

BODYframe, restr_by text ];

[listis_aprototype;

ATOM{frame}, if_added LI () ];

……………………………………………………………………….

[textis_aprototype;

ATOM{f rame}, restr_by one_of {br, hr, image, anchor,..., line}

[br is_aprototype; if_added BR () ];

 [hr is_aprototype; if_added HR () ];

[image is_aprototype; if_added IMG ();

SRC frame, restr_by link ];

[anchor is_aprototype;

BODYframe, restr_by text ];

…………………………………………………………………..

 [linkis_aprototype;

URL frame, restr_by one_of {http, ftp, ..,} ];

MAILframe, restr_by mail ];

[url is_alink;

without_slot MAIL];

[httpis_aurl,if_added HTTP ();

SERVER string;

DIR {string};

FILEstring ];

[ftp is_aurl, if_added FTP ();

SERVER string;

DIR {string};

FILEstring ];

……………………………………………………………………….

 

Теперь, в соответствии с приведенными фреймами-прототипами и синтаксическими диаграммами, можно специфицировать процедурную часть конвертора как систему демонов, присоединенных к фреймам и/или их слотам. Для примера ниже приводится спецификация одного из таких демонов на языке Java [Нортон и др., 1998]:

 

public class HTML extends FramePrototype {

HEAD head = null;

BODY body = null;

………………………….

String keyword;

 

public void HTML (String name)

{ super (name);

keyword = getToken ();

if (keyword.compareTo ("<HTML>") == 0) {

head = new HEAD (getNewName ());

body = new BODY (getNewName ());

};

keyword = getToken ();

if (keyword.compareTo ("</HTML>") == 0) return;

                }

…………………………………………………………………….

}

 

По существу, такой демон не что иное, как конструктор класса HTML, а запуск конвертора осуществляется с помощью оператора создания нового объекта этого класса:

 

HTML currPage = new HTML (get_new_name ());

 

При этом будут рекурсивно вызываться конструкторы других классов (на верхнем уровне это HEAD и BODY), что, в конечном счете, приведет к построению множества фреймов-экземпляров, представляющих анализируемую HTML-страницу (currPage).

Понятно, что в общем случае такой подход дает нам средства синтаксически-ориентированного конвертирования HTML-текста во фреймовое представление. Но получение полезной для дальнейшей работы базы знаний предполагает его дальнейшую семантическую интерпретацию и построение в конечном счете семантической сети, отражающей смысл исходного Интернет-документа. Для примера, фрагменты такой семантической сети для HTML-текста описания секции «Электроника» магазина Amazon.com, обсуждавшегося выше, приведены на рис. 8.5.

 По сути дела, эта семантическая сеть представляет фрагмент онтологии предметной области «Электронная коммерция», которая может быть базисом для решения разнообразных практических задач. Так, например, с ее помощью могут решаться задачи поиска определенных товаров по запросу пользователя, осуществляться маркетинговый анализ запросов и т. п. Во всех этих и многих других случаях онтологии играют ключевую роль как один из перспективных подходов к представлению знаний в среде Интернет.

Вместе с тем, несмотря на важность понятия онтологии для теории и практики современных интеллектуальных систем, общепринятого понимания этого термина нет, хотя различные определения, предложенные разными авторами и научными коллективами [Gruber, 1991; Guarino, 1996; Fridman et al., 1997], распространяются и медленно конвергируют. Поэтому в следующем параграфе обсуждается само понятие онтологии и вводится соответствующая система моделей [Maikevich et al., 1999], затем приводится классификация онтологии, полезная для последующего сравнения известных в этой области проектов. В заключительных разделах главы обсуждаются примеры онтологии и специальные системы аннотирования Интернет-ресурсов на основе онтологии.

 

 

Рис. 8.5. Фрагмент семантической сети для секции

               «Электроника» магазина Amazon.com

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 |