Имя материала: Теория и методы принятия решений, а также Хроника событий в Волшебных странах

Автор: О.И. Ларичев

11. основные идеи метода экспертной классификации

 

Для решения поставленной выше задачи были разработаны методы, основанные на идеях [7], рассмотренных далее.

 

11.1. Структуризация проблем

 

Чтобы передать знания компьютеру, нужен общий язык, характеризующий конкретную предметную область. Удобен язык признаков (или характеристик), описывающих объект исследования. Таким объектом при построении баз медицинских знаний является больной, обратившийся к врачу с жалобами на боли. Признаки или характеристики в данном случае описывают состояние больного: локализация болей, их характер, иррадиация, частота пульса, артериальное давление, температура и т.д.

Как определить перечень признаков, адекватно представляющий состояние объекта исследования? Для этой цели разработана человекомашинная процедура АРИАДНА [10], которая имитирует диалог по телефону между неопытным специалистом, находящимся рядом с объектом исследования и проводящим измерения, и экспертом, находящимся далеко от объекта. Диалог строится таким образом, что компьютер задает вопросы эксперту, использует его ответы для постановки новых вопросов и т.д. Приведем пример такого диалога.

Компьютер: Вас просят помочь в постановке диагноза. Начинающий врач сообщает вам по телефону, что пациент без сознания и что подозревается диабетическая кома. Каким будет ваш первый вопрос?

Эксперт: Начало заболевания — постепенное или внезапное?

Компьютер: А что более характерно для диабетической комы?

Эксперт: Постепенное начало.

Компьютер: Предположим, что начало было постепенное. Каким будет ваш следующий вопрос?

В ходе диалога эксперт называет признаки и их возможные значения, упорядочивает признаки по характерности для данного заболевания, решая привычные для себя задачи постановки диагноза.

В системе АРИАДНА использованы идеи «диагностических игр», предложенные И.М. Гельфандом [11].

Итак, при подобном подходе процедуры структуризации могут быть представлены следующим образом. Компьютер ставит вопросы эксперту, приглашая его классифицировать объект исследования и называть один за другим признаки, используемые при классификации и их возможные значения для каждого класса решений.

Результатом этого этапа является совокупность признаков, необходимая для полной классификации объектов определенного типа, все возможные значения этих признаков, а также перечень классов решений.

 

11.2. Классификация состояний объекта

           исследования

 

Представленные выше характерные особенности экспертных знаний позволяют считать адекватным способом получения информации от эксперта тот, при котором эксперт решает привычную для себя задачу. Для проблем классификации с явными признаками такой задачей является анализ описания объекта исследований, данного как совокупность значений диагностических признаков. Этот анализ привычен для эксперта. Можно ожидать, что при таком анализе полностью проявляются его знания.

В качестве примера приведем задачу дифференциальной диагностики тромбоэмболии легочной артерии (ТЭЛА) и острого инфаркта миокарда (ОИМ) [12,15]. Перечень диагностических признаков, указанных экспертами: 1) анамнез, факторы риска; 2) боль; 3) цвет кожи; 4) дыхание; 5) артериальное давление; 6) электрокардиограмма; 7) рентгенограмма грудной клетки; 8) эхокардиограмма; 9) ферменты крови.

На шкале каждого из признаков эксперты выделили несколько значений, причем два из них наиболее характерны соответственно - одно для ТЭЛА, другое для ОИМ. Например, для первого диагностического признака шкала имеет вид:

• в анамнезе операция, травма, роды, тромбофлебит, опухоли;

• в анамнезе стенокардия, ишемическая болезнь сердца;

• в анамнезе патологии нет.

Описание проблемы вводится в компьютер. Комбинируя значения диагностических признаков, компьютер предъявляет эксперту одно из возможных состояний объекта исследования (больного) в виде клинической ситуации. Кроме того, эксперту предоставляется перечень классов решений, к одному или нескольким из которых он относит клиническую ситуацию.

 

11.3. Гипотеза о характерности

 

При получении информации от эксперта активно используется гипотеза о различной характерности значений диагностического признака по отношению к каждому из классов. Иначе говоря, предполагается, что эксперт может упорядочить все значения каждого диагностического признака по их характерности для каждого из классов решений и что это упорядочение не зависит от значений других признаков.

Возьмем i-й диагностический признак. Два любых значения на его шкале хli и xki находятся в следующем отношении характерности для класса Pj :

 

где DPj — отношение доминирования по характерности для класса Pj. Другими словами, мы ввели бинарное отношение доминирования для значений одного диагностического признака (хli более характерен для класса Pj).

Вернемся к проблеме дифференциальной диагностики тромбоэмболии легочной артерии и инфаркта миокарда. Одним из диагностических признаков, используемых врачом-экспертом, является цвет кожи в момент осмотра больного. Шкала данного признака имеет следующие значения:

1) резкий цианоз лица, шеи, верхней половины туловища;

2) бледность кожных покровов, акроцианоз;

3) нормальный цвет кожи.

По характерности для ТЭЛА эти значения могут быть упорядочены так: 3-2-1. Для ИМ упорядочение по характерности иное: 2-3-1.

Используя бинарные отношения характерности по отдельным признакам, можно построить отношение доминирования по характерности для каждого класса на множестве состояний (векторов аi):

 

 

если для каждого из диагностических признаков значение соответствующего компонента вектора аi не менее характерно по отношению к классу Pj , чем значение компонента вектора aj, и хотя бы для одного компонента более характерно, то выполняется условие доминирования по характерности, приведенное выше,

Использование гипотезы о характерности позволяет существенно уменьшить число вопросов эксперту, необходимое для построения полной классификации.

Пусть эксперт отнес к классу Pj какое-то состояние ak объекта исследования. Это означает, что сложившийся у него (по описанию) образ объекта характерен для данного класса. В то же время отдельные признаки не обязательно имеют самые характерные значения для класса Pj. Логично предположить, что другие состояния, описание которых совпадает с ak , кроме значений тех диагностических признаков, которые заменены на более характерные для класса Pj , также относятся к классу Pj. На формальном языке можно утверждать, что использование сформулированной выше гипотезы доминирования по характерности позволяет построить на множестве состояний А конус доминирования по характерности. Один ответ эксперта позволяет классифицировать сразу группу состояний.

Мы называем используемое правило гипотезой потому, что могут быть случаи, когда распространение по характерности некорректно. Подобные случаи возникают при зависимости диагностических признаков. Поэтому применение гипотезы о характерности должно сопровождаться ее проверкой (см. далее).

 

11.4. Проверка информации эксперта и гипотезы

          о характерности

 

Как отмечалось, не ошибающихся экспертов не бывает. Поэтому информацию эксперта следует подвергать проверке, основанной на использовании условий доминирования по характерности.

Формально такую проверку можно представить следующим образом. Пусть на каком-то этапе диалога «компьютер—эксперт» состояние аi было отнесено к классу Pj: аi Î Pj. После каждого ответа эксперта осуществлялось распространение по доминированию. Построенные конусы доминирования по характерности в общем случае пересекаются. Это означает, что некоторые состояния могут быть классифицированы несколько раз. Предположим, что при этом классификации какого-то состояния av различаются. Тогда, например, (ау, аj) Î Dpi, но аi Î Pl, т.е. av более характерно для класса Pi, чем аj, однако av оказалось отнесенным (при другом ответе эксперта) к классу Pl. Этот факт может быть как ошибкой эксперта, так и проявлением зависимости диагностических признаков.

При выявлении противоречия в классификации компьютер предъявляет эксперту на экране описания двух состояний и просит еще раз их проанализировать. Если эксперт обнаруживает свою ошибку, он ее устраняет и опрос продолжается. Если эксперт подтверждает обе противоречивые классификации, то:

• с помощью эксперта выделяется подмножество зависимых диагностических признаков;

• эти признаки объединяются в один агрегированный признак, не зависящий от остальных.

Аналитические оценки показывают, что в среднем около 25\% ответов экспертов проверяются, что позволяет считать созданную базу знаний непротиворечивой и надежно отражающей экспертные знания.

 

11.5. Определение последовательности

состояний для предъявления эксперту в

процессе классификации

 

Как было показано выше, классификация состояния объекта исследования позволяет косвенно классифицировать ряд других состояний (либо уменьшить неопределенность). Это дает возможность построить полную классификацию, т.е. решить поставленную задачу, предъявив эксперту сравнительно небольшое число состояний. Для реализации такой возможности необходимо найти стратегию выбора очередного состояния для предъявления эксперту.

Система КЛАСС [7], а также последовавшие за ней системы ДИФКЛАСС [13], СТЕПКЛАСС [14] и КЛАНШ [15] отличаются друг от друга стратегией предъявления состояний эксперту.

Так, в системе КЛАСС осуществляется выбор наиболее информативного состояния. Предполагается, что все возможные ответы эксперта для любого, неизвестного состояния объекта равновероятны. Для каждого неклассифицированного состояния вычисляются количества косвенно классифицируемых состояний при всех возможных ответах эксперта. Далее подсчитывается среднее количество, которое и характеризует информативность предъявления конкретного вектора. Компьютер осуществляет перебор всех неквалифицированных на данный момент состояний и выбирает то, для которого ожидаемое среднее количество косвенно классифицированных состояний максимально.

Существенно более эффективными (по числу обращений к эксперту) являются методы ДИФКЛАСС и КЛАНШ.

 

11.6. Трудоемкость построения баз знаний

 

Компьютерные системы построения полных и непротиворечивых баз знаний ставят эксперту вопрос за вопросом до тех пор, пока все состояния (все векторы ai из множества А) не будут отнесены к одному или нескольким классам. Для создания таких баз знаний требуется от одной—двух недель до одного-двух месяцев работы с опытным экспертом (в зависимости от объема базы знаний).

Приведем конкретные данные по системе КЛАСС [7]. Для создания базы знаний по семи коматозным заболеваниям (классифицируются 2304 состояния пациента) потребовалось 12 ч работы эксперта, по 14 болезням, начинающимся с болевого синдрома в области живота (около 20 тыс. состояний), — 60 ч. Разработка первой базы знаний заняла примерно семь дней, второй — около месяца.

Система ДИФКЛАСС позволяет классифицировать в среднем до 700 состояний объекта исследования в час [13].

 

11.7. Проверка качества баз знаний

 

Основным критерием проверки построенных баз знаний является степень совпадения решений, содержащихся в ней и принятых экспертом, который участвовал в создании этой базы знаний. Для небольших по размеру задач (порядка 100 диагностических правил) эксперт мог оценить каждую ситуацию. Через некоторое время (две — три недели) он строил ту же базу знаний с помощью разработанной человекомашинной системы. Появлялась возможность сравнить ответы экспертов, полученные двумя разными способами.

Эксперты, решавшие задачу с малым числом противоречий, т.е. имевшие четкие правила, показали почти полное совпадение своих решений. Для больших баз знаний сравнение проводилось по отдельным ситуациям; совпадение было практически полным. Следовательно, созданная база знаний служит хорошим отражением личности эксперта, его «двойником» в определенной предметной области.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 |