Имя материала: Моделирование экономических процессов

Автор: Власов М. П.

3.2. иерархия системы и разведочный анализ многомерных данных

Большие системы отличаются сложностью и взаимопереплетением организационных и информационных связей. Для упорядочения связей между элементами системы формируются иерархические структуры. Иерархия — это тип структуры, организации системы, основанный на упорядочении ее элементов от высшего к низшим и введением отношений соподчинения. Если воспользоваться стандартным представлением структуры в виде графа, вершины которого изображают элементы системы, а дуги — связи между элементами, то иерархическая структуре соответствует частный случай графа — дерево. Особенно широко иерархические структуры используются в системах управления, а также в классификациях.

Формальное построение иерархической структуры управления основано на представлении объекта управления в виде некоторого множества:

физических частей или компонентов;

априорно выделенных первичных структурных единиц, переменных, описывающих состояние или функционирование объекта;

моментов времени или подпериодов управления;

точек или подинтервалов траектории движения объекта;

•          переменных, описывающих воздействия внешней среды. Управление в системе с иерархической структурой основано

на том, что каждая из подсистем решает некоторую частную задачу в условиях относительной самостоятельности. При этом управленческие решения, в частности планы, разработанные всеми подсистемами некоторого уровня, подчиненных подсистеме более высокого уровня, координируются этой последней. При итеративном характере процесса выработки управляющего решения корректировка решений подсистем нижележащего уровня, их последующая координация «наверху», новая корректировка и т. д. могут производиться многократно.

Строгая иерархия — разумеется абстракция, и в чистом виде может характеризовать структуру лишь абстрактной системы. В реальных экономических, социальных, биологических системах неизбежны связи между элементами, не предусматриваемые такой моделью структуры, как дерево. Тем не менее, и в подобных случаях говорят об иерархической структуре, если связи, соответствующие формальной модели иерархии, доминируют над всеми остальными.

Если у наблюдателя находится в распоряжении таблица многомерных данных, например характеризующих структуру и, в то же время отсутствует информация о причинном механизме генерации этих данных, то для проведения классификации и построения иерархии можно воспользоваться разведочным анализом многомерных данных (РАД). РАД может оказать помощь в компактном и понятном исследователю описании структуры данных (например, в форме визуального представления этой структуры), отталкиваясь от которого можно «прицельно» поставить вопрос о более детальном исследовании данных с помощью того или иного раздела статистического анализа, обоснования полученной структуры данных с помощью аппарата проверки статистических гипотез, а также, возможно, сделать некоторые заключения и о причинной модели данных. Этот этап называется «подтверждающим анализом данных». Иногда выявление структуры данных с помощью РАД может оказаться завершающим этапом анализа. С другой стороны, ряд методов РАД можно рассматривать и как методы подготовки данных для последующей статистической обработки без какого-либо изучения структуры данных, которое предполагается осуществить на последующих этапах. В этом случае РАД играет роль некоторого этапа перекодировки и преобразования данных (путем, например, сокращения размерности) в удобную для последующего анализа форму. В любом случае, с какой бы целью ни применялись методы РАД, основная задача — переход к компактному описанию данных при возможно более полном сохранении существенных аспектов информации, содержащихся в исходных данных. Важно также, чтобы описание было понятным для исследователя.

Способы анализа и интерпретации результатов в значительной степени зависят от выбранной модели и метода обработки данных. Однако можно выделить ряд приемов и подходов к анализу результатов, которые определяют специфику собственно разведочного анализа. Это преобразование переменных, анализ остатков, визуализация данных (графическое отображение данных), манипуляция с данными на основе графического отображения, использование аппарата активных и иллюстративных переменных и объектов. Преобразование переменных обычно используется для приведения данных либо к нормальному распределению, либо к максимальному увеличению степени линейной связи между всеми или некоторыми переменными. В качестве показателей линейной связи используется, например, сумма квадратов коэффициентов корреляции. К преобразованным данным затем применяются хорошо разработанные методы, такие как факторный анализ, линейный регрессионный анализ.

Анализ остатков используется для выявления систематических отклонений обрабатываемых данных от принятой модели их описания. Визуализация данных предполагает получение тем или иным способом графического отображения остатков при адаптации той или иной модели, так что путем непосредственного визуального анализа этого изображения можно определить, имеет ли место одна из моделей структуры данных.

Под манипуляцией с данными на основе графического изображения понимается следующее. Часто с помощью одной гистограммы или диаграммы рассеивания нельзя полностью выделить структуру данных, например, все кластеры. Однако возможны ситуации, когда данные разделились на две резко разграниченные группы. В этом случае один из эффективных способов проведения дальнейшей обработки состоит и удалении одной из частей матрицы данных и работе с оставшейся частью как с новой матрицей данных.

Другим полезным приемом, помогающим в интерпретации результатов и в проверке их устойчивости при применении, например методов кластер-анализа, является разделение исходного множества переменных на две части:

активные, использующиеся на стадии обработки;

иллюстративные, использующиеся на стадии интерпретации.

Например, переменные разделяются на активные и иллюстративные, и затем используется какая-либо из кластерных процедур. Один из способов интерпретации состоит в том, чтобы проанализировать средние значения и разброс иллюстративных переменных в каждом из кластеров. Если средние различаются существенно.

то уверенность в объективном существовании кластеров возрастает и появляется дополнительная возможность в их интерпретации (для этого, естественно, используются активные переменные).

Визуализация многомерных данных — это метод анализа совокупности многомерных наблюдений, основанный на их отображении в точки одно-, двух- и трехмерного пространства и на последующем визуальном анализе геометрической конфигурации полученной совокупности точек.

Эффективность подобного подхода основана на том, что человек при визуальном анализе некоторого множества точек на плоскости или пространстве хорошо распознает присущие этому множеству структурные особенности. Например, наличие кластеров, группирования точек в окрестности некоторой кривой линии, наличие выбросов и аномальных наблюдений.

Быстро возрастающая роль визуального анализа многомерных данных стимулируется широким распространением и доступностью технических средств (компьютеров), обеспечивающих построение визуальных объектов. Современная графика для статистического анализа обладает всеми свойствами и преимуществами компьютерной графики — построение, обработка и модификация графических форм возможна в интерактивном режиме и за короткое время.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 |