Имя материала: Эконометрика

Автор: В.С. Мхитарян

7. глоссарий

 

АДАПТИВНЫЕ МОДЕЛИ - математические модели, используемые в сочетании с человеко-машинными процедурами в принятии решений, в которых основываются лишь на предположении о существовании некоего обобщенного критерия задачи многокритериальной оптимизации, а необходимая дополнительная информация получается лицом, принимающим решение (ЛПР) последовательно, одновременно с анализом множества альтернатив. Применение А.м. целесообразно, когда ЛПР затрудняется в оценке вклада частных критериев в интегральный критерий. А.м. выгодны тем, что в процессе выработки решения используется информация, поступающая как от ЭВМ, так и от самого ЛПР. Важным преимуществом является и то, что перед специалистом последовательно проходит развитие модели многокритериальной ситуации от начального состояния к некоторому промежуточному (или окончательному) решению, что способствует более объективной оценке возможности улучшения значений обобщенных критериев. Существуют различные подходы к построению адаптивных человеко-машинных процедур.

АДДИТИВНЫЙ КРИТЕРИИ (критерий справедливой абсолютной уступки) - критерий оптимальности, относящийся к группе прямых априорных методов многокритериальной оптимизации, сформулированный в виде суммирования выходных параметров (критериев оценки) исследуемого объекта. В А.к. используется следующий прием свертки нескольких критериев kij в обобщенный критерий (тенденция которого может быть к min или к max):

и

 

или в матричной форме - U = К ґ W, где wj - коэффициент важности (вес) j-го критерия;

U = [u (хі)] - матрица-столбец критерия u; K = [кі} ]- нормализованная критериальная матрица; W = [wj] - матрица-столбец коэффициентов веса. Принцип справедливой абсолютной уступки приводит к утверждению, что оптимальное решение означает максимизацию суммы нормированных частных критериев. Метод имеет строгое математическое обоснование. Однако введение весовых коэффициентов создает существенные трудности, один из путей преодоления которых состоит в применении экспертных оценок.

АЛГОРИТМ - 1) совокупность предписаний, необходимая и достаточная для решения какой-либо конкретной задачи; 2) совокупность правил, определяющих эффективную процедуру решения любой задачи из некоторого заданного класса задач. Понятие А. использовалось в математике давно, но как математический объект исследуется в связи с решением ряда проблем оснований математики с 30-х гг. XX в. Тогда же были разработаны основные понятия теории алгоритмов. В связи с развитием ЭВМ и их широким применением понятие А. стало одним из центральных в прикладной математике. АЛГОРИТМИЧЕСКАЯ МОДЕЛЬ - математическая модель, представленная в форме алгоритма, перерабатывающего заданный набор входных данных в заданный набор выходных данных. А. м. применяют, когда использование аналитических (расчетных) моделей затруднено либо нецелесообразно. Частным видом А. м. являются имитационные модели.

АНАЛИЗ - 1) изучение, научное исследование чего-либо, основанное на расчленении целого на составные части; 2) исследование объектов и явлений окружающего мира, основанное на изучении их внутренней структуры, закономерностей поведения или внешнего проявления их свойств. Анализ в САПР - проектная процедура или группа проектных процедур, имеющая целью получение информации о свойствах заданного проектируемого объекта; 3) функция управления, предназначенная для изучения, систематизации, обобщения и оценки достигнутых результатов. На основании данных анализа выявляются узкие места в деятельности организации, оцениваются конечные результаты производственной деятельности, обосновываются управленческие решения.

АНАЛИТИЧЕСКАЯ МОДЕЛЬ - математическая модель, представляющая собой совокупность аналитических выражений и зависимостей, позволяющих оценивать определенные свойства моделируемого объекта. Аналитические модели могут относиться к функциональным моделям (совокупность явных зависимостей выходных величин от входных), геометрическим (совокупность уравнений поверхности и (или) линий, задающих геометрическую форму моделируемого объекта), к обеспечению программному.

АШ'ИОРНЫЕ МОДЕЛИ - математические модели, используемые в принятии многокритериальных решений, в которых структура и вид обобщенного критерия постулируются вначале, т.е. вся информация, позволяющая определить наилучшее решение, скрыта в формальной модели задачи.

АРХИВАТОР - программа или программный пакет, предназначенный для «сжатия» (архивации) файла или группы файлов с целью уменьшения занимаемого файлами дискового пространства.

ВРЕМЕННОЙ РЯД - это последовательность наблюдений, упорядоченных во времени (или пространстве).

Если какое-нибудь явление наблюдают на протяжении некоторого времени, имеет смысл представить данные в том порядке, в котором они возникали, из-за того, в частности, что последовательные наблюдения могут быть зависимыми.

В. р. хорошо представлять на диаграмме рассеяния. Значение ряда Х откладывают по вертикальной оси, а время t - по горизонтальной. Время называют независимой переменной.

Существует два типа временных рядов:

Непрерывные, в которых мы имеем наблюдения в каждый момент времени, например, показатели детектора лжи, электрокардиограммы. Их обозначают как наблюдение Х в момент t, X(t).

Дискретные, в которых наблюдения делаются через некоторые (обычно одинаковые) интервалы времени. Их обозначают Xi.

Примеры

Экономические: недельные цены на акции; месячные прибыли.

Метеорологические: дневные осадки; скорость ветра; температура.

Социологические, показатели преступности (например, число арестов), показатели безработицы.

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ - это (как правило, лишь воображаемое) полное собрание объектов (людей, животных, растений или вещей), являющееся источником данных. Она представляет все множество статистических единиц (группу интересующих нас предметов).

Информацию о генеральной совокупности мы получаем, изучая выборки из нее; из каждой совокупности можно сделать много разных выборок. По выборке мы получаем информацию об интересующих нас параметрах совокупности.

Например, выборочное среднее дает информацию о среднем всей совокупности. Важно, чтобы перед формированием выборки исследователь тщательно и полно определил генеральную совокупность, а также способ извлечения выборки. Выборка должна быть репрезентативной.

ГЕТЕРОСКЕДАСТИЧНОСТЬ - условие, когда дисперсии регрессионных остатков не отвечают условию гомоскедастичности. См. гомоскедастичность дисперсии.

ГИСТОГРАММА - это способ представления данных, измеренных в интервальной шкале (как дискретных, так и непрерывных). Часто используется в разведочном анализе данных для иллюстрации основных характеристик распределения. Гистограмма делит диапазон возможных значений множества данных на классы, или группы. Каждой группе соответствует прямоугольник, длина которого равна диапазону значений в заданной группе, а площадь пропорциональна числу наблюдений в этой группе. Это означает, что прямоугольники скорее всего будут различаться по высоте.

Гистограмма годится только для числовых переменных, измеренных в номинальной шкале. Как правило, она используется для больших множеств данных (>100 наблюдений), когда не хотят строить диаграммы ствол-лист.

Гистограммы помогают выявить необычные наблюдения (выбросы) и пропуски в множестве данных.

ГОМОСКЕДАСТИЧНОСТЬ - условие постоянства дисперсий регрессионных остатков.

КОРРЕЛЯЦИЯ - когда говорят, что две случайные переменные коррелированны, имеют в виду, как правило, что они друг с другом как-то связаны. Стандартной мерой связи переменных является коэффициент корреляции. Следует, однако, помнить, что он измеряет лишь силу линейной связи.

КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ - меняется в пределах от -1 до 1, измеряет степень линейной связи двух случайных переменных. Положительное значение коэффициента корреляции означает, что с ростом одной из переменных другая также растет, с убыванием одной из них убывает и другая. Отрицательное значение означает, что с ростом одной из переменных другая убывает, с убыванием одной из них другая растет. Коэффициент корреляции, равный нулю, означает, что между нашими переменными отсутствует линейная связь.

Обратите внимание: даже если коэффициент корреляции равен 1 по абсолютной величине и, следовательно, переменные функционально связаны (линейно), ничего нельзя сказать о причинно-следственной связи между ними.

В статистической практике в ходу два коэффициента корреляции: для числовых переменных используется коэффициент корреляции Пирсона, для ранговых— коэффициент корреляции Спирмена.

КРИТЕРИИ СОГЛАСИЯ - проверяют гипотезу о совпадении наблюденной эмпирической функции распределения с теоретической функцией постулируемого распределения. Критерий согласия хи-квадрат делает это путем сравнения наблюденных и ожидаемых частот. Критерий Колмогорова - Смирнова основывается на максимальной разности между эмпирической и постулируемой функциями распределения.

ЛИНЕИНАЯ РЕГРЕССИЯ - в линейной регрессии модельное (теоретическое, предсказанное) значение Y является линейной комбинацией значений одного или более предикторов:

У = bo + b1 Х1 + b2 Х2 +. . .+bk Xk.

МЕДИАНА выборки - это точка, по обе стороны которой располагается одинаковое количество элементов выборки. Если объем выборки нечетен и равен 2n + 1, то медиана равна элементу вариационного ряда с номером n + 1. Если объем выборки четен и равен 2n, то медиана равна полусумме элементов вариационного ряда с номерами n и n + 1.

Пример:

Для нечетного количества данных, скажем, 21, имеем:

Данные 96 48 27 72 39 70 7 68 99 36 95 4 6 13 34 74 65 42 28 54 69

Вариационный ряд: 4 6 7 13 27 28 34 36 39 42 48 54 65 68 69 70 72 74 95 96 99

Медиана равна 48, 10 значений ляжет выше нее, и 10 - ниже. Для четного количества данных, скажем, 20, мы имеем:

Данные: 57 55 85 24 33 49 94 2 8 51 71 30 91 6 47 50 65 43 41 7 Вариационный ряд 2 6 7 8 24 30 33 41 43 47 49 50 51 55 57 65 71 85 91 94

Медианой в данном случае является среднее двух «серединных» точек, в данном случае среднее между 47 и 49 = 48.

Медиана распределения - это точка m, определяемая аналогичным условием: вероятность того, что случайная величина примет значение, не превосходящее m, равна 1/2.

Медиана выборки является оценкой медианы распределения.

Медиана является робастной оценкой центральной тенденции.

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ - это распространенный метод оценивания параметров. Ищутся оценки, минимизирующие сумму квадратов отклонений между смоделированными (предсказанными) и наблюденными значениями.

МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ - это общий метод вычисления оценок параметров. Ищутся такие оценки, чтобы функция правдоподобия выборки, равная произведению значений функции распределения для каждого наблюденного значения данных, была как можно большей.

М. м. п. лучше работает на больших выборках, где он, как правило, дает оценки с минимальной дисперсией. На маленьких выборках оценки максимального правдоподобия часто оказываются смещенными.

МУЛЬТИКОЛЛИНЕАРНОСТЬ - два или более предиктора коллинеарны, если сильна линейная связь между ними; их можно представить в виде линейной комбинации друг друга. Мультиколлинеарность может сделать проводимые для линейной регрессии вычисления неустойчивыми, а то и невозможными, поскольку в этом случае матрицы плохо обусловлены. Кроме того, она может вызвать завышенные оценки стандартных ошибок для коэффициентов при предсказывающих переменных.

НЕЗАВИСИМОСТЬ - две случайные переменные независимы, если их совместная плотность распределения равна произведению отдельных (маргинальных) плотностей. Менее формально: две случайные переменные А и В независимы, если информация о значении В не влияет на распределение вероятностей значений А, и наоборот. Выборка взаимно независимых случайных переменных называется независимой выборкой.

НЕЗАВИСИМАЯ ПЕРЕМЕННАЯ - переменная, используемая для объяснения зависимой переменной.

Синонимы: предиктор, объясняющая переменная.

Смотрите также зависимую переменную.

НЕЛИНЕЙНАЯ РЕГРЕССИЯ - предполагается, что зависимость отклика от предикторов является нелинейной функцией предикторов.

ОДНОРОДНОСТЬ - равенство дисперсий переменной, подсчитанных в пределах разных групп. Является стандартным требованием в таких, например, методах, как регрессионный и дисперсионный анализы.

Синоним: гомоскедастичность.

Антоним: гетероскедастичность.

ПРЕОБРАЗОВАНИЕ значений данных - производится путем применения одной и той же функции ко всем значениям переменной; важно то, что аргументами такой функции могут являться только значения переменных текущего наблюдения.

Распространенными примерами таких операций являются: добавление константы, умножение на константу, взятие логарифма.

ПРОИЗВОДСТВЕННАЯ ФУНКЦИЯ (production function) - отражает зависимость между количеством применяемых ресурсов и максимально возможным объемом выпускаемой продукции в единицу времени; описывает всю совокупность технически эффективных способов производства (технологий).

СТАНДАРТИЗОВАННАЯ ПЕРЕМЕННАЯ -

 

x — X

Переход от переменной х к переменной z =         ,

S

где x - среднее значение, а s - cреднее квадратическое отклонение, называется стандартизацией переменной х, а результат - стандартизованной переменной z . Часто говорят также о z-преобразовании и даже z-значениях переменной х.

Название восходит к стандартному нормальному распределению N(0,1): ведь если х подчиняется нормальному распределению, то для больших выборок ее стандартизация приводит к z - подчиняющейся стандартному нормальному распределению.

СЕЗОННАЯ КОМПОНЕНТА - один из способов описания временного ряда - разложение его на компоненты: тренд, периодическую и случайную. Когда временная ось связана с датами, а период - с месяцами или кварталами, периодическую компоненту называют сезонной.

СГЛАЖИВАНИЕ, ФИЛЬТРАЦИЯ - сглаживание применяется для уменьшения иррегулярности (случайных изменений) временных рядов. Распространенным методом сглаживания является сглаживание простым скользящим средним (хотя существуют и другие способы). Способ сглаживания определяется свойствами ряда и целями его обработки.

СТАТИСТИКА - это функция элементов выборки. Дает информацию о неизвестных значениях параметров генеральной совокупности. Например, среднее выборки является, как правило, оценкой среднего совокупности, из которой была взята выборка.

СТАТИСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ - отсутствие связи между переменными. Независимость двух непрерывных переменных часто ошибочно отождествляют с равенством нулю их корреляции (ковариации), однако это верно, только если они подчиняются двумерному нормальному распределению.

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ - статистический критерий состоит из следующих компонент: пара гипотез - нулевая и альтернативная, статистика критерия и уровень значимости; по ним находится критическая область.

Проверка гипотезы начинается с вычисления статистики. Если значение попадает в критическую область, мы отвергаем нулевую гипотезу и считаем истинной ее альтернативу. В противном случае у нас нет оснований отвергнуть нулевую гипотезу.

Из генеральной совокупности можно сделать много разных выборок, причем значение статистики в общем случае будет меняться от выборки к выборке; другими словами, выборка является случайной, а значит, случайной величиной является и статистика. Например, выборочные средние для разных выборок из одной и той же совокупности могут различаться между собой.

Статистики обычно обозначают латинскими буквами, а оцениваемые ими параметры - греческими.

СТАЦИОНАРНЫЕ показатели - показатели, среднее которых можно считать неизменным; нестационарными - называются показатели, среднее которых изменяется со временем.

Системы одновременных эконометрических уравнений являются третьим основным классом моделей, которые применяются для анализа и (или) прогноза. Эти модели описываются системами уравнений, которые могут состоять из тождеств и регрессионных уравнений, каждое из которых может, кроме объясняющих переменных, включать в себя также объясняемые переменные из других уравнений системы. Т.е. набор объясняемых переменных связан через уравнения системы.

ТАБЛИЦА СОПРЯЖЕННОСТИ - таблица (ТС), каждый элемент (клетка) которой соответствует клетке кросс-табуляции. В случае двух факторов клетки ТС располагают так, чтобы элементы одной строки соответствовали одному и тому же значению одного фактора, а элементы одного столбца - одному и тому же значению другого фактора; говорят, что уровни одного фактора расположены по строкам, а другого - по столбцам. Такие таблицы часто обозначают rac, где r - количество уровней фактора, соответствующего строкам, с - столбцам.

В случае трех факторов считают, что ТС состоит из совокупности ТС, каждая из которых соответствует значению третьего фактора, являясь при этом (условной) ТС первых двух факторов. Можно, конечно, построить ТС и для большего числа факторов.

В каждой клетке ТС стоит количество элементов соответствующей клетки кросс-табуляции.

ТС - не слишком удобный способ представления данных для их визуального анализа, если велико количество уровней факторов, тем более, если велико количество факторов.

Для проверки гипотезы о независимости факторов, по которым построена кросс-табуляция, используется критерий независимости хи-квадрат Пирсона. Для таблиц 2х2 (два фактора, по два уровня у каждого) используется также точный критерий Фишера.

Общий метод анализа таблиц сопряженности - лог-линейный анализ.

ТРЕНД - для лучшего понимания временного ряда мы выделяем его основные характеристики. Одной из таких характеристик является тренд.

Тренд - это долговременное изменение временного ряда. Это направление (тенденция к повышению или снижению) и скорость изменения временного ряда, при сделанных допущениях о других компонентах.

ЦИКЛИЧЕСКАЯ КОМПОНЕНТА - чтобы лучше понять поведение временного ряда, выделяют его основные характеристики. Одной из таких характеристик является циклическая компонента. В недельных или месячных данных циклическая компонента описывает любые регулярные колебания. Это не сезонная компонента, изменение которой подчиняются некоторому распознаваемому циклу.

ЭКСПОНЕНЦИАЛЬНОЕ СГЛАЖИВАНИЕ - метод сглаживания временного ряда,

используемый для уменьшения иррегулярности (случайных колебаний) временного ряда, что позволяет получить более ясное представление о лежащих в основе этого ряда закономерностях. Используется также для прогнозирования значения ряда (для 1-2 шагов) прогноза.

ЭКСТРАПОЛЯЦИЯ - предсказание значения переменной за пределами интервала анализа. Термин применяется, как правило, при анализе временных рядов. Для коротких промежутков времени применяются количественные предсказания, интерполяции.

Количественное предсказание далекого будущего, как правило, менее полезно и применяется для указания на необходимость изменения построенной модели.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 |