Изучение моделей с Целью работы является рассмотрение моделей с дискретными зависимыми переменными и примеров их использования. Для достижения цели нужно решить следующие задачи: — изучить модели с дискретными зависимыми переменными; — рассмотреть модели бинарного выбора; — исследовать модели множественного выбора; — изучить модели счетных данных. Объектом исследования являются эконометрические модели с дискретными переменными. Предметом исследования являются модели с дискретными зависимыми |
Глава 1. Модели с дискретными зависимыми переменными.
Как следует из рассмотренного в предыдущих разделах материалов, в эконометрических исследованиях обычно предполагается, что результирующий показатель y t , является количественной величиной, которая в принципе может принимать любые значения на множестве действительных чисел. Однако в экономических и социальных исследованиях часто приходится сталкиваться с разного рода ограничениями на значения зависимой переменной. В частности, зависимая переменная может принимать только целочисленные значения: 0, 1, 2,… Примерами таких зависимых переменных являются:
1а. Семейное положение, которое выражается следующими категориями (и соответствующими целыми числами):
- холост (1);
- женат (2);
- вдовец (3);
- разведен (4).
1б. Альтернативные товары, между которыми выбирает покупатель, и которые представляются следующими числами:
- марка А(1);
- марка Б(2);
- марка В(3);
- марка Г(4);
- прочие марки(5).
Очевидно, что в обоих случаях числа служат только для разграничения понятий. Расстояние между двумя числами не имеет никакого значения.
2а. Оценки, полученные на экзамене:
- отлично(5);
- хорошо(4);
- удовлетворительно(3);
- неудовлетворительно(2).
2б. Классы гостиниц:
- пять звезд(1);
- четыре звезды(2);
- три звезды(3);
- две звезды(4) и т. д.
В случаях 2а и 2б (в отличие от 1а и 1б) понятия естественным образом упорядочены, и характеризующие их числа отражают этот порядок. Но различия между 1 и 2 понятиями не обязательно столь же сильные, как между 2 и 3 и т. д.
3. Число предприятий, обанкротившихся в текущем году (0,1,2…).
Так называемые счетные данные (countdata).
При представлении значений зависимой переменной в целочисленном виде эконометрическая модель, связывающая эти значения с соответствующим набором
Содержательное уравнение такой модели выглядит
Вероятность(событие j произойдет)=Вероятность(Y=j)=F
Модели с дискретными зависимыми переменными могут быть классифицированы в зависимости от:
- а) типа переменных;
- б) выбранного закона распределения.
В свою очередь, внутри выделенных групп может быть развернута более подробная классификация в зависимости от более детальных свойств классификационных
В научной литературе в зависимости от типа переменных модели с дискретными зависимыми переменными разделяются на модели выбора среди конечного числа альтернативных вариантов (примеры 1а,1б,2а,2б) и модели счетных данных
(пример 3).
В зависимости от числа вариантов, среди которых осуществляется выбор, различают модели бинарного выбора и модели множественного выбора. В отличие от моделей множественного выбора в моделях бинарного выбора результирующий показатель может принимать только два значения: 0 и 1.
К моделям множественного выбора относятся модели с неупорядоченными (примеры 1а, 1б) и упорядоченными (примеры 2а, 2б) альтернативными вариантами.
Рассмотрим особенности формализованного представления эконометрических моделей с различными видами дискретных зависимых переменных более подробно.
Глава 2. Модели бинарного выбора.
Модели бинарного выбора широко используются в экономических и социальных исследованиях, особенно в экономике труда, при проведении анализа на микро-уровне. Покажем их специфические свойства на примере модели трудовой активности населения, исходные предпосылки которой состоят в следующем. Индивидуум в определенный период времени может работать или искать работу (y=1) или не делать этого (y=0).
Предположим, что состояние “работать” или “не работать” определяется набором факторов (возраст, семейное положение, образование, опыт работы и т. д.), и соответствующие вероятности можно представить в следующем виде:
- P(y=1)=F(a¢x);
- P(y=0)=1–F(a¢x).
Вектор коэффициентов a отражает влияние факторов, например, характеризующих положение индивидуума в обществе, на рассматриваемую вероятность.
Одной из основных проблем при построении моделей бинарного выбора является обоснование функционала F(a¢x)
F(a¢x)=a¢x=a 0 +a1 x1 +…+an xn ,
где a 0 , a1 ,…, an – параметры модели; x1 ,…,xn – значения независимых факторов.
Тогда, приняв M[y t |x t ]=F(a¢xt ), соответствующую эконометрическую модель можно представить в следующем виде:
y t =M[yt |x t ]+(yt –M[yt |x t ])=a¢x t +e t
где M[y t |x t ]=– условное математическое ожидание переменной yt при условии, что вектор независимых переменных равен x t .
Линейная форма модели представляет определенное удобство для раскрытия содержания, входящих в нее слагаемых. Прежде всего, заметим, что между их значениями выполняется следующие соотношения (см. табл. 10.1).
Таблица 10.1
у t |
P(у t =…)= |
e t |
1 |
a¢x t |
1–a¢x t (с вероятностью a¢xt ) |
0 |
a¢x t |
–a¢x t (с вероятностью 1–a¢xt ) |
Из табл. 10.1. следует, что ошибки e t модели (10.43) имеют следующие характеристики:
M[e t ]=a¢xt (1–a¢xt )+ (1–a¢xt )( –a¢xt )=0;
D[e t |xt ]=a¢xt (1–a¢xt )2 +(1–a¢xt
где D[e t |xt ] – условная дисперсия ошибки et при условии, что вектор независимых переменных равен x t .
Рассмотрим в качестве критерия выбора оценок параметров модели (10.43) минимум суммы дисперсий ее ошибок e t :
a¢x t )2 +a¢xt ) 2 =xt (1–a¢xt )2 +1–a¢xt )(–a¢xt )2 =
=x t (1–a¢xt )=min. (10.45)
Используя МНК для оценки параметров модели (10.43) при критерии (10.45), получим следующую систему “нормальных” уравнений, относительно неизвестных оценок а 0 , а1 ,…, аn :
Выполнив дифференцирование с учетом попарной независимости коэффициентов
В свою очередь, последняя система может быть представлена в векторно-матричном виде следующим образом:
или в компактной форме записи как
X×a=z, (10.47)
где матрица и вектор-столбец .
Из выражения (10.47) непосредственно вытекает, что неизвестные оценки параметров бинарной модели линейного типа могут быть получены на основании следующего выражения:
a=X –1 ×z,
Однако линейная интерпретация (10.42) закона распределения вероятностей достаточно “неудобна” по своим “эконометрическим
Во-первых, заметим, что из выражения (10.44) вытекает, что ошибка eгетероскедастична, поскольку дисперсия ошибки зависит от вектора x. В таких условиях оценки параметров aмодели (10.43), полученные на основе выражения (10.48), являются неэффективными. Для получения эффективных оценок ее параметров, необходимо использовать обобщенный МНК.
Во-вторых, любой метод оценки параметров линейных моделей бинарного выбора не дает гарантий, что результат произведения a¢x может принимать значения только на интервале [0, 1]. С учетом выражения (10.44) несложно заметить, что при отрицательных значениях этого произведениях и значениях больших единицы будет иметь место и другой абсурдный результат – отрицательная дисперсия остатков. Это обстоятельство существенно ограничивает область применения линейной модели бинарного выбора. На практике она используется только для предварительной обработки данных и для сопоставления с результатами, полученными более тонкими методами.
Из приведенных рассуждений вытекает, что модель бинарного выбора должна удовлетворять двум условиям:
и
где a¢x®+¥ – область значений x, при которых P(y=1)=1, а a¢x®–¥ – область значений x, при которых P(y=1)=0.
При этом между значениями составных частей регрессионного уравнения должно выполняться следующее соответствие (см. табл. 10.2).
Таблица 10.2
у t |
P(у t =…)= |
e t |
1 |
F(a¢x t ) |
1– F(a¢x t ) |
0 |
1– F(a¢x t ) |
–(1– F(a¢x t )) |
Условиям (10.49) отвечает, например, функция F(a¢x), близкая к закону нормального распределения, график которой представлен на рис. 10.2. Ее использование позволяет снять рассмотренные выше ограничения моделей бинарного выбора. Модели с функционалом, обладающим свойством “нормального закона“, в литературе получили название probit-моделей: