Модели с дискретными зависимыми переменными

Изучение моделей с дискретными зависимыми переменными является важным разделом эконометрики. Модели с дискретными зависимыми переменными имеют не только теоретическое, но и практическое значение. Примерами экономических моделей с дискретными зависимыми переменными являются модели потребительского выбора, модели фирмы, модели экономического роста, модели равновесия на товарных, факторных и финансовых рынках и многие другие. Строя модели, экономисты выявляют существенные факторы, определяющие исследуемое явление и отбрасывают детали, несущественные для решения поставленной проблемы.

Целью работы является рассмотрение моделей с дискретными зависимыми переменными и примеров их использования. Для достижения цели нужно решить следующие задачи:

— изучить модели с дискретными зависимыми переменными;

— рассмотреть модели бинарного выбора;

— исследовать модели множественного выбора;

— изучить модели счетных данных.

Объектом исследования являются эконометрические модели с дискретными переменными.

Предметом исследования являются модели с дискретными зависимыми переменными. В ходе работы были использованы следующие методы исследования: анализ, дедукция.

Глава 1. Модели с дискретными зависимыми переменными.

Как следует из рассмотренного в предыдущих разделах материалов, в эконометрических исследованиях обычно предполагается, что результирующий показатель y t , является количественной величиной, которая в принципе может принимать любые значения на множестве действительных чисел. Однако в экономических и социальных исследованиях часто приходится сталкиваться с разного рода ограничениями на значения зависимой переменной. В частности, зависимая переменная может принимать только целочисленные значения: 0, 1, 2,… Примерами таких зависимых переменных являются:

1а. Семейное положение, которое выражается следующими категориями (и соответствующими целыми числами):

  • холост (1);
  • женат (2);
  • вдовец (3);
  • разведен (4).

1б. Альтернативные товары, между которыми выбирает покупатель, и которые представляются следующими числами:

  • марка А(1);
  • марка Б(2);
  • марка В(3);
  • марка Г(4);
  • прочие марки(5).

Очевидно, что в обоих случаях числа служат только для разграничения понятий. Расстояние между двумя числами не имеет никакого значения.

2а. Оценки, полученные на экзамене:

  • отлично(5);
  • хорошо(4);
  • удовлетворительно(3);
  • неудовлетворительно(2).

2б. Классы гостиниц:

  • пять звезд(1);
  • четыре звезды(2);
  • три звезды(3);
  • две звезды(4) и т. д.

В случаях 2а и 2б (в отличие от 1а и 1б) понятия естественным образом упорядочены, и характеризующие их числа отражают этот порядок. Но различия между 1 и 2 понятиями не обязательно столь же сильные, как между 2 и 3 и т. д.

3. Число предприятий, обанкротившихся в текущем году (0,1,2…).

Так называемые счетные данные (countdata).

При представлении значений зависимой переменной в целочисленном виде эконометрическая модель, связывающая эти значения с соответствующим набором независимых факторов, имеет специфическое содержание. Обычно такая модель определяет вероятность осуществления события, заключающегося в том, что при известных уровнях независимых факторов зависимая переменная примет конкретное значение j из заданного набора значений j=0,1,2,….

Содержательное уравнение такой модели выглядит

Вероятность(событие j произойдет)=Вероятность(Y=j)=F (параметры, факторы).

Модели с дискретными зависимыми переменными могут быть классифицированы в зависимости от:

  • а) типа переменных;
  • б) выбранного закона распределения.

В свою очередь, внутри выделенных групп может быть развернута более подробная классификация в зависимости от более детальных свойств классификационных признаков. Эти детальные группировки будут рассмотрены по ходу дальнейшего изложения материала.

В научной литературе в зависимости от типа переменных модели с дискретными зависимыми переменными разделяются на модели выбора среди конечного числа альтернативных вариантов (примеры 1а,1б,2а,2б) и модели счетных данных

(пример 3).

В зависимости от числа вариантов, среди которых осуществляется выбор, различают модели бинарного выбора и модели множественного выбора. В отличие от моделей множественного выбора в моделях бинарного выбора результирующий показатель может принимать только два значения: 0 и 1.

К моделям множественного выбора относятся модели с неупорядоченными (примеры 1а, 1б) и упорядоченными (примеры 2а, 2б) альтернативными вариантами.

Рассмотрим особенности формализованного представления эконометрических моделей с различными видами дискретных зависимых переменных более подробно.

Глава 2. Модели бинарного выбора.

Модели бинарного выбора широко используются в экономических и социальных исследованиях, особенно в экономике труда, при проведении анализа на микро-уровне. Покажем их специфические свойства на примере модели трудовой активности населения, исходные предпосылки которой состоят в следующем. Индивидуум в определенный период времени может работать или искать работу (y=1) или не делать этого (y=0).

Предположим, что состояние “работать” или “не работать” определяется набором факторов (возраст, семейное положение, образование, опыт работы и т. д.), и соответствующие вероятности можно представить в следующем виде:

  • P(y=1)=F(a¢x);
  • P(y=0)=1–F(a¢x).

Вектор коэффициентов a отражает влияние факторов, например, характеризующих положение индивидуума в обществе, на рассматриваемую вероятность.

Одной из основных проблем при построении моделей бинарного выбора является обоснование функционала F(a¢x) . Например, предположим, как и в случае “классических” эконометрических моделей, что вероятности соответствующих событий могут быть представлены в виде линейной функции от значений рассматриваемых факторов:

F(a¢x)=a¢x=a 0 +a1 x1 +…+an xn ,

где a 0 , a1 ,…, an – параметры модели; x1 ,…,xnзначения независимых факторов.

Тогда, приняв M[y t |x t ]=F(a¢xt ), соответствующую эконометрическую модель можно представить в следующем виде:

y t =M[yt |x t ]+(yt –M[yt |x t ])=a¢x t +e t

где M[y t |x t ]=– условное математическое ожидание переменной yt при условии, что вектор независимых переменных равен x t .

Линейная форма модели представляет определенное удобство для раскрытия содержания, входящих в нее слагаемых. Прежде всего, заметим, что между их значениями выполняется следующие соотношения (см. табл. 10.1).

Таблица 10.1

у t

P(у t =…)=

e t

1

a¢x t

1–a¢x t (с вероятностью a¢xt )

0

a¢x t

–a¢x t (с вероятностью 1–a¢xt )

Из табл. 10.1. следует, что ошибки e t модели (10.43) имеют следующие характеристики:

M[e t ]=a¢xt (1–a¢xt )+ (1–a¢xt )( –a¢xt )=0;

D[e t |xt ]=a¢xt (1–a¢xt )2 +(1–a¢xt )(–a¢xt ) 2 =a¢xt (1–a¢xt )(1–a¢xt +a¢xt )=a¢xt (1–a¢xt ).

где D[e t |xt ] – условная дисперсия ошибки et при условии, что вектор независимых переменных равен x t .

Рассмотрим в качестве критерия выбора оценок параметров модели (10.43) минимум суммы дисперсий ее ошибок e t :

a¢x t )2 +a¢xt ) 2 =xt (1–a¢xt )2 +1–a¢xt )(–a¢xt )2 =

=x t (1–a¢xt )=min. (10.45)

Используя МНК для оценки параметров модели (10.43) при критерии (10.45), получим следующую систему “нормальных” уравнений, относительно неизвестных оценок а 0 , а1 ,…, аn :

Выполнив дифференцирование с учетом попарной независимости коэффициентов между собой и со значениями факторов хit , i=1,2,…,T, эту систему можно представить в следующем виде:

В свою очередь, последняя система может быть представлена в векторно-матричном виде следующим образом:

или в компактной форме записи как

X×a=z, (10.47)

где матрица и вектор-столбец .

Из выражения (10.47) непосредственно вытекает, что неизвестные оценки параметров бинарной модели линейного типа могут быть получены на основании следующего выражения:

a=X –1 ×z, (10.47)

Однако линейная интерпретация (10.42) закона распределения вероятностей достаточно “неудобна” по своим “эконометрическим следствиям”.

Во-первых, заметим, что из выражения (10.44) вытекает, что ошибка eгетероскедастична, поскольку дисперсия ошибки зависит от вектора x. В таких условиях оценки параметров aмодели (10.43), полученные на основе выражения (10.48), являются неэффективными. Для получения эффективных оценок ее параметров, необходимо использовать обобщенный МНК.

Во-вторых, любой метод оценки параметров линейных моделей бинарного выбора не дает гарантий, что результат произведения a¢x может принимать значения только на интервале [0, 1]. С учетом выражения (10.44) несложно заметить, что при отрицательных значениях этого произведениях и значениях больших единицы будет иметь место и другой абсурдный результат – отрицательная дисперсия остатков. Это обстоятельство существенно ограничивает область применения линейной модели бинарного выбора. На практике она используется только для предварительной обработки данных и для сопоставления с результатами, полученными более тонкими методами.

Из приведенных рассуждений вытекает, что модель бинарного выбора должна удовлетворять двум условиям:

и

где a¢x®+¥ – область значений x, при которых P(y=1)=1, а a¢x®–¥ – область значений x, при которых P(y=1)=0.

При этом между значениями составных частей регрессионного уравнения должно выполняться следующее соответствие (см. табл. 10.2).

Таблица 10.2

у t

P(у t =…)=

e t

1

F(a¢x t )

1– F(a¢x t )

0

1– F(a¢x t )

–(1– F(a¢x t ))

Условиям (10.49) отвечает, например, функция F(a¢x), близкая к закону нормального распределения, график которой представлен на рис. 10.2. Ее использование позволяет снять рассмотренные выше ограничения моделей бинарного выбора. Модели с функционалом, обладающим свойством “нормального закона“, в литературе получили название probit-моделей: