Парная регрессия и корреляция в эконометрических исследованиях. Спецификация модели

Автор работы: Пользователь скрыл имя, 14 Августа 2013 в 21:51, контрольная работа

Краткое описание

Как уже отмечалось, в эконометрике широко используются методы статистики. Ставя, цель дать количественное описание взаимосвязей между экономическими переменными, эконометрика, прежде всего, вязана с методами регрессии и корреляции.
В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, т.е. это модель вида

Содержание

1. Парная регрессия и корреляция в эконометрических исследования.
Спецификация модели…………………………………………………………………..3
2. Линейная регрессия и корреляция: смысл и оценка параметров…………………11
Задание 2………………………………………………………………………………...23
Задание 3………………………………………………………………………………...24
Задание 4………………………………………………………………………………...26
Список использованных источников………………………………………………….27

Прикрепленные файлы: 1 файл

Эконометрика 5вар.doc

— 752.00 Кб (Скачать документ)

Если остаточная дисперсия оказывается примерно одинаковой для нескольких функций, то на практике предпочтение отдается более простым видам функций, так как они в большёй степени поддаются интерпретации и требуют меньшего объема наблюдений. Результаты многих исследований подтверждают, что число наблюдений должно в 6— 7 раз превышать число рассчитываемых параметров при переменной х. Это означает, что искать линейную регрессию, имея менее 7 наблюдений, вообще не имеет смысла. Если вид функции усложняется, то требуется увеличение объема наблюдений, ибо каждый параметр при х должен рассчитываться хотя бы по 7 наблюдениям. Следовательно, если мы выбираем параболу второй степени

ŷX = a+b*x+c*x2

то требуется объем информации уже не менее 14 наблюдений. Учитывая, что эконометрические модели часто строятся по данным рядов динамики, ограниченным по протяженности (10, 20, 30 лет), при выборе спецификации модели предпочтительна модель с меньшим числом параметров при х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Линейная регрессия и корреляция: смысл и оценка параметров.

Линейная регрессия находит  широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров.

Линейная регрессия сводится к  нахождению уравнения вида

                               ŷ= а + b*х или у = а + b*х + ε                  (3)

Уравнение вида, ŷ= а +b*x позволяет по заданным значениям фактора х иметь теоретические значения результативного признака подстановкой в него фактических значений фактора х (рис. 2).


Рис.2 Графическая оценка параметров линейной регрессии

Построение линейной регрессии сводится к оценке ее пара метров -.а и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбран на графике две точки, провести через них прямую линию (см. рис. 2) затем по графику найти значения параметров. Параметр а определим как точку пересечения линии регрессия с осью оу, а параметр b оценим исходя из угла наклона линии регрессии как ‚dy/dx, где dy — приращение результата у, а dx — приращение фактора х, т. е.

ŷx= а + b*х

Классический подход к оцениванию параметров линейной репрессии основан на методе наименьших квадратов (МНК).

Метод наименьших квадратов розволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака у от расчетных (теоретических) ŷx минимальна:


Иными словами, из всего множества  линий линия регрессии на графике  выбирается так, чтобы сумма квадратов  расстояний по вертикали между точками и этой линией была бы минимальной (рис. 3):

ε1= yi – ŷ

следовательно,

Рис.3 Линия регрессии  с минимальной дисперсией остатков

Для того чтобы найти минимум функции (4), надо вычислить частные производные по каждому из параметров а и b и приравнять их к нулю.

Обозначим г.в,2 через 5, тогда:


Преобразуя формулу (5) следующую систему нормальных уравнений для оценки параметров а и b:


 Решая систему нормальных уравнений (6) либо методом последовательного исключения переменных либо методом определителей, найдем искомые оценки параметров а и b. Можно воспользоваться следующими формулами для а и b:


Формула (7) получена из первого уравнения  системы (6), если все его члены  разделить на n:

где cov (x,y) – ковариация признаков, σ2x дисперсия признака x.

Поскольку , получим следующую формулу расчёта оценки параметра b:


Формула (8) получается также при решении системы (6) методом определителей, если все элементы расчета разделить на n2.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Так, если функция издержек (у, тыс. руб.) выражается  ŷx= 3000 +2*х, (х — количество единиц продукции), то, следовательно, с увеличением объема продукции х на одну единицу издержки производства возрастают в среднем на 2 тыс. руб., т. е. дополнительный прирост продукции на одну единицу потребует увеличения затрат в среднем на 2 тыс. руб.

Знак при коэффициенте регрессии  b показывает направление связи: при b> 0 связь прямая, а при b < 0 — связь обратная.

Возможность четкой экономической  интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях;

Формально а —. значение у при х=0. Если признак-фактор х не имеет и не может иметь нулевого значения, то трактовка свободного члена, а нё имеет смысла. Параметр, а может не иметь экономического содержания. Попытки экономически интерпретировать параметр а могут привести к абсурду, особенно при а<0.

Интерпретировать можно лишь знак при параметре а. Если, а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора. Иными словами, вариация результата меньше вариации фактора — коэффициент вариации по фактору х выше коэффициента вариации для результата у: Vx>Vy. для доказательства данного положения сравним относительные изменения фактора х и результата у:

Откуда 0<a.

Пример 1. По группе предприятий, выпускающих один и тот же вид продукции, рассматривается функция издержек у= а + b*х +ε. Необходимая для расчета оценок параметров a и b информация представлена в табл. 1.

Система нормальных уравнений будет иметь вид:

Решив её получим:

а = - 5,79; b = 36,84.

Запишем уравнение регрессии:

ŷx= - 5,79+З6,84*х.

Подставив в уравнение  значения х, найдем, теоретические значения у (см. последнюю графу табл. 1). В данном случае величина параметра, а не имеет экономического смысла.

В рассматриваемом примере имеем:

То, что, а < 0, соответствуют опережению изменения результата над изменением фактора Vy>Vx.

Если переменные х и у выразить через отклонения от средних уровней, то линия регрессии на графике пройдет через начало координат: ŷ'=b*x',

где  

Оценка коэффициента регрессии при этом не изменится.

Оценку коэффициента регрессии можно получить проще, не обращаясь к методу наименьших квадратов. Альтернативную оценку параметра b можно найти исходя из содержания данного коэффициента: изменение результата ∆у = уn — у1 сопоставляют с изменением фактора ∆x = xn — x1

В нашем примере такого рода альтернативная оценка параметра b составит: b' = 170-30/5-1= 35 млн. руб./ тыс. ед.

Эта величина является приближенной, ибо большая часть информации, имеющейся, в данных, не используется при ее расчете. Она основана только на минимаксных значениях переменных.

Парная линейная регрессия  применяется в эконометрике нередко  при изучении функции потребления:

C = K*y+L,

где С — потребление; Ки L. — параметры функции;

у — доход.

Данное уравнение линейной регрессии используется обычно в увязке с балансовым равенством

y = C+I-r

где I - размер инвестиций;

      r - сбережения.

для простоты предположим, что доход расходуется на потребление  и инвестиции. Таким образом, рассматривается  система уравнений:

Наличие в данной системе  балансового равенства накладывает  ограничение на величину коэффициента регрессии, которая не может быть больше единицы, т. е. К≤1.

Предположим, что функция  потребления составила:

Ĉ = 1,9+0,65*у.

Коэффициент регрессии  характеризует склонность к потреблению. Он показывает, что из каждой тысячи дохода на потребление расходуется в среднем 650 руб., а 350 руб. инвестируются. Если рассчитать регрессию размера- инвестиций от дохода, т. е. Î = а + b*у, то уравнение регрессии составит:

Î = 1,9+0,З5*у. Это уравнение можно и не определять, ибо оно выводится из функции потребления. Коэффициенты регрессии данных двух уравнений связаны равенством 065 + 0,35 = 1.

Если коэффициент регрессии  оказывается больше 1, то у < (С + I), т. е. на потребление расходуются не только доходы, но и сбережения.

Коэффициент регрессии в функции потребления применяется для расчета мультипликатора m:

m = 1/1-b

где b — коэффициент регрессии в функции потребления (величина K).

В нашем примере m = 1/(1—0,65) = 2,86. Это означает, что дополнительные вложения в размере 1 тыс. руб. на длительный срок приведут при прочих равных условиях к дополнительному доходу. в 2,86 тыс, руб. ,

Парное линейное уравнение  регрессии может быть записано в  матричной форме:

Y=ВХ+Е,

где Y- вектор-столбец размерности (nх1) фактических значений результативного признака;

В - вектор-столбец размерности (2х1) подлежащих оценке параметров модели, т. е. коэффициента регрессии «b» и свободного члена (параметра «а» в уравнении ŷx = а + bх);

Х (х0, х1) - матрица размерности (nх2) значений факторов. При этом х0 =1 и связанное наличием в уравнении регрессии свободного члена, а х1 — собственно реальные значения включенного в уравнение регрессии фактора;

Е - вектор-столбец случайной величины а, размерности (nх1).

Матрица исходных данных примет вид:

Оценивая параметры. линейного уравнения регрессии, Найдем вектор В и далее вектор случайной компоненты Е, т. е.

Чаще вектор В записывают как

В матричной форме применение МНК записывается так:

S =(Y —ХB)Т *(Y-XB) → min

Дифференцируя S по вектору В и приравнивая первые частные производные по В к нулю, получим:

∂S/∂B = - 2XTY+2XT*XB = 0

Отсюда после перестановки членов получим: (ХT Х)В = ХТY. Соответственно оценка вектора В составит:

В = (ХTX)-1XTY

Применительно к нашему примеру матричный метод определения МНК оценок сводится r следующему:

1) по правилу умножения  матриц

в матрице ХТХ число 7 получено как сумма произведений элементов первой строки матрицы ХТ и первого столбца матрицы Х, что соответствует объему совокупности n; аналогично число 22 получено как сумма произведений элементов первой строки матрицы ХТ и второго столбца матрицы Х и т. д.

2) найдем обратную  матрицу

4) вектор оценок параметров регрессии равен:

где число —5,79 соответствует  сумме произведений значений первого столбца матрицы (ХТХ)-1 на столбец матрицы ХТY и представляет собой сdободный член уравнения регрессии, т. е. а = b0 = - 5,79;

число 36,84 получено как сумма произведений второго столбца первой матрицы на столбец матрицы XTY и соответствует величине коэффициента регрессии b

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy имеются разные модификации формулы линейного коэффициента корреляции, например:


Как известно, линейный коэффициент корреляции находится в границах - 1≤ rxy ≤1

Если коэффициент регрессии b >0, то 0≤ rxy ≤1, и наоборот, при b<0

- 1≤ rxy ≤1

По данным табл. 1 величина линейного коэффициента корреляции составила 0,991, что означает наличие очень тесной зависимости затрат на производство от величины объема выпущенной продукции.

Следует иметь ввиду, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствия связи между признаками. При иной спецификации модели связь между признаками может оказаться достаточно тесной.

Для оценки качества подбора  линейной функции рассчитывается квадрат линейного коэффициента корреляции называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:


Соответственно величина 1 - r2 характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.

В нашем примере r2 = 0,982. Таким образом, уравнением регрессии объясняется 98,2% дисперсии результативного признака, а на долю прочих факторов приходится лишь 1,8% ее дисперсии (т.е. остаточная дисперсия). Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака. Так, полагая, что объем продукции предприятия, составляет 5 тыс. ед. прогнозное значение для издержек производства — 178,4 тыс. руб.

Информация о работе Парная регрессия и корреляция в эконометрических исследованиях. Спецификация модели