Эконометрика

Автор работы: Пользователь скрыл имя, 17 Февраля 2013 в 12:01, методичка

Краткое описание

Эконометрика – наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов, т.е. осуществляет количественный анализ реальных экономических явлений – определение Самуэльсона. Более широкий подход – эконометрика – это любое приложение математических и статистических методов к изучению экономических процессов.

Прикрепленные файлы: 1 файл

Лекции.doc

— 1.17 Мб (Скачать документ)

Коэффициент корреляции – безразмерная величина.

Формулы для расчета коэффициента корреляции.

Пусть каждая из СВ X и Y заданы рядом значений для n наблюдений.

 

Здесь

    1. Расчет ковариации и коэффициента корреляции в пакете Microsoft Excel.

Если задан ряд значений двумерной СВ (X,Y). то для расчета числовых характеристик можно использовать статистические функции Мастера функций КОВАР и КОРРЕЛ(массив равновероятных значений х; массив равновероятных значений у).   Еще одна возможность - Пакет анализа, т.е.  Сервис – Анализ данных – Ковариация или Корреляция, где необходимо задать Входной интервал, включающий в себя  значения переменной X и значения переменной Y, указать группирование по столбцам или по строкам в зависимости от того, как расположены статистические данные (обычно они располагаются по столбцам), поставить флажок в поле “Метки”, если при выделении данных вы отмечали также и имена переменных и указать Выходной интервал, отметив одну ячейку, с которой будет начинаться вывод результатов или выбрав переключатель “Новый рабочий лист” или “Новая рабочая книга”, если вы хотите произвести вывод результатов именно туда.

Результатом работы блока КОВАРИАЦИЯ является симметричная квадратная матрица 2*2, на диагонали которой расположены значения дисперсий для  X и Y, недиагональный элемент – значение ковариации cov(X,Y).  При работе с блоком КОРРЕЛЯЦИЯ выдается симметричная квадратная матрица 2*2, на диагонали которой расположены 1:            и , недиагональный элемент – значение коэффициента корреляции

. Значение коэффициента  корреляции, рассчитанного для выборки, является оценкой коэффициента корреляции соответствующей генеральной совокупности и позволяет провести градацию в соответствии с таблицей:

│ρ(X,Y)│≤‌‌‌ 0,3 – связь слабая;

‌‌‌ 0,3 ≤│ρ(X,Y)│ ≤ 0,7 – связь средняя;

│ρ(X,Y)│>0,7 – связь сильная.

Установлением факта наличия или отсутствия линейной связи корреляционный анализ исчерпывается.

  1. Регрессионный анализ –парная линейная регрессия.

На первой лекции речь у нас шла об экономических  барометрах.  Наиболее известный  из них  - Гарвардский – позволял удовлетворительно предсказывать основные экономические показатели в первой четверти 20 века в США.  Это было возможным потому, что были обнаружены взаимозависимости между основными группами экономических показателей (фондовый рынок, денежный рынок, товарный рынок).  Гарвардский барометр в целом представлял собой описание подмеченных эмпирически закономерностей и экстраполяции их на ближайшие месяцы. При этом вопрос о том, что является причиной, а что  -  следствием даже не ставился.  

В целом изучение взаимосвязей между двумя переменными X и Y предполагает два пути.  Первый путь – обе переменные являются равнозначными, т.е. не подразделяются на объясняющую и объясняемую. В этом  случае   основным является вопрос о наличии и силе взаимосвязи между этими переменными.  Например – как в Гарвардском барометре – фондовый рынок и товарный рынок, или  уровень инфляции и уровень безработицы, уровень безработицы и преступность и т.д. Исследуется лишь связь между этими величинами; вопрос о том, вызывает ли изменение одной из них изменения другой, не ставится вовсе. В качестве совсем парадоксального примера такого исследования можно рассмотреть две СВ – урожайность картошки в Свердловской области и уровень мирового рекорда по прыжкам в высоту по некоторому временному промежутку.   Поскольку в целом урожайность все же в основном растет, и мировой рекорд – тоже – то ясно, что эти величины изменяются «согласованно», т.е. они коррелированны, однако не может быть и речи о том, что одна из них каким-то образом влияет на изменение другой. 

Задача обнаружения ЛИНЕЙНОЙ связи  и оценки ее уровня решается в рамках корреляционного анализа.

Установлением факта наличия или  отсутствия линейной связи корреляционный анализ исчерпывается.

Другой вариант изучения взаимозависимостей выявляет одну величину как зависимую – объясняемую, а другую – как независимую – объясняющую. Вопрос о том, как это сделать, является принципиальным при изучении экономических процессов и явлений.  Для его решения используются сведения из различных разделов экономики, здравый смысл и прочие неформальные методы. Очень важно правильно установить причинно-следственные связи.  К чему может привести ошибка демонстрирует следующий пример.  Один из древних царей заметил, что при возникновении эпидемий (страшная вещь!) сразу же появляется много врачей. Будучи не слишком мудрым, он предложил бороться с эпидемиями, убивая врачей.  Это безусловно пример ошибочного представления о том, что  является причиной явления (объясняющей переменной) и что – следствием (объясняемой переменной).  Представления и гипотезы о причинной связи должны быть привнесены из некоторой теории, которая позволяет содержательно объяснить изучаемое явление.  Если на основании экономических исследований  оказывается, что изменение одного  экономического показателя можно объяснить изменением другого (или в общем случае нескольких) – переходят к построению регрессионной модели, т.е. к регрессионному анализу.   Регрессионный анализ в эконометрике – это процедура построения математической функции, связывающей некоторый экономический показатель или группу показателей с одним или более другими экономическими показателями, т.е. получение зависимости вида Y=f(X).

В принципе, вид связи  между переменными, т.е. вид конкретной функции  f(X) может быть достаточно сложным: квадратичная, параболическая, гиперболическая и т.п.  Однако взаимосвязи экономических переменных часто близки к линейным. Даже в тех случаях, когда некоторая зависимость, вообще говоря, не является линейной, она может быть приближенно описана как линейная в основном диапазоне наблюдаемых значений своих переменных. С линейными функциями удобно работать; существуют эффективные методы оценки и анализа линейных экономических моделей. Поэтому анализ линейных зависимостей является базовым в прикладной эконометрике.   Простейшей и наиболее активно используемой моделью в эконометрике является модель парной линейной регрессии.

    1. Модель парной линейной регрессии     (ПЛР).

Пусть необходимо изучить  двумерную СВ – (X ,Y), где X и Y определяют некоторые генеральные совокупности.    Можно  утверждать, что изменение СВ X  приводит к изменению СВ Y, т.е. X рассматривается как объясняющая (независимая) переменная -фактор, а  Y  - как объясняемая (зависимая) переменная.

Общий вид модели ПЛР  -   Y=a +b*X+e. 

Здесь X,Y – генеральные совокупности, a, b - параметры регрессии, e - СВ – ошибка. Наличие ошибки e отражает тот факт, что исследуемая зависимость является стохастической, т.е. . Природу ошибки в модели ПЛР рассмотрим позже. Заметим, что определив вид модели, мы решили задачу спецификации.

Очевидно, что определение  значений для α и β  принципиально невозможно, поскольку вся генеральная совокупность недоступна. Основная цель регрессионного анализа состоит в получении оптимальных оценок для этих параметров по имеющимся выборочным данным и оценке качества уравнения регрессии в целом.

Пусть имеется выборка  объема n, т.е.  набор пар (xi, yi), i=1,2,…,n.    Построим корреляционное поле, т.е. множество точек на плоскости с координатами (xi, yi). Задача состоит в том, чтобы по имеющейся выборке построить наилучшим образом прямую  Y=a+ b*X, которая бы была в некотором смысле «ближайшей» к точкам корреляционного поля.   Полученные при этом значения параметров a и b являются оценками для параметров ПЛР α и β. 

«Наилучшей» будем называть такую прямую, для которой сумма  квадратов отклонений точек заданного  корреляционного поля от соответствующих  точек прямой наименьшая.   Для  определения параметров такой прямой, т. е. для решения задачи параметризации,  используется метод наименьших квадратов.  

    1. Метод наименьших квадратов.

Координаты i-той точки корреляционного поля – (xi,yi). Ордината точки с абсциссой xi, лежащей на прямой  равна a + b*xi. Следовательно,  отклонение  для i-той точки корреляционного поля  - это величина ei =yi – (a + b*xi).

Требуется так определить значения параметров a и b, чтобы была минимальной.  Такая прямая называется линией регрессии X на Y.

Рассматриваемая сумма  квадратов есть функция двух переменных  - она зависит от a,b, поскольку yi  и x заданные числа.

Условие минимума функции  двух переменных известно:

 

Получаем систему двух линейных уравнений для нахождения неизвестных  значений a и  b:

Полученная система называется системой нормальных уравнений.

Из первого уравнения получаем:

,   отсюда  a= -b* , т.е.   a =M(Y)-b*M(X)

Введем обозначения   M = ;  M = ;    тогда

Из второго уравнения системы  имеем:

       или  

Разделим обе части на n:

Отсюда .

Окончательно для параметров регрессии  имеем:

Параметры  линии регрессии найдены  по методу наименьших квадратов.

Для иллюстрации вышесказанного рассмотрим следующий пример.

Администрации страховой компании приняла решение о введении нового вида услуг – страховании на случай пожара. Было известно, что ущерб, причиняемый  пожаром, зависит от расстояния до ближайшей пожарной станции. В компанию обратились семьи, проживающие на расстоянии 4,5 км и 6,5 км от станции. Для того чтобы определить тариф страхования, проанализировали  выборку из 5 страховых случаев:

Расстояние до пожарной станции (км)  S

4

5

6

7

8

Ущерб, причиненный пожаром  (тыс.) Z

80

70

100

100

110


Фактором в данном случае является расстояние до ближайшей  пожарной станции S, объясняемая переменная –ущерб, причиненный пожаром Z.  Построим корреляционное поле:

Рассчитаем числовые характеристики СВ S, Z и двумерной СВ (S,Z).

Окончательно для уравнения  регрессии получили:

Рассмотрим каждую из точек корреляционного  поля.

x1=4;  y1=80;  yтеор(x1)=38+9*4=74;  e1=6

x2=5;  y2=70;  yтеор(x2)=38+9*5=83;  e2=-13;

x3=6;  y3=100;  yтеор(x3)=38+9*6=92;  e3=8;

x4=7;  y4=100;  yтеор(x4)=38+9*7=101;  e4=-1;

x5=8;  y5=110;  yтеор(x5)=38+9*8=110;  e5=0;

e1+ e2+ e3+ e4+ e5=0.

 

  Для определения примерного ущерба от пожара для каждой из семей можно теперь воспользоваться линией регрессии, т.е. в качестве прогнозного значения объясняемой переменной рассмотрим ординату соответствующей точки на линии регрессии.  Такой прогноз называется точечным.

 Тариф для семьи, проживающей  на расстоянии 4,5 км, устанавливается  из расчета 78,5 тыс. руб. ущерба, а для семьи, проживающей на  расстоянии 6,5 км от станции  - из расчета 96,5 тыс. руб. ущерба. 

В действительности ситуация в этой задаче несколько  упрощена,  но тем не менее  прогноз ущерба удалось получить. В дальнейшем мы будем исследовать надежность этого прогноза, что безусловно очень важно.

    1. Интерпретация ПЛР.

Построение модели ПЛР  сводится к нахождению параметров некоторой  прямой на плоскости, вокруг которой наилучшим образом концентрируются точки корреляционного поля.  Уравнение линии регрессии .

 Параметры a и b этой прямой определятся по методу наименьших квадратов

Параметр b  позволяет оценить,  на  сколько единиц (в своих измерениях) изменится объясняемая СВ Y, если фактор X изменится на 1 единицу в своих измерениях.

Так в рассмотренном примере   регрессия имеет вид

- это означает, что если расстояние до пожарной станции увеличится на 1 км, то ущерб от пожара возрастет примерно на 9 тыс. рублей.

Другой пример.  ПЛР  часто используется при изучении функции потребления  - модель Кейнса.

C = q + w*D + e

 C – потребление  (в тыс. руб.)

D -  доход (в тыс. руб.)

q, w -  параметры регрессии.

По репрезентативной выборке получено уравнение регрессии 
Cтеор = 1,9 + 0,65*D.

Здесь коэффициент регрессии w характеризует склонность к потреблению.  Он показывает, что из каждой тысячи  рублей дохода на потребление расходуется  650 рублей,  и 350 рублей – на инвестиции.

Свободный член в уравнении  регрессии может не иметь экономического содержания, если фактор не может иметь  нулевого значения.

Теперь запишем уравнение ПЛР немножко в другой форме, исключив свободный член.

Из этого представления  видно, что для любой выборки  линия регрессии обязательно  проходит через точку с координатами ( ).  Угловой коэффициент этой прямой  равен b.

Графически – построение ПЛР по корреляционному полю сводится  к нахождению «наилучшей»  прямой, вокруг которой концентрируются точки корреляционного поля.

    1. Оценка значимости уравнения регрессии. 

По любой выборке  можно в соответствии с формулами МНК получить какие-то значения для параметров a и b. Если по одной выборке получаем b >0, а по другой – b < 0, то смысла в такой регрессии по-видимому нет.  Делать какие-либо прогнозы по такой регрессии невозможно (опасно), и следует признать, что в таком случае ничего лучше, чем    в классе линейных моделей не существует.  Действительно, если b > 0, то росту фактора соответствует увеличение объясняемой переменной, а для b < 0 – при увеличении фактора значение объясняемой переменной уменьшается.  В качестве прогноза можно сказать лишь, что «что-нибудь  будет»,  что едва ли уместно в серьезных экономических исследованиях.

Информация о работе Эконометрика