Определение эконометрики

Автор работы: Пользователь скрыл имя, 09 Октября 2012 в 23:55, реферат

Краткое описание

Актуальность выбранной темы определяется тем, что в эконометрике широко используются методы статистики. Во многих практических задачах прогнозирования, изучая различного рода связи в экономических, производственных системах, необходимо на основании экспериментальных данных выразить зависимую переменную в виде некоторой математической функции от независимых переменных – регрессоров, то есть построить регрессионную модель.

Содержание

Глава 1. Теоретические и методологические основы применения регрессионного анализа в эконометрике
Основные положения регрессионного анализа………………………….5
Оценка параметров парной регрессионной модели…………………….8
Интервальная оценка функции регрессии и ее параметров…………...15
Оценка значимости уравнения регрессии и особенности
применения коэффициента детерминации………………….…………16
Выводы……………………………………………………………………………...20
Глава 2. Практическое применение регрессионного анализа в эконометрике
Задача 1…………………………………………………………………...22
Задача 2…………………………………………………………………...23
Выводы……………………………………………………………………………...26
Заключение………………………………………………………………………….27
Библиографический список………………………………………………………..29

Прикрепленные файлы: 1 файл

Оглавление.doc

— 227.00 Кб (Скачать документ)
    1.  
      Оценка значимости уравнения регрессии и особенности применения коэффициента детерминации

 
После того как найдено  уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров13
 
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, коэффициент регрессии равен нулю, то есть b=0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части – «объясненную» и «необъясненную» (приложение 2).  
 
Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения у вызвана влиянием множества причин. Условно всю совокупность причин можно разделить на две группы: 

  •  
    изучаемый фактор х
  •  
    прочие факторы

 
Если фактор не оказывает  влияния на результат, то линия регрессии  на графике параллельна оси охи  у = ŷ. Тогда вся дисперсия результативного  признака обусловлена воздействием прочих факторов и общая сумма  квадратов отклонений совпадает с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов. 
 
Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, то есть регрессией у по х, так и вызванный действием прочих величин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное влияние на результат у. Это равносильно тому, что коэффициент детерминации r2xy будет приближаться к единице. 
 
Любая сумма квадратов отклонений связана с числом степеней свободы (df – degrees of freedom), то есть с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных [(y1-y), (y2-y),…,(yn-y)] требуется для образования данной суммы квадратов. Так, для общей суммы квадратов ∑(y-y)требуется (n-1) независимых отклонений. 
 
При расчете объясненной или факторной суммы квадратов ∑(ŷ-y)используются теоретические (расчетные) значения результативного признака ŷx, найденные по линии регрессии: ŷx=а+b*x. 
 
В линейной регрессии сумма квадратов отклонений, обусловленных линейной регрессией, составит: ∑(ŷ-y)2=b2*∑(x –x)2.  
 
Поскольку при заданном объеме наблюдений по х и у факторная сумма квадратов при линейной регрессии зависит только от одной константы коэффициента регрессии b, то данная сумма квадратов имеет одну степень свободы. К тому же выводу придем, если рассмотрим содержательную сторону расчетного значения признака у, то есть ŷx. Величина ŷопределяется по уравнению линейной регрессии: ŷx=а+b*x. Параметр а можно определить как: a=y-b*x. Подставив выражение параметра а в линейную модель получим: 
 
ŷx= y-b*x+b*x= y-b*(х-х). 
 
Отсюда видно, что при заданном наборе переменных у и х расчетное значение ŷявляется в линейной регрессии функцией только одного параметра – коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1. 
 
Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет n-2. Число степеней свободы для общей суммы квадратов определяется числом единиц, и поскольку используется средняя вычисленная по данным выборки, то теряем одну степень свободы, то есть dfобщ= n-1. 
 
Итак, имеется два равенства: 
 
∑(у-у)2=∑( ŷ–у)2+∑(у- ŷx)2
 
n-1=1+(n-2). 
 
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D. 
 
Dобщ=∑(у-у)2/(n-1); 
 
Dфакт=∑( ŷ–у)2/1; 
 
Dост=∑(у- ŷx)2/(n-1). 
 
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения (F-критерия): 
 
F= Dфакт/ Dост, где 
 
F – критерий для проверки нулевой гипотезы Н0: Dфакт=Dост
 
Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Ннеобходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. 
 
Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различимом числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт>Fтабл. Нотклоняется. 
 
Если же величина окажется меньше табличной Fфакт<Fтабл, то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически не значимым. Нне отклоняется. 
 
Оценку качества модели дает коэффициент детерминации. Коэффициент детерминации (R2) — это квадрат множественного коэффициента корреляции14. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных. 
 
Формула для вычисления коэффициента детерминации: 
 
где  
 
y— выборочные данные, а f— соответствующие им значения модели. 
 
Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными. 
 
Коэффициент принимает значения из интервала [0;1]. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям. 
 
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R= r2
 
Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока) (приложение 3). 
 
Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение. 
 
Выводы 
 
В настоящее время регрессионный анализ используется как в естественнонаучных исследованиях, так и в обществоведении. 
 
Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.  
 
Практически, речь идет о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключенную в этом множестве закономерность (тренд, тенденцию),  линию регрессии.  
 
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной. 
 
Решение задач основывается на анализе соответствующих параметров (статистических данных) в которых всегда неизбежно присутствуют отклонения, вызванные случайными ошибками. Поэтому существуют специальные методы оценки как уравнения регрессии в целом, так и отдельных ее параметров. 
Глава 2. Практическое применение регрессионного анализа в эконометрике 
 
Задача 1 
 
По территории региона приводятся данные за 2007 (табл. 2.1).

 
Номер региона

 
Среднедушевой прожиточный минимум  в день одного 
 
трудоспособного, руб., х

 
Среднедневная заработная плата, руб., у

 
1

 
78

 
133

 
2

 
82

 
148

 
3

 
87

 
134

 
4

 
79

 
154

 
5

 
89

 
162

 
6

 
106

 
195

 
7

 
67

 
139

 
8

 
88

 
158

 
9

 
73

 
152

 
10

 
87

 
162

 
11

 
76

 
159

 
12

 
115

 
173


 
Построить линейное уравнение  парной регрессии у от х. 
 
Решение: для расчета параметров уравнения линейной регрессии строим расчетную таблицу (табл. 2.2)

 

 

 
х

 
у

 
Ху

 
х2

 
у2

 
1

 
78

 
133

 
10374

 
6084

 
17689

 
2

 
82

 
148

 
12136

 
6724

 
21904

 
3

 
87

 
134

 
11658

 
7569

 
17956

 
4

 
79

 
154

 
12166

 
6241

 
23716

 
5

 
89

 
162

 
14418

 
7921

 
26244

 
6

 
106

 
195

 
20670

 
11236

 
38025

 
7

 
67

 
139

 
9313

 
4489

 
19321

 
8

 
88

 
158

 
13904

 
7744

 
24964

 
9

 
73

 
152

 
11096

 
5329

 
23104

 
10

 
87

 
162

 
14094

 
7569

 
26244

 
11

 
76

 
159

 
12084

 
5776

 
25281

 
12

 
115

 
173

 
19895

 
13225

 
29929

 
Итого

 
1027

 
1869

 
161808

 
89907

 
294377

 
Среднее значение

 
85,6

 
155,8

 
13484,0

 
7492,3

 
24531,4

 
σ

 
12,95

 
16,53

 
-

 
-

 
-

 
σ2

 
167,7

 
273,4

 
-

 
-

 
-


 
b=xy-y*x/∑x2-(x)2=(13484-85,6*155,8)/(7492,3-85,62)=151,8/164,94=0,92 
 
a=y-b*x=155,8-0,92*85,6=77,0 
 
Получено уравнение регрессии: у=77,0+0,92*х. 
 
С увеличением среднедушевого прожиточного минимума на 1 рубль среднедневная заработная плата возрастает в среднем на 0,92 рубля. 
 
Задача 2 
 
По семи территориям Уральского района за 2008 г. Известны значения двух признаков (табл. 2.3).

 
Район

 
Расходы на покупку продовольственных  товаров в общих расходах, %, у

 
Среднедневная заработная плата одного работающего, руб., х

 
Удмуртская республика

 
68,8

 
45,1

 
Свердловская область

 
61,2

 
59,0

 
Башкортостан

 
59,9

 
57,2

 
Челябинская область

 
56,7

 
61,8

 
Пермская область

 
55,0

 
58,8

 
Курганская область

 
54,3

 
47,2

 
Оренбургская область

 
49,3

 
55,2


 
Определить: 

  1.  
    Для характеристики зависимости у от х рассчитать параметры следующих функций:

 
А. линейной, ценить ее через F-критерий Фишера. 
 
Б. степенной 
 
Решение: 
 
1.А. Для расчета параметров а и b линейной регрессии ŷx=а+b*x решаем систему нормальных уравнений относительно а и b: 
 
n*a+b∑x=∑y, 
 
a∑x+b∑x2=∑y*x. 
 
По исходным данным рассчитываем: ∑x, ∑y, ∑x2, ∑y*x, ∑y2. (Табл. 2.4) 
 
b= yx-y*x/ σx2=(3166,05-57,89*54,9)/(5,86)2=-0,35; 
 
a=y-b*x=57,89+0,35*54,9=76,88. 
 
Уравнение регрессии: ŷ=76,8-0,35*х

 

 

 
У

 
х

 
у*х

 
х2

 
у2

 
1

 
68,8

 
45,1

 
3102,88

 
2034,01

 
4733,44

 
2

 
61,2

 
59,0

 
3610,80

 
3481,00

 
3745,44

 
3

 
59,9

 
57,2

 
3426,28

 
3271,84

 
3588,01

 
4

 
56,7

 
61,8

 
3504,06

 
3819,24

 
3214,89

 
5

 
55,0

 
58,8

 
3234,00

 
3457,44

 
3025,00

 
6

 
54,3

 
47,2

 
2562,96

 
2227,84

 
2948,49

 
7

 
49,3

 
55,2

 
2721,36

 
3047,04

 
2430,49

 
Итого

 
405,2

 
384,3

 
22162,34

 
21338,41

 
23685,76

 
Среднее значение

 
57,89

 
54,90

 
3166,05

 
3048,34

 
3383,68

 
σ

 
5,74

 
5,89

 
-

 
-

 
-

 
σ2

 
32,92

 
34,34

 
-

 
-

 
-


 
С увеличением среднедневной  заработной платы на 1 рубль доля расходов на покупку продовольственных  товаров снижается в среднем  на 0,35%-ных пункта. 
 
Рассчитаем линейный коэффициент парной корреляции: 
 
rxy=b*σy=-0,35*5,86/5,74=-0,357. 
 
Связь умеренная, обратная. 
 
Определим коэффициент детерминации: 
 
r2xy=(-0,35)2=0,127. 
 
Вариация результата на 12,7% объясняется вариацией фактора х. 
 
Рассчитаем F-критерий: 
 
Fфакт= r2xy*(n-2)/(1- r2xy)=0,127*5/0,873=0,7. 
 
Поскольку 1≤F≤∞, следует рассмотреть F-1
 
Полученное значение указывает на необходимость принять гипотезу Но случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи. 
 
1.Б. построению степенной модели ŷx=а*xпредшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения: 
 
lg y=lg a + b*lg x; 
 
Y = C + b*X, где 
 
Y = lg y, X = lg x, С = lg a. 
 
Для расчетов построим таблицу (табл. 2.5)

 

 

 
х

 
у

 
Х

 
У

 
Х*У

 
Х2

 
У2

 
1

 
68,8

 
45,1

 
1,6542

 
1,8376

 
3,0398

 
2,7364

 
3,3768

 
2

 
61,2

 
59,0

 
1,7709

 
1,7868

 
3,1642

 
3,1361

 
3,1927

 
3

 
59,9

 
57,2

 
1,7574

 
1,7774

 
3,1236

 
3,0885

 
3,1592

 
4

 
56,7

 
61,8

 
1,7910

 
1,7536

 
3,1407

 
3,2077

 
3,0751

 
5

 
55,0

 
58,8

 
1,7694

 
1,7404

 
3,0795

 
3,1308

 
3,0290

 
6

 
54,3

 
47,2

 
1,6739

 
1,7348

 
2,9039

 
2,8019

 
3,0095

 
7

 
49,3

 
55,2

 
1,7419

 
1,6928

 
2,9487

 
3,0342

 
2,8656

 
Итого

 
405,2

 
384,3

 
12,1587

 
12,3234

 
21,4003

 
21,1355

 
21,7078

 
Среднее значение

 
57,89

 
54,90

 
1,7370

 
1,7605

 
3,0572

 
3,0194

 
3,1011

 
Σ

 
5,74

 
5,89

 
0,0484

 
0,0425

 
-

 
-

 
-

 
σ2

 
32,92

 
34,34

 
0,0023

 
0,0018

 
-

 
-

 
-


 
Рассчитаем С и b: 
 
b=(YX-Y*X)/ σ2X=3,0572-1,7605*1,7370/0,04842=-0,298; 
 
C=Y-b*X=1,7605+0,298*1,7370=2,278. 
 
Получим линейное уравнение: Ŷ=2,278-0,298*Х. 
 
Выполнив его потенцирование, получим: 
 
ŷ=102,278-0,298=189,7* х-0,298
 
Выводы 
 
В практических исследованиях возникает необходимость аппроксимировать (описать приблизительно) зависимость между переменными величинами у и х. Ее можно выразить аналитически с помощью формул и уравнений и графически в виде геометрического места точек в системе прямоугольных координат. Для выражения регрессии служат эмпирические и теоретические ряды, их графики — линии регрессии, а также корреляционные уравнения (уравнения регрессии) и коэффициент линейной регрессии. 
 
Показатели регрессии выражают корреляционную связь двусторонне, учитывая изменение средней величины   признака у при изменении значений xпризнака х, и, наоборот, показывают изменение средней величины   признака х по измененным значениям yпризнака у. 
 
Форма связи между показателями может быть разнообразной. И поэтому задача состоит в том, чтобы любую форму корреляционной связи выразить уравнением определенной функции (линейной, параболической и т.д.), что позволяет получать нужную информацию о корреляции между переменными величинами у и х, предвидеть возможные изменения признака у на основе известных изменений х, связанного с у корреляционно. 
Заключение 
 
В настоящее время регрессионный анализ используется как в естественнонаучных исследованиях, так и в обществоведении. 
 
В практических исследованиях возникает необходимость аппроксимировать (описать приблизительно) зависимость между переменными величинами у и х. Ее можно выразить аналитически с помощью формул и уравнений и графически в виде геометрического места точек в системе прямоугольных координат. Для выражения регрессии служат эмпирические и теоретические ряды, их графики — линии регрессии, а также корреляционные уравнения (уравнения регрессии) и коэффициент линейной регрессии. 
 
Показатели регрессии выражают корреляционную связь двусторонне, учитывая изменение средней величины   признака у при изменении значений xпризнака х, и, наоборот, показывают изменение средней величины   признака х по измененным значениям yпризнака у. 
 
Форма связи между показателями может быть разнообразной. И поэтому задача состоит в том, чтобы любую форму корреляционной связи выразить уравнением определенной функции (линейной, параболической и т.д.), что позволяет получать нужную информацию о корреляции между переменными величинами у и х, предвидеть возможные изменения признака у на основе известных изменений х, связанного с у корреляционно. 
 
Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.  
 
Практически, речь идет о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключенную в этом множестве закономерность (тренд, тенденцию),  линию регрессии.  
 
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной. 
 
Решение задач основывается на анализе соответствующих параметров (статистических данных) в которых всегда неизбежно присутствуют отклонения, вызванные случайными ошибками. Поэтому существуют специальные методы оценки как уравнения регрессии в целом, так и отдельных ее параметров. 
 
Построение линейной регрессии сводится к оценке ее параметров – a и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов 
 
В прогнозных расчетах по уравнению регрессии путем подстановки в него соответствующего значения х определяется предсказываемое значение. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки ŷx, то есть mŷx, и соответственно интервальной оценкой прогнозного значения (у*). 
 
После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера.  
 
 
Библиографический список 

Информация о работе Определение эконометрики