Построение и анализ модель множественной регрессии

Автор работы: Пользователь скрыл имя, 22 Января 2014 в 19:35, контрольная работа

Краткое описание

По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

Прикрепленные файлы: 1 файл

ekonometrika_Variant_5Эконометрика)))).doc

— 1.99 Мб (Скачать документ)

Задача 1. Построение и анализ модель множественной регрессии

 

По исходным данным требуется:

1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).

2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.

4. Построитьипроанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.

5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости a = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).

6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

Примечание. Выполнение задач отразить в аналитической записке, приложить компьютерные распечатки расчетов.

По территориям  Сибирского федерального округа имеются  данные за 20XX г. о значениях экономических показателей:

y – инвестиции в экономику, млрд. руб.,

x1– среднегодовая численность занятых в экономике, млн. чел.,

x2 – валовой региональный продукт, млрд. руб.,

x3 – инвестиции прошлого года в экономику, млрд. руб.

Субъекты РФ

y

x1

x2

x3

Республика  Алтай

0,8

0,081

2,6

0,26

Республика  Бурятия

3,1

0,396

18,1

2,64

Республика  Тыва

0,3

0,103

2,6

0,28

Республика  Хакасия

1,9

0,234

14,3

1,78

Алтайский край

6,7

1,108

34,8

5,13

Красноярский  край

24,0

1,401

129,5

12,43

Иркутская обл.

11,4

1,138

85,9

8,62

Кемеровская обл.

16,4

1,236

69,0

11,74

Новосибирская обл.

9,4

1,122

58,3

6,05

Омская обл.

4,8

0,968

40,6

4,54

Томская обл.

8,6

0,456

31,2

5,84

Читинская обл.

5,7

0,440

22,2

3,19


 

Решение:

  1. Построение уравнения множественной регрессии и оценка ее параметров

Коэффициенты  уравнения множественной регрессии оцениваются, как и коэффициенты парной регрессии, методом наименьших квадратов (МНК). Классический подход к оцениванию коэффициентов уравнения регрессии основан на методе наименьших квадратов (МНК).

Система нормальных уравнений VYRимеет вид:

Sy = ma0  + а1Sx1 +  а2Sx2 + а3Sx3

Syx1 = a0Sx1  + а1S(x1)2 + а2Sx1*х2 + а3S х1*x3

Syx2 = a0Sx2  + а1Sx1*х2 + а2S (х2)2 + а3S х2*x3

Syx3 = a0Sx3  + а1Sx1*х3 + а2Sх2*х3 + а3S (х3)2

Величины  Sy, Sx1, Syx1, S(x1)2, Sx2, Syx2, S(x2)2, Syх1*x2, Sx3, Syx3, S(x3)2,Sx1*х3, Sx2*х3находятся непосредственно по данным производственных измерений, которые заданы в таблице промежуточных вычислений.   

 

t

х1

х2

х3

у

ух1

ух2

ух3

х1х2

х1х3

х2х3

(х1)2

(х2)2

(х3)2

Республика  Алтай

0,081

2,6

0,26

0,8

0,0648

2,08

0,208

0,2106

0,02106

0,676

0,00656

6,76

0,0676

Республика  Бурятия

0,396

18,1

2,64

3,1

1,2276

56,11

8,184

7,1676

1,04544

47,784

0,15682

327,61

6,9696

Республика  Тыва

0,103

2,6

0,28

0,3

0,0309

0,78

0,084

0,2678

0,02884

0,728

0,01061

6,76

0,0784

Республика Хакасия

0,234

14,3

1,78

1,9

0,4446

27,17

3,382

3,3462

0,41652

25,454

0,05476

204,49

3,1684

Алтайский край

1,108

34,8

5,13

6,7

7,4236

233,16

34,371

38,5584

5,68404

178,524

1,22766

1211,04

26,3169

Красноярский  край

1,401

129,5

12,43

24

33,624

3108

298,32

181,43

17,4144

1609,69

1,9628

16770,3

154,505

Иркутская обл.

1,138

85,9

8,62

11,4

12,9732

979,26

98,268

97,7542

9,80956

740,458

1,29504

7378,81

74,3044

Кемеровская обл.

1,236

69

11,74

16,4

20,2704

1131,6

192,536

85,284

14,5106

810,06

1,5277

4761

137,828

Новосибирская обл.

1,122

58,3

6,05

9,4

10,5468

548,02

56,87

65,4126

6,7881

352,715

1,25888

3398,89

36,6025

Омская обл.

0,968

40,6

4,54

4,8

4,6464

194,88

21,792

39,3008

4,39472

184,324

0,93702

1648,36

20,6116

Томская обл.

0,456

31,2

5,84

8,6

3,9216

268,32

50,224

14,2272

2,66304

182,208

0,20794

973,44

34,1056

Читинская обл.

0,44

22,2

3,19

5,7

2,508

126,54

18,183

9,768

1,4036

70,818

0,1936

492,84

10,1761

                           

ИТОГО

8,683

509,1

62,5

93,1

97,6819

6675,92

782,422

542,727

64,18

4203,43

8,83939

37180,3

504,734


 

Для исходной задачи система нормальных уравнений примет вид:

93,1  = 12 * а0 + 8,683 * а1 + 509,1 * а2 + 62,5*а3

97,6819= 8,683 * а0 +  8,83939 * а1 + 542,727 * а2 + 64,18 * а3

6675,92 = 509,1 * а0 +  542,727 * а1 + 37180,3 * а2 + 4203,43 * а3

782,422 = 62,5 * а0 +  64,18 * а1 + 4203,43 * а2 + 504,734 * а3

Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия» (рис 1).

Задав соответствующие  диапазоны данных в окне,

получим набор таблиц А, Б, В.

 

 

Таблица А –  регрессионный анализ

     

Множественный R

0,982883

Множественный коэффициент корреляции R

R-квадрат

0,966059

Коэффициент координации R

Нормированный R-квадрат

0,953331

 

Стандартная ошибка

1,498558

Стандартная ошибка определения R

Наблюдения

12

Число наблюдений


 

Таблица Б –  дисперсионный анализ

 

Число степеней свободы

дисперсия

Дисперсия на 1 степень свободы

Статистика  Фишера

 
 

df

SS

MS

F

Значимость F

Регрессия

3

511,3438

170,4479

75,90049

3,22E-06

Остаток

8

17,96541

2,245676

   

Итого

11

529,3092

     

 

Таблица В

 

Коэффициенты  уравнения регрессии

Стандартная ошибка определения коэффициентов

t-статистика

Вероятность ошибки

Нижние 95%-пределы

Верхние 95%-пределы

 

Коэффициенты

Стандартная ошибка

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-0,0131

0,829506

-0,01579

0,987785

-1,92595

1,899743

X1

-3,71269

2,113172

-1,75693

0,116993

-8,58568

1,160292

X2

0,087542

0,033895

2,582735

0,032478

0,00938

0,165705

Х3

1,294828

0,331211

3,909372

0,004485

0,531053

2,058602


 

Из таблицы  В следует, что уравнение регрессии  имеет вид:

У = -0,0131 –3,71269*х1 + 0,087542*х2+1,294828*х3

 

 

Выполнен экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).

Коэффициент детерминации (индекс детерминации) можно определить из табл. А:

R2ух1,х2,…. = 0,966059

Очевидно, что  связь между факторами (х1, х2, х3) и  результатом (У) прямая и сильная. Величина R2= 0,966059 показывает долю изменения (вариации) результативного признака под действием факторного признака. Т.е. доля изменения (вариации) результативного признака под воздействием факторного признака равна  96,61 %

Коэффициент множественной корреляции (индекс корреляции) можно определить из табл. А:

Rух1,х2,…. =

= 0,982883

Проверка значимости уравнения регрессии основана на использовании F-критерии Фишера. Фактическое значение критерия берется из таблицы Б, т. е.

Fфакт = 75,90049

Табличные зачения  составляют

F(0,05)=3,443357   F(0,01)= 5,71902.

Откуда следует, что уравнение регрессии значимо как при α = 0,05, так и при α = 0,01.

Оценим значимость отдельных параметров построенной  модели. Из таблицы 1 видно, что на уровне значимости α = 0,05 все включенные в модель факторы являются значимыми: Р – значение< 0,05.

 

Коэффициенты  уравнения регрессии

Стандартная ошибка определения коэффициентов

t-статистика

 

Коэффициенты

Стандартная ошибка

Y-пересечение

-0,0131

0,829506

-0,01579

X1

-3,71269

2,113172

-1,75693

X2

0,087542

0,033895

2,582735

Х3

1,294828

0,331211

3,909372


 

Границы доверительного интервала для коэффициентов  регрессии не содержат противоречивых результатов:

 

Коэффициенты  уравнения регрессии

Нижние 95%-пределы

Верхние 95%-пределы

Y-пересечение

-0,0131

-1,92595

1,899743

X1

-3,71269

-8,58568

1,160292

X2

0,087542

0,00938

0,165705

Х3

1,294828

0,531053

2,058602


 

2. Проанализирована матрица парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

Построим корреляционную матрицу, используя функцию «Сервис. Анализ данных.Корреляция» табличного процессора MS Excel.

 

 

 

 

 

у

х1

х2

х3

у

1

     

х1

0,824132

1

   

х2

0,949267

0,873559

1

 

х3

0,96602

0,885602

0,928676

1


 

Из матрицы  следует, что наблюдается некоторая  коллинеарность между факторами x2 и x3  (так как r x2x3 = 0,928676) и факторами х1 и х3 (r x1x3 = 0,885602). Таким образом, далее будет строиться регрессия y на факторы x2, х3.

3. Построена линейная модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2).

Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия» (рис 3).

Задав соответствующие  диапазоны данных в окне,

получим набор  таблиц А, Б, В.

 

 

Таблица А –  регрессионный анализ

     

Множественный R

0,976198

Множественный коэффициент корреляции R

R-квадрат

0,952963

Коэффициент координации R

Нормированный R-квадрат

0,94251

 

Стандартная ошибка

1,663242

Стандартная ошибка определения R

Наблюдения

12

Число наблюдений


 

Таблица Б –  дисперсионный анализ

 

Число степеней свободы

дисперсия

Дисперсия на 1 степень свободы

Статистика  Фишера

 
 

df

SS

MS

F

Значимость F

Регрессия

2

504,4118

252,2059

91,16845

1,06E-06

Остаток

9

24,89735

2,766373

   

Итого

11

529,3092

     

Информация о работе Построение и анализ модель множественной регрессии