Построение и анализ модели множественной регрессии

Автор работы: Пользователь скрыл имя, 16 Января 2014 в 15:52, контрольная работа

Краткое описание

Линейная модель множественной регрессии имеет вид:

,
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.

Прикрепленные файлы: 1 файл

Козлова Вика - Эконометрика КОНТРОЛЬНАЯ.doc

— 371.50 Кб (Скачать документ)

 

Оценим значимость модели в целом  на основе вычисления F-критерия Фишера.

 

По данным дисперсионного анализа F = 129,268

 

Табличное значение F-критерия  со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений),  k = 1  (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

 

F табл = 4,19597

 

 

Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.

 

 

Определим среднюю относительную  ошибку аппроксимации 

 

 

Поскольку Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.

 

Сравним модель со значимыми факторами (двухфакторную) и однофакторную  модель с наиболее значимым фактором.

 

Двухфакторная модель

Однофакторная модель

y = -4,5414 + 0,3445 x1 + 1,1026 x2

y = 2,934 + 0,412 x1

R = 0,9265

R = 0,9066

F = 81,8519

F = 129,268


 

Средняя относительная ошибка аппроксимации Еотн.ср. в двухфакторной модели несколько лучше.

 

Коэффициент множественной корреляции  R в двухфакторной модели несколько лучше.

Чем ближе величина R  к единице, тем теснее выбранный вид функции связывает между собой факторные переменные и исследуемый признак, тем лучше качество модели.

 

Чем больше расчётное значение F-критерия, тем лучше качество модели.

F-критерий Фишера значительно  лучше в однофакторной модели, следовательно модель, в которой  цена квартиры зависит только  от общей площади квартиры (однофакторная)  обладает лучшим качеством.

 

5. Осуществим прогнозирование  (для однофакторной модели) среднего  значения показателя Y при условии,  что прогнозное значения фактора  X составит 80% от его максимального  значения.

 

Точечный прогноз вычисляем  путём подстановки в уравнение  прогнозного значения факторной переменной:

 

Для однофакторной модели максимальное значение Х = 137,7*80% = 110,16

= 48,355

 

Доверительный интервал прогноза зависит  от стандартной ошибки, удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза α :

Стандартная ошибка Sст =  4,397 (по данным таблицы 6)

 

t0,1 =  СТЬЮДРАСПОБР(0,1; 28) = 1,701

 

Доверительный интервал  L = 1,32

 

 

Тогда фактические значения исследуемого признака с вероятностью (1-α) попадут  в интервал

.

 

6. Представим графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

 

Таблица 7 - Прогнозирование

 
       

№ п/п

Фактическое y - цена  
квартиры, тыс. долл.

x1 – общая площадь  
квартиры, (м2)

Предсказанное y - цена  
квартиры, тыс. долл.

1

15,9

39

19,01444394

2

27

68,4

31,13647903

3

13,5

34,8

17,28272464

4

15,1

39

19,01444394

5

21,1

54,7

25,4877756

6

28,7

74,7

33,73405798

7

27,2

71,1

32,24972715

8

28,3

74,5

33,65159516

9

52,3

137,7

59,70984747

10

22

40

19,42675806

11

28

53

24,7868416

12

45

86

38,39320752

13

51

98

43,34097695

14

34,4

62,6

28,74505714

15

24,7

45,3

21,61202289

16

30,8

56,4

26,18870961

17

15,9

37

18,1898157

18

29

67,5

30,76539633

19

15,4

37

18,1898157

20

28,6

69

31,3838675

21

15,6

40

19,42675806

22

27,7

69,1

31,42509892

23

34,1

68,1

31,0127848

24

37,7

75,3

33,98144645

25

41,9

83,7

37,44488505

26

24,4

48,7

23,01389089

27

21,3

39,9

19,38552665

28

36,7

68,6

31,21894186

29

21,5

39

19,01444394

30

26,4

48,6

22,97265948

31

 

110,16

48,355

 

 

 

Таблица 8 – Результаты прогнозных оценок

       

Прогнозируемое значение

48,355

Уровень значимости

0,1

Стандартная ошибка

4,396788203

Размер выборки

30

Число степеней свободы

28

Табличное  t-статистики Стьюдента 

1,701130908

Доверительный интервал

1,320389844

Нижняя граница y

47,034

Верхняя граница y

49,675


 

 

 

 

2. Задача №  2 «Построение и анализ модели  временного ряда»

 

 

Таблица 2.1 – Исходные данные

 

Дан временной ряд, характеризующий  месячную динамику численности занятых  в сфере услуг фирмы yt (чел.) за 8 месяцев:

Месяц, t

1

2

3

4

5

6

7

8

Число занятых yt, чел.

5

8

7

15

22

23

26

33


 

1. Проверим наличие  аномальных наблюдений.

Наличие аномальных наблюдений приводит к искажению результатов моделирования, поэтому необходимо убедиться в  отсутствии аномальных данных. Для  этого воспользуемся методом Ирвина.

Для всех или только для подозреваемых  в аномальности наблюдений вычисляется  величина  yt.

где

 

Если рассчитанная величина  yt превышает табличный уровень (например, для 10 наблюдений значение критерия Ирвина равно 1,5), то уровень  yt считается аномальным. 

Для расчета l воспользуемся функцией Excel  СТАНДОТКЛОН().

 

Таблица 2.2 – Результаты расчетов по методу Ирвина

 

Месяц, t

 

1

2

3

4

5

6

7

8

Число занятых yt, чел.

 

5

8

7

15

22

23

26

33

l

 

0,58

0,35

0,12

0,93

0,81

0,12

0,35

0,81


 

Из результатов мы видим, что  аномальных значений не наблюдается.

 

2. Проверим наличие  тренда.

 

Поделим исходный временной ряд  на две равные части и для каждой части найдем среднее и дисперсию, воспользовавшись пакетом анализа Excel.

 

Число занятых yt, чел.

5

8

7

15

22

23

26

33


 

Таблица 2.3 – Результаты двухвыборочного  F-теста для дисперсии

 

 

Переменная 1

Переменная 2

Среднее

8,75

26

Дисперсия

18,92

24,67

Наблюдения

4

4

df

3

3

F

0,767

 

P(F<=f) одностороннее

0,416

 

F критическое одностороннее

0,108

 

 

Среднее значение и дисперсия второй части значительно превышают  среднее значение и дисперсию  первой части, следовательно можно  сделать вывод, что имеется повышающий тренд.

 

 

 

3. Построим линейную  модель временного ряда   ,  
параметры которой оценить с помощью метода наименьших квадратов.

 

Согласно методу наименьших квадратов  при оценке параметров модели всем наблюдениям присваиваются равные веса, т. е. их информационная ценность признается равной, а тенденция развития на всем участке наблюдений – неизменной.

 

Для определения параметров модели воспользуемся инструментом Регрессия  в надстройке Excel  Анализ данных.

Из анализа таблицы 4 получаем коэффициенты уравнения регрессии:

а0 = -0,893,    а1 = 4,06

Тогда уравнение модели примет вид:

Коэффициент детерминации R2 = 0,95354, что говорит о высокой точности модели.

 

Таблица 4 –  Протокол регрессивного анализа  линейной модели временного ряда

             
     

Месяц, t

Число занятых yt, чел.

   
     

1

5

   
     

2

8

   
     

3

7

   

ВЫВОД ИТОГОВ

   

4

15

   
     

5

22

   

Регрессионная статистика

 

6

23

   

Множественный R

0,97649

 

7

26

   

R-квадрат

0,95354

 

8

33

   

Нормированный R-квадрат

0,94579

         

Стандартная ошибка

2,37087

         

Наблюдения

8

         
             

Дисперсионный анализ

           
 

df

SS

MS

F

Значимость F

 

Регрессия

1

692,1488

692,149

123,136

3,19E-05

 

Остаток

6

33,72619

5,62103

     

Итого

7

725,875

       
             
 

Коэффи-циенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-0,89286

1,8474

-0,4833

0,646

-5,413

3,627

Месяц, t

4,05952

0,3658

11,0966

3,2E-05

3,164

4,955

             
             

ВЫВОД ОСТАТКА

           
             
 

Предска-занное Число занятых yt, чел.

Остатки

       

1

3,16667

1,833333

       

2

7,22619

0,77381

       

3

11,2857

-4,285714

       

4

15,3452

-0,345238

       

5

19,4048

2,595238

       

6

23,4643

-0,464286

       

7

27,5238

-1,52381

       

8

31,5833

1,416667

       

 

4. Оценим адекватность  модели, используя свойства независимости  остаточной компоненты, случайности  уровней ряда остатков и соответствия  ряда остатков нормальному закону  распределения.

 

а) Независимость остаточной компоненты (отсутствие автокорреляции) проверим с помощью d-критерия  Дарбина–Уотсона по формуле

Месяц, t

Остатки 

Точки

поворота

1

1,833333

 

3,361111

 

2

0,77381

 

0,598781

1,122591

3

-4,285714

*

18,36735

25,59878

4

-0,345238

 

0,119189

15,52735

5

2,595238

*

6,735261

8,6464

6

-0,464286

 

0,215561

9,360686

7

-1,52381

*

2,321995

1,122591

8

1,416667

 

2,006944

8,6464

Сумма

0

 

33,72619

70,0248


 

Значение статистики Дарбина-Уотсона изменяется в диапазоне от 0 до 4. При этом d = 2 указывает на отсутствие автокорреляции элементов временного ряда. Если d меньше двух, то имеет место положительная автокорреляции, а больше двух - отрицательная.

 

d = 70,0248 / 33,7269 = 2,076

 

Так как d попало в интервал от 2 до 4, то вычисляем d’ :

 

d’ = 4 – 2.076 = 1,924

 

Зададим  уровень  значимости равной 0,05. По таблицам значений  критерия Дарбина-Уотсона для числа n=8 и числа независимых переменных модели k=1 критическое значение d1=0,76 и d2=1,33.

Поскольку d’ попало в интервал от d2<d’<2, по данному  критерию  модель адекватна.

Информация о работе Построение и анализ модели множественной регрессии