Построение и анализ модели множественной регрессии

Автор работы: Пользователь скрыл имя, 16 Января 2014 в 15:52, контрольная работа

Краткое описание

Линейная модель множественной регрессии имеет вид:

,
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.

Прикрепленные файлы: 1 файл

Козлова Вика - Эконометрика КОНТРОЛЬНАЯ.doc

— 371.50 Кб (Скачать документ)


 

Федеральное государственное образовательное  бюджетное учреждение

высшего профессионального образования

финансовый  университет

при правительстве российской федерации

ярославский филиал

Кафедра математики и информатики

Факультет: экономики                   Направление: финансы и кредит

Контрольная работа

по  дисциплине

«Эконометрика»

Вариант № 12

 

Студент:

Козлова Виктория Сергеевна

 

Курс:

3

 

Форма обучения:

День

 

Личное дело №:

100.31/120185

     

Преподаватель:

Черномордик Владимир Дмитриевич

Ярославль 2013

 

 

План работы

 

 

 

 

 

 

 

1. Задача №  1 «Построение и анализ модели  множественной регрессии»

 

Изучите зависимость  стоимости квартиры от ряда основных факторов.

 

№ п/п

x1 – общая

площадь

квартиры 

(м2)

x2

жилая

площадь

квартиры 

(м2)

x3

площадь

кухни

(м2)

x4 – тип дома

(1 - кирпичный, 0 - другой)

y - цена

квартиры,

тыс. долл.

1

39,0

20,0

8,2

0

15,9

2

68,4

40,5

10,7

0

27,0

3

34,8

16,0

10,7

0

13,5

4

39,0

20,0

8,5

0

15,1

5

54,7

28,0

10,7

0

21,1

6

74,7

46,3

10,7

0

28,7

7

71,1

45,9

10,7

0

27,2

8

74,5

47,5

10,4

0

28,3

9

137,7

87,2

14,6

0

52,3

10

40,0

17,7

11,0

1

22,0

11

53,0

31,1

10,0

1

28,0

12

86,0

48,7

14,0

1

45,0

13

98,0

65,8

13,0

1

51,0

14

62,6

21,4

11,0

1

34,4

15

45,3

20,6

10,4

1

24,7

16

56,4

29,7

9,4

1

30,8

17

37,0

17,8

8,3

0

15,9

18

67,5

43,5

8,3

0

29,0

19

37,0

17,8

8,3

0

15,4

20

69,0

42,4

8,3

0

28,6

21

40,0

20,0

8,3

0

15,6

22

69,1

41,3

8,3

0

27,7

23

68,1

35,4

13,0

1

34,1

24

75,3

41,4

12,1

1

37,7

25

83,7

48,5

12,1

1

41,9

26

48,7

22,3

12,4

1

24,4

27

39,9

18,0

8,1

1

21,3

28

68,6

35,5

17,0

1

36,7

29

39,0

20,0

9,2

1

21,5

30

48,6

31,0

8,0

1

26,4


 

 

Решение:

 

Линейная модель множественной  регрессии имеет вид:

,

где   - расчётные значения исследуемой переменной,

- факторные переменные.

- коэффициенты уравнения, каждый  из которых показывает, насколько  изменится значение исследуемого  признака при изменении соответствующего  фактора на 1 при неизменных прочих  факторных переменных.

 

 

Рассмотрим факторные признаки для построения регрессионной модели.

- Цена квартиры – это зависимая  переменная Y;

Независимые объясняющие переменные:

- общая площадь квартиры Х1;

- жилая площадь квартиры Х2;

- площадь кухни Х3;

- тип дома Х4

 

1. Построим классическую  модель множественной регрессии

 

Классическая линейная модель множественной  регрессии можно представить  в виде:

 

 

 

Проведем регрессивный анализ, используя  инструмент Excel  «Регрессия» (Сервис – Анализ данных – Регрессия).

 

Таблица 2 - Протокол выполнения регрессивного анализа многофакторной модели

         

ВЫВОД ИТОГОВ

       
         

Регрессионная статистика

     

Множественный R

0,988184182

     

R-квадрат

0,976507977

     

Нормированный R-квадрат

0,972749254

     

Стандартная ошибка

1,690232392

     

Наблюдения

30

     
         

Дисперсионный анализ

       
 

df

SS

MS

F

Регрессия

4

2968,85

742,2125

259,7978

Остаток

25

71,42214

2,856886

 

Итого

29

3040,272

   
         
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

-0,919569337

1,553442

-0,59196

0,559196

x1 – общая площадь квартиры (м2)

0,413111875

0,076969

5,367227

1,45E-05

x2 – жилая площадь квартиры (м2)

0,000524556

0,098309

0,005336

0,995785

x3 – площадь кухни (м2)

-0,017685345

0,220126

-0,08034

0,936605

x4 – тип дома (1 - кирпичный, 0 - другой)

7,946876901

0,727228

10,92763

5,2E-11


 

Из анализа получаем коэффициенты уравнения.

Уравнение регрессии зависимости  цены квартиры от независимых объясняющих  переменных принимает вид:

 

y = -0,9196 + 0,4131 x1 + 0,0005 x2 + -0,0177 x3 + 7,9469 x4

 

Оценим качество модели.

Определим коэффициент детерминации.

 

 

= 1 -  71,422 / 3040,272  = 2968,85 / 3040,272  = 0,9765

 

Коэффициент детерминации показывает, что около 98% вариации зависимой  переменной учтено в модели и обусловлено  влиянием включенных факторов.

 

Коэффициент множественной корреляции    R = 0,9882

Он показывает высокую тесноту  связи зависимой переменной Y с  двумя включенными в модель объясняющими факторами.

 

Оценим значимость модели в целом  на основе вычисления F-критерия Фишера.

 

 

По данным дисперсионного анализа  F = 259,798

 

Табличное значение F-критерия  со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений),  k = 4  (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

 

F табл = 2,75871

 

Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.

 

С помощью t-статистики Стьюдента оценим статистическую значимость отдельных  параметров.

По данным дисперсионного анализа:

tb0 = -0,592,   tb1 = 5,367,   tb2 = 0,005,  tb3 = -0,080,   tb4 = 10,928

 

Табличное значение t-статистики Стьюдента  найдем с помощью функции СТЬЮДРАСПОБР()

 

t табл = 2,0595

 

Среди всех коэффициентов значимыми (tb > tтабл) являются  коэффициенты b1 и b4.

По такой модели прогноз сделать  не представляется возможным, поскольку большинство коэффициентов регрессии при переменных не значимы.

 

2. Проведем корреляционный  анализ для исключения незначимых  факторов и устранения мультиколлинеарности.

 

Используем инструмент Excel  «Корреляция» (Сервис – Анализ данных – Корреляция).

 

Таблица 3 - Матрица коэффициентов  парной корреляции

   
           
 

y - цена  
квартиры,  
тыс. долл.

x1 –  общая  
площадь  
квартиры  
(м2)

x2 –  
жилая  
площадь 
квартиры  
(м2)

x3 –  
площадь  
кухни  
(м2)

x4 –  тип дома  
(1 - кирпичный,  
0 - другой)

y - цена  
квартиры,  
тыс. долл.

1

       

x1 – общая  
площадь  
квартиры  
(м2)

0,906620301

1

     

x2 –  
жилая  
площадь 
квартиры  
(м2)

0,84380517

0,972572884

1

   

x3 –  
площадь  
кухни  
(м2)

0,70841664

0,615372581

0,505214415

1

 

x4 – тип дома  
(1 - кирпичный,  
0 - другой)

0,392706276

-0,000451759

-0,097618434

0,387353613

1

           

Анализ матрицы  показывает, что цена квартиры имеет  тесную связь с индексами:

x1 – общая  площадь квартиры (0,907)

     

x2 – жилая  площадь квартиры (0,844)

     

x3 – площадь кухни (0,708)

       
           

Факторы х1 и  х2 тесно связаны между собой (0,97 > 0,8)

   

Т. е. наблюдается  мультиколлинеарность

     

Оставляем в  модели фактор х1 и фактор х3

     
           

После исключения незначимых факторов n = 30, k = 2

   

 

3. Построим линейную модель регрессии только со значимыми факторами.

 

 

 

Из анализа получаем коэффициенты уравнения регрессии а0, а1, а2

 

Уравнение регрессии зависимости  цены квартиры от общей площади квартиры и площади кухни принимает  вид:

 

y = -4,5414 + 0,3445 x1 + 1,1026 x2

 

Это означает, что величина стоимости  квартиры в среднем по совокупности возрастала на 344,5 доллара при увеличении общей площади квартиры на 1 кв. м  и увеличивалась на 1102,6 долларов при увеличении площади кухни  на 1 кв. м.  (Экономическая интерпретация коэффициентов модели).

 

Оценим качество построенной модели.

 

Определим коэффициент детерминации.

 

R2 = 1 - 430,444 / 3040,272  = 2609,827 / 3040,272  = 0,8584192

 

Коэффициент детерминации показывает, что около 86% вариации зависимой  переменной учтено в модели и обусловлено влиянием включенных факторов.

 

Коэффициент множественной корреляции    R = 0,9265

Он показывает высокую тесноту  связи зависимой переменной Y с  двумя включенными в модель объясняющими факторами.

 

Оценим значимость модели в целом  на основе вычисления F-критерия Фишера.

 

По данным дисперсионного анализа F = 81,8519

 

Табличное значение F-критерия  со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений),  k = 2  (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

 

F табл = 3,354

 

Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.

 

Определим среднюю относительную  ошибку аппроксимации 

 

 

 

Она выражается в процентах и характеризует точность модели. Широко применяется критерий, в соответствии с которым точность считается удовлетворительной, если средняя относительная погрешность меньше 15%. Если Eотн.ср. меньше 5%, то говорят, что модель имеет высокую точность. Не рекомендуется применять для анализа и прогноза модели с неудовлетворительной точностью, то есть, когда Eотн.ср. больше 15%.

 

В нашей модели Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.

 

С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.

По данным дисперсионного анализа  ta0 = -1,2799,   ta1 = 8,2461,   ta2 = 2,6368

 

Табличное значение t-статистики Стьюдента  найдем с помощью функции СТЬЮДРАСПОБР()

 

t табл = 2,052

 

Поскольку  ta > tтабл  коэффициенты a1 и a2 является значимыми.

 

Оценим влияние значимых факторов на результат с помощью коэффициентов  эластичности, β- и Δ- коэффициентов.

 

Эластичность Y по отношению к Х определяется как процентное изменение Y, отнесенное к соответствующему процентному изменению Х.

 

 

 

Тогда

Эyx1  = 0,3445 (60,89 / 28,04) = 0,748

 

Следовательно при увеличении общей  площади квартиры на 1% цена квартиры увеличивается на 0,75%

 

Эyx2  = 1,1026 (10,52 / 28,04) = 0,414

 

Следовательно при увеличении площади  кухни на 1% цена квартиры увеличивается на 0,414%

 

Бета-коэффициент показывает, на какую  часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.

 

где Sxj  — среднеквадратическое отклонение фактора j

Тогда

 

byx1  = 0,3445 (22,514 / 10,239) = 0,758

 

byx2  = 1,1026 (2,249 / 10,239) = 0,242

 

 

Долю влияния фактора в суммарном  влиянии всех факторов можно оценить по величине дельта-коэффициентов D (j)

 

где — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной.

 

Dyx1  = 0,907 × 0,758 / 0,8584 = 0,80

 

Dyx2  = 0,708 × 0,242 / 0,8584 = 0,20

 

Значения дельта – коэффициентов  показывают, что доля влияния первого  фактора составила 80%, а второго  – 20%.

(Заметим, что сумма дельта – коэффициентов всегда равна 1. Этот факт можно использовать для проверки правильности произведённых вычислений.)

 

Анализ коэффициентов показывает, что наиболее значимым фактором является х1 – общая площадь квартиры.

 

4. Построим линейную  модель парной регрессии с наиболее значимым фактором.

 

 

 

Из анализа получаем коэффициенты уравнения регрессии а0, а1

 

Уравнение регрессии зависимости  цены квартиры только от общей площади  квартиры принимает вид:

 

y = 2,934 + 0,412 x1

 

Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 412 долларов при увеличении общей площади квартиры на 1 кв. м .

 

Оценим качество построенной модели.

 

Определим коэффициент детерминации.

 

R2 = 1 - 541,288/ 3040,272  = 2498,983 / 3040,272  = 0,82196

 

Коэффициент детерминации показывает, что около 82% вариации зависимой  переменной учтено в модели и обусловлено  влиянием наиболее значимого фактора.

 

Коэффициент множественной корреляции    R = 0,9066

Он показывает высокую тесноту  связи зависимой переменной Y с объясняющим фактором.

Информация о работе Построение и анализ модели множественной регрессии