Автор работы: Пользователь скрыл имя, 29 Января 2015 в 10:43, контрольная работа
Задание:
Для заданного набора данных постройте линейную модель множественной регрессии. Оцените точность и адекватность построенного уравнения регрессии.
Выделите значимые и незначимые факторы в модели. Постройте уравнение регрессии со статистически значимыми факторами. Дайте экономическую интерпретацию параметров модели.
Для полученной модели проверьте выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.
Проверьте полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
Проверьте, адекватно ли предположение об однородности исходных данных в регрессионном смысле. Можно ли объединить две выборки (по первым 12 и остальным наблюдениям) в одну и рассматривать единую модель регрессии Y по Х?
Содержание
По данным, представленным в таблице , изучается зависимость чистой прибыли предприятия (Y, млрд. долл.) от следующих переменных: Х1– оборот капитала, млрд. долл., Х2 – численность служащих, тыс. чел., Х3 – рыночная капитализация компании, млрд. руб.
таблица
№ п/п |
Y |
Х1 |
Х2 |
Х3 |
1 |
0,9 |
31,3 |
43 |
40,9 |
2 |
1,7 |
13,4 |
64,7 |
40,5 |
3 |
0,7 |
4,5 |
24 |
38,9 |
4 |
1,7 |
10 |
50,2 |
38,5 |
5 |
2,6 |
20 |
106 |
37,3 |
6 |
1,3 |
15 |
96,6 |
26,5 |
7 |
4,1 |
137,1 |
347 |
37 |
8 |
1,6 |
17,9 |
85,6 |
36,8 |
9 |
6,9 |
165,4 |
745 |
36,3 |
10 |
0,4 |
2 |
4,1 |
35,3 |
11 |
1,3 |
6,8 |
26,8 |
35,3 |
12 |
1,9 |
27,1 |
42,7 |
35 |
13 |
1,9 |
13,4 |
61,8 |
26,2 |
14 |
1,4 |
9,8 |
212 |
33,1 |
15 |
0,4 |
19,5 |
105 |
32,7 |
16 |
0,8 |
6,8 |
33,5 |
32,1 |
17 |
1,8 |
27 |
142 |
30,5 |
18 |
0,9 |
12,4 |
96 |
29,8 |
19 |
1,1 |
17,7 |
140 |
25,4 |
20 |
1,9 |
12,7 |
59,3 |
29,3 |
21 |
0,9 |
21,4 |
131 |
29,2 |
22 |
1,3 |
13,5 |
70,7 |
29,2 |
23 |
2 |
13,4 |
65,4 |
29,1 |
24 |
0,6 |
4,2 |
23,1 |
27,9 |
25 |
0,7 |
15,5 |
80,8 |
27,2 |
Задание:
Решение
1. Построим линейную модель множественной регрессии.
Рассчитаем с помощью Ms Excel:
Регрессионная статистика | |
Множественный R |
0,9156 |
R-квадрат |
0,8384 |
Нормированный R-квадрат |
0,8153 |
Стандартная ошибка |
0,5818 |
Наблюдения |
25 |
Дисперсионный анализ | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
3 |
36,867 |
12,289 |
36,311 |
1,71E-08 |
Остаток |
21 |
7,1072 |
0,3384 |
||
Итого |
24 |
43,974 |
Коэфф-ты |
Стандарт. ошибка |
t- статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y |
0,0035 |
0,89 |
0,004 |
0,997 |
-1,847 |
1,854 |
Х1 |
0,0154 |
0,008 |
1,94 |
0,066 |
-0,001 |
0,032 |
Х2 |
0,0043 |
0,002 |
2,143 |
0,044 |
0,0001 |
0,0085 |
Х3 |
0,0226 |
0,027 |
0,838 |
0,411 |
-0,033 |
0,0787 |
Уравнение регрессии: y = 0,0035 + 0,0154x1 + 0,0043x2 + 0,0226х3 .
Оценим точность модели.
R2 = 0,8384, что свидетельствует о том, сто изменения зависимой переменной Y (чистой прибыли) в основном (на 83,84 %) можно объяснить изменениями включенных в модель объясняющих переменных – X1, X2, X3. Такое значение свидетельствует об адекватности модели.
Стандартная ошибка параметров (среднеквадратичная ошибка) с учетом округления показывает какое значение данной характеристики сформировалось под воздействием случайных факторов.
Точность модели – ее стандартная ошибка .
Адекватность модели проверим с помощью F-критерия.
Значение F–критерия Фишера составляет 36,31. Значимость F = 1,71Е-08, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.
Наблюдаемое значение F–критерия превышает табличное: 36,31 > 3.07, т.е. выполнено неравенство , а значит уравнение регрессии статистически значимо и отражает существенную зависимость между факторами и результативным показателем. Уравнение можно признать надежным и значимым, доказывающим наличие исследуемой зависимости.
2. Оценим статистическую значимость параметров регрессионной модели.
Критерий Стьюдента (t-статистика). Критическое значение при и равно .
Если t >1.721, то можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин. Значимым являются параметры b1 и b2, величина b3 сформировались под воздействием случайных причин и фактор х3 можно исключить из рассмотрения.
Исключим из модели самый незначимый фактор .
Исключаем фактор Х3 - рыночная капитализация компании (млрд. руб.) Строим новую модель с оставшимися факторами:
Регрессионная статистика | |
Множественный R |
0,912673 |
R-квадрат |
0,832971 |
Нормированный R-квадрат |
0,817787 |
Стандартная ошибка |
0,577809 |
Наблюдения |
25 |
Дисперсионный анализ | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
36,62941 |
18,31471 |
54,85692 |
2,82E-09 |
Остаток |
22 |
7,344989 |
0,333863 |
||
Итого |
24 |
43,9744 |
Коэфф-ты |
Стандарт. ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y |
0,7390 |
0,14702 |
5,02676 |
4,94E-05 |
0,4341 |
1,04393 |
Х1 |
0,0178 |
0,00740 |
2,40392 |
0,02508 |
0,00244 |
0,03314 |
Х2 |
0,0038 |
0,00192 |
2,00185 |
0,05778 |
-0,0001 |
0,00782 |
Получаем уравнение линейной множественной регрессии:
Оценим точность и адекватность модели.
Значение R2 = 0,833 свидетельствует о том, что вариация зависимой переменной Y (чистой прибыли) по-прежнему в основном (на 83,3 %) можно объяснить вариацией включенных в модель объясняющих – X1 и Х2. Это свидетельствует об адекватности модели.
Значение поправленного коэффициента детерминации (0,818) возросло по сравнению с первой моделью, в которую были включены все объясняющие переменные (0,815).
Стандартная ошибка регрессии во втором случае меньше, чем в первом (0.578 < 0,582).
Расчетное значение F–критерия Фишера составляет 54,86. Значимость F = 2,82Е-09, что меньше 0.05. Таким образом, полученное уравнение в целом значимо.
Критическое значение при и равно .
Значимыми являются оба параметра b1 и b2 т. к. t > 1.717.
Рассмотрим теперь экономическую интерпретацию параметров модели.
Коэффициент b1 = 0,0178, означает, что при увеличении только оборота капитала (X1) на 1 млрд. долл. чистая прибыль предприятия в среднем возрастет на 0,0178 млрд. долл. А при увеличении только численности служащих (X2) на 1 тыс. чел. чистая прибыль предприятия в среднем возрастет на 0,0038 млрд. долл.
3. Применим тест Голдфельда-Квандта по переменной
Алгоритм применения теста Голдфельда-Квандта:
Разделим выборку на 3 части, исключив центральную:
Y |
Х1 |
Х2 |
Y |
Х1 |
Х2 | |
0,4 |
2 |
4,1 |
1,3 |
15 |
96,6 | |
0,6 |
4,2 |
23,1 |
0,4 |
19,5 |
105 | |
0,7 |
4,5 |
24 |
2,6 |
20 |
106 | |
1,3 |
6,8 |
26,8 |
0,9 |
21,4 |
131 | |
0,8 |
6,8 |
33,5 |
1,1 |
17,7 |
140 | |
1,9 |
27,1 |
42,7 |
1,8 |
27 |
142 | |
0,9 |
31,3 |
43 |
1,4 |
9,8 |
212 | |
1,7 |
10 |
50,2 |
4,1 |
137,1 |
347 | |
- |
- |
- |
6,9 |
165,4 |
745 |
По первой выборке получаем:
Дисперсионный анализ | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
1,193738 |
0,596869 |
3,53172 |
0,110598 |
Остаток |
5 |
0,845012 |
0,169002 |
||
Итого |
7 |
2,03875 |