Автор работы: Пользователь скрыл имя, 22 Января 2014 в 19:35, контрольная работа
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
Задача 1. Построение и анализ модель множественной регрессии
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.
4. Построитьипроанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.
5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости a = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).
6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).
Примечание. Выполнение задач отразить в аналитической записке, приложить компьютерные распечатки расчетов.
По территориям Сибирского федерального округа имеются данные за 20XX г. о значениях экономических показателей:
y – инвестиции в экономику, млрд. руб.,
x1– среднегодовая численность занятых в экономике, млн. чел.,
x2 – валовой региональный продукт, млрд. руб.,
x3 – инвестиции прошлого года в экономику, млрд. руб.
Субъекты РФ |
y |
x1 |
x2 |
x3 |
Республика Алтай |
0,8 |
0,081 |
2,6 |
0,26 |
Республика Бурятия |
3,1 |
0,396 |
18,1 |
2,64 |
Республика Тыва |
0,3 |
0,103 |
2,6 |
0,28 |
Республика Хакасия |
1,9 |
0,234 |
14,3 |
1,78 |
Алтайский край |
6,7 |
1,108 |
34,8 |
5,13 |
Красноярский край |
24,0 |
1,401 |
129,5 |
12,43 |
Иркутская обл. |
11,4 |
1,138 |
85,9 |
8,62 |
Кемеровская обл. |
16,4 |
1,236 |
69,0 |
11,74 |
Новосибирская обл. |
9,4 |
1,122 |
58,3 |
6,05 |
Омская обл. |
4,8 |
0,968 |
40,6 |
4,54 |
Томская обл. |
8,6 |
0,456 |
31,2 |
5,84 |
Читинская обл. |
5,7 |
0,440 |
22,2 |
3,19 |
Решение:
Коэффициенты уравнения множественной регрессии оцениваются, как и коэффициенты парной регрессии, методом наименьших квадратов (МНК). Классический подход к оцениванию коэффициентов уравнения регрессии основан на методе наименьших квадратов (МНК).
Система нормальных уравнений VYRимеет вид:
Sy = ma0 + а1Sx1 + а2Sx2 + а3Sx3
Syx1 = a0Sx1 + а1S(x1)2 + а2Sx1*х2 + а3S х1*x3
Syx2 = a0Sx2 + а1Sx1*х2 + а2S (х2)2 + а3S х2*x3
Syx3 = a0Sx3 + а1Sx1*х3 + а2Sх2*х3 + а3S (х3)2
Величины Sy, Sx1, Syx1, S(x1)2, Sx2, Syx2, S(x2)2, Syх1*x2, Sx3, Syx3, S(x3)2,Sx1*х3, Sx2*х3находятся непосредственно
по данным производственных измерений,
которые заданы в таблице промежуточных
вычислений.
t |
х1 |
х2 |
х3 |
у |
ух1 |
ух2 |
ух3 |
х1х2 |
х1х3 |
х2х3 |
(х1)2 |
(х2)2 |
(х3)2 |
Республика Алтай |
0,081 |
2,6 |
0,26 |
0,8 |
0,0648 |
2,08 |
0,208 |
0,2106 |
0,02106 |
0,676 |
0,00656 |
6,76 |
0,0676 |
Республика Бурятия |
0,396 |
18,1 |
2,64 |
3,1 |
1,2276 |
56,11 |
8,184 |
7,1676 |
1,04544 |
47,784 |
0,15682 |
327,61 |
6,9696 |
Республика Тыва |
0,103 |
2,6 |
0,28 |
0,3 |
0,0309 |
0,78 |
0,084 |
0,2678 |
0,02884 |
0,728 |
0,01061 |
6,76 |
0,0784 |
Республика Хакасия |
0,234 |
14,3 |
1,78 |
1,9 |
0,4446 |
27,17 |
3,382 |
3,3462 |
0,41652 |
25,454 |
0,05476 |
204,49 |
3,1684 |
Алтайский край |
1,108 |
34,8 |
5,13 |
6,7 |
7,4236 |
233,16 |
34,371 |
38,5584 |
5,68404 |
178,524 |
1,22766 |
1211,04 |
26,3169 |
Красноярский край |
1,401 |
129,5 |
12,43 |
24 |
33,624 |
3108 |
298,32 |
181,43 |
17,4144 |
1609,69 |
1,9628 |
16770,3 |
154,505 |
Иркутская обл. |
1,138 |
85,9 |
8,62 |
11,4 |
12,9732 |
979,26 |
98,268 |
97,7542 |
9,80956 |
740,458 |
1,29504 |
7378,81 |
74,3044 |
Кемеровская обл. |
1,236 |
69 |
11,74 |
16,4 |
20,2704 |
1131,6 |
192,536 |
85,284 |
14,5106 |
810,06 |
1,5277 |
4761 |
137,828 |
Новосибирская обл. |
1,122 |
58,3 |
6,05 |
9,4 |
10,5468 |
548,02 |
56,87 |
65,4126 |
6,7881 |
352,715 |
1,25888 |
3398,89 |
36,6025 |
Омская обл. |
0,968 |
40,6 |
4,54 |
4,8 |
4,6464 |
194,88 |
21,792 |
39,3008 |
4,39472 |
184,324 |
0,93702 |
1648,36 |
20,6116 |
Томская обл. |
0,456 |
31,2 |
5,84 |
8,6 |
3,9216 |
268,32 |
50,224 |
14,2272 |
2,66304 |
182,208 |
0,20794 |
973,44 |
34,1056 |
Читинская обл. |
0,44 |
22,2 |
3,19 |
5,7 |
2,508 |
126,54 |
18,183 |
9,768 |
1,4036 |
70,818 |
0,1936 |
492,84 |
10,1761 |
ИТОГО |
8,683 |
509,1 |
62,5 |
93,1 |
97,6819 |
6675,92 |
782,422 |
542,727 |
64,18 |
4203,43 |
8,83939 |
37180,3 |
504,734 |
Для исходной задачи система нормальных уравнений примет вид:
93,1 = 12 * а0 + 8,683 * а1 + 509,1 * а2 + 62,5*а3
97,6819= 8,683 * а0 + 8,83939 * а1 + 542,727 * а2 + 64,18 * а3
6675,92 = 509,1 * а0 + 542,727 * а1 + 37180,3 * а2 + 4203,43 * а3
782,422 = 62,5 * а0 + 64,18 * а1 + 4203,43 * а2 + 504,734 * а3
Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия» (рис 1).
Задав соответствующие диапазоны данных в окне,
получим набор таблиц А, Б, В.
Таблица А – регрессионный анализ
Множественный R |
0,982883 |
Множественный коэффициент корреляции R |
R-квадрат |
0,966059 |
Коэффициент координации R |
Нормированный R-квадрат |
0,953331 |
|
Стандартная ошибка |
1,498558 |
Стандартная ошибка определения R |
Наблюдения |
12 |
Число наблюдений |
Таблица Б – дисперсионный анализ
Число степеней свободы |
дисперсия |
Дисперсия на 1 степень свободы |
Статистика Фишера |
||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
3 |
511,3438 |
170,4479 |
75,90049 |
3,22E-06 |
Остаток |
8 |
17,96541 |
2,245676 |
||
Итого |
11 |
529,3092 |
Таблица В
Коэффициенты уравнения регрессии |
Стандартная ошибка определения коэффициентов |
t-статистика |
Вероятность ошибки |
Нижние 95%-пределы |
Верхние 95%-пределы | |
Коэффициенты |
Стандартная ошибка |
P-Значение |
Нижние 95% |
Верхние 95% | ||
Y-пересечение |
-0,0131 |
0,829506 |
-0,01579 |
0,987785 |
-1,92595 |
1,899743 |
X1 |
-3,71269 |
2,113172 |
-1,75693 |
0,116993 |
-8,58568 |
1,160292 |
X2 |
0,087542 |
0,033895 |
2,582735 |
0,032478 |
0,00938 |
0,165705 |
Х3 |
1,294828 |
0,331211 |
3,909372 |
0,004485 |
0,531053 |
2,058602 |
Из таблицы В следует, что уравнение регрессии имеет вид:
У = -0,0131 –3,71269*х1 + 0,087542*х2+1,294828*х3
Выполнен экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
Коэффициент детерминации (индекс детерминации) можно определить из табл. А:
R2ух1,х2,…. = 0,966059
Очевидно, что связь между факторами (х1, х2, х3) и результатом (У) прямая и сильная. Величина R2= 0,966059 показывает долю изменения (вариации) результативного признака под действием факторного признака. Т.е. доля изменения (вариации) результативного признака под воздействием факторного признака равна 96,61 %
Коэффициент множественной корреляции (индекс корреляции) можно определить из табл. А:
Rух1,х2,…. =
Проверка значимости уравнения регрессии основана на использовании F-критерии Фишера. Фактическое значение критерия берется из таблицы Б, т. е.
Fфакт = 75,90049
Табличные зачения составляют
F(0,05)=3,443357 F(0,01)= 5,71902.
Откуда следует,
что уравнение регрессии
Оценим значимость отдельных параметров построенной модели. Из таблицы 1 видно, что на уровне значимости α = 0,05 все включенные в модель факторы являются значимыми: Р – значение< 0,05.
Коэффициенты уравнения регрессии |
Стандартная ошибка определения коэффициентов |
t-статистика | |
Коэффициенты |
Стандартная ошибка | ||
Y-пересечение |
-0,0131 |
0,829506 |
-0,01579 |
X1 |
-3,71269 |
2,113172 |
-1,75693 |
X2 |
0,087542 |
0,033895 |
2,582735 |
Х3 |
1,294828 |
0,331211 |
3,909372 |
Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:
Коэффициенты уравнения регрессии |
Нижние 95%-пределы |
Верхние 95%-пределы | |
Y-пересечение |
-0,0131 |
-1,92595 |
1,899743 |
X1 |
-3,71269 |
-8,58568 |
1,160292 |
X2 |
0,087542 |
0,00938 |
0,165705 |
Х3 |
1,294828 |
0,531053 |
2,058602 |
2. Проанализирована матрица парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
Построим корреляционную матрицу, используя функцию «Сервис. Анализ данных.Корреляция» табличного процессора MS Excel.
у |
х1 |
х2 |
х3 | |
у |
1 |
|||
х1 |
0,824132 |
1 |
||
х2 |
0,949267 |
0,873559 |
1 |
|
х3 |
0,96602 |
0,885602 |
0,928676 |
1 |
Из матрицы следует, что наблюдается некоторая коллинеарность между факторами x2 и x3 (так как r x2x3 = 0,928676) и факторами х1 и х3 (r x1x3 = 0,885602). Таким образом, далее будет строиться регрессия y на факторы x2, х3.
3. Построена линейная модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2).
Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия» (рис 3).
Задав соответствующие диапазоны данных в окне,
получим набор таблиц А, Б, В.
Таблица А – регрессионный анализ
Множественный R |
0,976198 |
Множественный коэффициент корреляции R |
R-квадрат |
0,952963 |
Коэффициент координации R |
Нормированный R-квадрат |
0,94251 |
|
Стандартная ошибка |
1,663242 |
Стандартная ошибка определения R |
Наблюдения |
12 |
Число наблюдений |
Таблица Б – дисперсионный анализ
Число степеней свободы |
дисперсия |
Дисперсия на 1 степень свободы |
Статистика Фишера |
||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
504,4118 |
252,2059 |
91,16845 |
1,06E-06 |
Остаток |
9 |
24,89735 |
2,766373 |
||
Итого |
11 |
529,3092 |
Информация о работе Построение и анализ модель множественной регрессии