Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 16:26, курсовая работа
Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость
Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30
Таблица 5. Общая дисперсия, описываемая компонентами
Видно, что уже две главные компонент обеспечат сохранение 79,045% вариации, а три компоненты сохранят 89,326% вариации. Именно эти модели будут рассмотрены далее.
Теперь построим линейный комбинации "старых зависимых переменных" с учетом введенных ограничений.
Component |
Component |
Component | |
1 |
2 |
3 | |
x1 |
0,440659 |
0,106375 |
-0,287694 |
x2 |
0,426043 |
0,247145 |
-0,0474932 |
x3 |
-0,295752 |
0,219947 |
-0,398713 |
x4 |
-0,224834 |
-0,610958 |
0,152787 |
x5 |
0,456913 |
-0,134229 |
-0,177018 |
x6 |
0,430204 |
-0,188722 |
-0,0977092 |
x7 |
0,250783 |
0,126007 |
0,823434 |
x8 |
-0,171901 |
0,660641 |
0,117196 |
Таблица 6. Выбор количества главных компонент
Данная таблица показывает коэффициенты, с которыми старые переменные формируют главные компоненты, т.е. первая главная компонента будет иметь вид
z1=0,440659*x1 + 0,426043*x2 - 0,295752*x3 - 0,224834*x4 + 0,456913*x5 + 0,430204*x6 + 0,250783*x7 - 0,171901*x8.
В окончательном виде таблица главных компонент будет иметь вид:
Component |
Component |
Component | |
Row |
1 |
2 |
3 |
1 |
-2,27679 |
3,68031 |
0,235946 |
2 |
-2,15417 |
2,33293 |
0,202989 |
3 |
-2,95473 |
1,11721 |
-1,10841 |
4 |
-2,28055 |
0,183871 |
-0,343526 |
5 |
-2,06561 |
-0,436449 |
-0,329988 |
6 |
-2,21887 |
-1,54003 |
-0,603141 |
7 |
-2,08166 |
-2,19915 |
-0,0664081 |
8 |
-1,33139 |
-1,85695 |
0,949743 |
9 |
-1,00175 |
-0,870688 |
0,555784 |
10 |
-0,235721 |
-0,874483 |
0,688922 |
11 |
-0,109292 |
-0,788906 |
-0,24333 |
12 |
0,50931 |
-0,505963 |
0,146915 |
13 |
0,811731 |
-0,318189 |
0,394975 |
14 |
1,65221 |
0,212098 |
1,37341 |
15 |
2,3519 |
0,500405 |
1,71137 |
16 |
2,55226 |
0,925675 |
0,758769 |
17 |
2,6691 |
0,335076 |
-0,114435 |
18 |
2,59222 |
-0,0171416 |
-0,863364 |
19 |
2,61816 |
-0,0369514 |
-1,53719 |
20 |
2,95364 |
0,157324 |
-1,80902 |
Таблица 7. Значения главных компонент
Матрица корреляций между главными компонентами будет иметь вид:
z1 |
z2 |
z3 | |
z1 |
0,0000 |
0,0000 | |
z2 |
0,0000 |
0,0000 | |
z3 |
0,0000 |
0,0000 |
Таблица 8. Матрица корреляций главных компонент
Она нулевая, это то к чему мы стремились, чтобы избавить от мультиколлинеарности.
Теперь построим графики зависимостей переменной yi на главные компоненты.
Рассмотрим первую модель построения зависимой переменной yi на три главные компоненты.
Модель примет вид
yCentr = 1,41027 - 0,0856293*z1 + 0,341784*z2 + 0,189784*z3 - 0,204268*z12 - 0,312063*z22
Исследуем модель с помощью тестов Стьюдента и Фишера
Standard |
T |
|||
Parameter |
Estimate |
Error |
Statistic |
P-Value |
CONSTANT |
1,41027 |
0,29437 |
4,7908 |
0,0003 |
z1 |
-0,0856293 |
0,0711602 |
-1,20333 |
0,2488 |
z2 |
0,341784 |
0,12105 |
2,8235 |
0,0135 |
z3 |
0,189784 |
0,166255 |
1,14153 |
0,2728 |
z12 |
-0,204268 |
0,0591221 |
-3,45502 |
0,0039 |
z22 |
-0,312063 |
0,0535119 |
-5,83165 |
0,0000 |
Таблица 9. Тест Стьюдента
R2= 81,8321 percent
R2 (adjusted for d.f.) = 75,3435 percent
Durbin-Watson statistic = 1,86267 (P=0,0450)
Lag 1 residual autocorrelation = 0,05658
Source |
Sum of Squares |
Df |
Mean Square |
F-Ratio |
P-Value |
z1 |
0,744386 |
1 |
0,744386 |
2,73 |
0,1207 |
z2 |
1,53538 |
1 |
1,53538 |
5,63 |
0,0325 |
z3 |
2,57073 |
1 |
2,57073 |
9,43 |
0,0083 |
z12 |
3,06995 |
1 |
3,06995 |
11,26 |
0,0047 |
z22 |
9,27207 |
1 |
9,27207 |
34,01 |
0,0000 |
Model |
17,1925 |
5 |
Таблица 10. Тест Фишера
Видно, что как минимум две переменные z1, z3 не проходят по тесту Стьюдента, а к тому же z1 не удовлетворяет и F-тесту.
Рисунок 2. Окончательный вид модели 1
Рассмотрим вторую модель построения зависимой переменной yi на две главные компоненты.
Модель примет вид
yCentr = 1,54208 + 0,336911*z2 - 0,250149*z12 - 0,27555*z22
Исследуем модель с помощью тестов Стьюдента и Фишера
Standard |
T |
|||
Parameter |
Estimate |
Error |
Statistic |
P-Value |
CONSTANT |
1,54208 |
0,260865 |
5,9114 |
0,0000 |
z2 |
0,336911 |
0,116049 |
2,90317 |
0,0104 |
z12 |
-0,250149 |
0,0476532 |
-5,24936 |
0,0001 |
z22 |
-0,27555 |
0,0446356 |
-6,17333 |
0,0000 |
Таблица 11. Тест Стьюдента
R2= 78,8635 percent
R2 (adjusted for d.f.) = 74,9004 percent
Durbin-Watson statistic = 1,6966 (P=0,0838)
Lag 1 residual autocorrelation = 0,103142
Source |
Sum of Squares |
Df |
Mean Square |
F-Ratio |
P-Value |
z2 |
1,53538 |
1 |
1,53538 |
5,53 |
0,0318 |
z12 |
4,45634 |
1 |
4,45634 |
16,06 |
0,0010 |
z22 |
10,5771 |
1 |
10,5771 |
38,11 |
0,0000 |
Model |
16,5688 |
3 |
Таблица 12. Тест Фишера
Несомненно, что эта модель более "удачна", поскольку с одной стороны все переменные проходят по всем тестам, с другой стороны отличие коэффициента R2 от R2 скорректированного на степени свободы составляет всего 4%, напомним, что в изначальной модели это отличие было около 17%. Таким образом были выполнены обе задачи, поставленные после построения первой модели.(Соответствие тестам и уменьшение различия).
Рисунок 3. Окончательный вид модели 2
Следующим шагом в курсовой работе будет проверка на автокорреляцию. Проверка автокорреляции первого порядка будет осуществляться с помощью критерия Дарбина-Уотсона. Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Значение критерия определяется следующим образом:
далее определяются критические значения критерия Дарбина–Уотсона и для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости α. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1–α) рассматривается на рисунке.
Рисунок 4. Механизм проверки гипотезы о наличии автокорреляции остатков3
Применим критерий к нашей модели соответственно. Значение критерия Дарбина-Уотсона было получено выше и составляет 1,6966.
Теперь определим критические значения критерия для количества наблюдений n=20, числа независимых переменных модели k=2, уровня значимости α=0.05. Из таблицы( см. Приложение 3) определяем dL= 1,10; dU=1,54.
Таким образом интервал принятия гипотезы Н0=[1,10 ; 2,46]. Значение 1,6966 принадлежит заданному интервалу, следовательно нет оснований отклонять гипотезу Н0 , что говорит о том, что автокорреляция остатков первого порядка отсутствует.
Кроме того можно использовать другой тест для проверки модели на автокорреляцию, например, тест Бреуша-Годфри
Тест основан на следующей идее: если имеется корреляция между соседними наблюдениями, то естественно ожидать, что в уравнении
коэффициент p значимо отличается от нуля.
Однако и этот тест дает отрицательные результаты при проверки на автокорреляцию первого порядка. Построенная модель ,описанная выше, будет иметь вид
et = 0,112439*et-1 ,
т.о. коэффициент p существенно не отличается от нуля (P-value=0,6489 при уровне значимости α=0.05). То есть, автокорреляция первого порядка отсутствует.
Однако проверка модели на автокорреляцию второго порядка дает положительный результат, построенная модель имеет вид
et = 0,145051*et-1-0,525978et-2
коэффициент p2 существенно отличается от нуля (P-value=0,333 при уровне значимости α=0,05).
Автокорреляция третьего порядка не обнаружена:
et = 0,160952*et-1-0,443724*et-2-0,
коэффициент p2 существенно не отличается от нуля (P-value=0,9956 при уровне значимости α=0.05).
Вычисленные показатели легко объясняются с экономической точки зрения, поскольку меры предпринимаемые правительством для решения демографической проблемы, а точнее снижения смертности населения, не могут оказывать мгновенного действия на ситуацию. Необходимо, чтобы прошло какое-то время. Автокорреляция второго порядка показывает, что это время составляет 2 года.
Следующей проблемой,
с которой предстоит
Для проверки используем несколько тестов,
первым из которых будет тест Голдфелда-Квандта.
Алгоритм применения теста Голдфелда-Квандта следующий:
1. Выделяется фактор