Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 16:26, курсовая работа
Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость
Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30
Оглавление
Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30
Приложения. 31
Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость.
Для построения эконометрической модели зависимости смертности населения от макроэкономических факторов, необходимо в первую очередь отобрать те факторы, которые наиболее полно отражают картину. В работе были выбраны следующие факторы:
Большое количество экономически активного населения в стране свидетельствует о стабильном уровне развития экономики, что в свою очередь обеспечивает хороший уровень жизни населения и ведет к уменьшению смертности.
Увеличение миграционного прироста ведет к увеличению населения с одной стороны, и увеличению относительного уровня смертности с другой. Приезжие из стран СНГ, в большинстве случаев, имеют плохой уровень жизни или находятся за чертой бедности, что позволяет говорить о том, что смертность среди данной категории населения довольно высока.
Численность
врачей помогает оценить насколько
хорошо население обеспечено медицинскими
услугами, что несомненно ведет к
уменьшению смертности населения, поскольку
позволяет снизить смертность от
болезней, которые могут быть излечены
при своевременном
Число преступлений указывает не только на смертность населения (гибель людей при особо тяжких преступлениях(убийство, разбой и т.д.), но и позволяет дополнительно говорить об уровне жизни населения, т.е. чем выше уровень жизни, тем меньше зарегистрированных преступлений.
Этот показатель также влияет на смертность населения. Количество вредных выбросов в атмосферу ведет к увеличению заболеваний, связанных с дыхательными путями, что в свою очередь ведет к увеличению смертности. Количество выбросов говорит и о техническом уровне развития страны, поскольку современные технологии позволяют не загрязнять атмосферу.
Как
только данные показатели были отобраны
необходимо объединить их в нижеследующую
таблицу для дальнейшего
На этом обработка исходных данных заканчивается и можно переходить к следующему этапу моделирования.
Перейдем к изучению влияния данных факторов на исследуемый признак. Сначала построим модель
yt=a0+a1x1+a2x2+a3x3+a4x4+a5x5
Коэффициенты a1,..,a8 будем искать методом наименьших квадратов. Модель будет иметь вид:
yt =-19,1922 - 0,528081*x1 + 0,0581601*x2 + 0,26937*x3 - 0,0821491*x4 + 0,20563*x5 + 3,53077*x6 + 0,0585942*x7 - 0,424382*x8
исследуем характеристики качества данной модели,
R2 = 75,8731
R2 (adjusted for d.f.) = 58,3263
Столь большое различие между обычным показателем R2 и показателем R2 , скорректированным относительно количества степеней свободны наглядно демонстрирует тот факт, что модель перегружена факторами, в дальнейшей постараемся уменьшить эту разницу.
Теперь проанализируем коэффициенты модели с помощью тестов Стьюдента и Фишера и оценим их значимость:
Standard |
T |
|||
Parameter |
Estimate |
Error |
Statistic |
P-Value |
CONSTANT |
-19,1922 |
22,6271 |
-0,848198 |
0,4144 |
x1 |
-0,528081 |
0,195078 |
-2,70703 |
0,0204 |
x2 |
0,0581601 |
0,0340341 |
1,70887 |
0,1155 |
x3 |
0,26937 |
0,221115 |
1,21824 |
0,2486 |
x4 |
-0,0821491 |
0,042115 |
-1,95059 |
0,0770 |
x5 |
0,20563 |
1,26387 |
0,162699 |
0,8737 |
x6 |
3,53077 |
3,54875 |
0,994933 |
0,3412 |
x7 |
0,0585942 |
0,0741049 |
0,790693 |
0,4458 |
x8 |
-0,424382 |
0,356783 |
-1,18947 |
0,2593 |
Таблица 2. Тест Стьюдента
Source |
Sum of Squares |
Df |
Mean Square |
F-Ratio |
P-Value |
x1 |
0,0873399 |
1 |
0,0873399 |
0,19 |
0,6731 |
x2 |
1,58148 |
1 |
1,58148 |
3,40 |
0,0923 |
x3 |
1,49607 |
1 |
1,49607 |
3,22 |
0,1004 |
x4 |
0,112198 |
1 |
0,112198 |
0,24 |
0,6330 |
x5 |
11,3186 |
1 |
11,3186 |
24,33 |
0,0004 |
x6 |
0,482119 |
1 |
0,482119 |
1,04 |
0,3305 |
x7 |
0,353961 |
1 |
0,353961 |
0,76 |
0,4017 |
x8 |
0,658083 |
1 |
0,658083 |
1,41 |
0,2593 |
Model |
16,0899 |
8 |
Таблица 3. Тест Фишера
Значение графы P-Value > 0,05 говорит о том, что коэффициенты в модели являются незначимыми, с точки зрения 95% доверительного уровня.
Однако общий коэффициент R2=
На текущий момент модель не проходит не по одному из критериев, что может быть связано с тем, что показатели должны быть взяты нелинейно, поэтому исследуем графическую зависимость факторов и признака.
Мультиколлинеарность - тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат. Эта связь затрудняет оценивание параметров регрессии. Проверим нашу модель на мультиколлинеарность, для этого рассмотрим матрицу парных корреляций
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 | |
x1 |
0,9074 |
-0,3804 |
-0,5588 |
0,9234 |
0,8295 |
0,3649 |
-0,2398 | |
x2 |
0,9074 |
-0,4832 |
-0,6795 |
0,8192 |
0,6727 |
0,4800 |
-0,0333 | |
x3 |
-0,3804 |
-0,4832 |
0,0630 |
-0,5759 |
-0,5457 |
-0,3275 |
0,3686 | |
x4 |
-0,5588 |
-0,6795 |
0,0630 |
-0,3281 |
-0,2488 |
-0,2602 |
-0,5393 | |
x5 |
0,9234 |
0,8192 |
-0,5759 |
-0,3281 |
0,9416 |
0,3787 |
-0,5402 | |
x6 |
0,8295 |
0,6727 |
-0,5457 |
-0,2488 |
0,9416 |
0,4138 |
-0,5604 | |
x7 |
0,3649 |
0,4800 |
-0,3275 |
-0,2602 |
0,3787 |
0,4138 |
-0,0150 | |
x8 |
-0,2398 |
-0,0333 |
0,3686 |
-0,5393 |
-0,5402 |
-0,5604 |
-0,0150 |
Таблица 4. Матрица корреляций
Матрица демонстрирует факт того,
что в модели ярко выражена мультиколлинеарность,
поскольку между факторами
Более общую картину можно увидеть на следующем рисунке, иллюстрирующем корреляции между факторами:
Рисунок 1. Иллюстрация зависимостей между факторами
Как уже было сказано выше мультиколлинеарность не позволяет "адекватно" оценивать коэффициенты модели, поэтому она подлежит обязательному устранению. Существует много способов борьбы с мультиколлинеарностью, однако в данной работы мы применим метод главных компонент, поскольку он является одним из основных методов, позволяющих уменьшить размерность данных, потеряв наименьшее количество информации.
Основная идея метода главных компонент состоит в замене объясняющих переменный xi, i=1,2,..,n на новые переменные zj, j=1,1,2,...,k, которые с одной стороны свободны от недостатков, вызванных корреляционной зависимостью, а с другой содержат в себе максимально возможную долю информации "старых" переменных xi.
Главные компоненты формируются как линейные комбинации "старых центрированных переменных" с учетом введения для них двух следующих принципиальных ограничений.
1.Полная совокупность главных
компонент должны содержать в
себе всю изменчивость
2.Главные компоненты должны
быть ортогональны между собой,
2
Теперь используем метод главных
компонент в нашем случае. Сначала
центрируем наши объясняющие переменные
и зависимый фактор(см. Приложение
3). После чего рассмотрим какое количество
главных компонент необходимо для
того чтобы, с одной стороны сохранить
максимально возможное
Component |
Percent of |
Cumulative | |
Number |
Eigenvalue |
Variance |
Percentage |
1 |
4,48625 |
56,078 |
56,078 |
2 |
1,83733 |
22,967 |
79,045 |
3 |
0,822506 |
10,281 |
89,326 |
4 |
0,577707 |
7,221 |
96,547 |
5 |
0,166478 |
2,081 |
98,628 |
6 |
0,0843817 |
1,055 |
99,683 |
7 |
0,0221202 |
0,277 |
99,960 |
8 |
0,00322916 |
0,040 |
100,000 |