Зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей

Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 16:26, курсовая работа

Краткое описание

Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость

Содержание

Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30

Прикрепленные файлы: 1 файл

Текст курсовой.docx

— 836.98 Кб (Скачать документ)

Оглавление

Введение. 7

Построение эконометрической модели. 8

Поиск и обработка исходных данных. 8

Исследование зависимости между факторами и результирующим признаком. 10

Мультиколлинеарность. 12

Метод главных компонент. 15

Автокорреляция. 20

Исследование на гетероскедастичность. 23

Прогнозирование с помощью построенной модели. 28

Заключение. 29

Список литературы 30

Приложения. 31

 

 

Введение.

 

Тема  работы: проанализировать зависимость  смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В  качестве таких показателей были взяты: валовой  внутренний продукт, численность экономически активного  населения, миграционный прирост, численность  безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в  атмосферу.

Задачи: выявить факторы, которые оказывают  наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость.

 

Построение эконометрической модели.

Поиск и обработка исходных данных.

 

Для построения эконометрической модели зависимости  смертности населения от макроэкономических факторов, необходимо в первую очередь  отобрать те факторы, которые наиболее полно отражают картину. В работе были выбраны следующие факторы:

  1. ВВП страны.
  2. Численность экономически активного населения.

Большое количество экономически активного  населения в стране свидетельствует о стабильном уровне развития экономики, что в свою очередь обеспечивает хороший уровень жизни населения и ведет к уменьшению смертности.

  1. Миграционный прирост из стран СНГ и дальнего зарубежья.

Увеличение  миграционного прироста ведет к  увеличению населения с одной  стороны, и увеличению относительного уровня смертности с другой. Приезжие из стран СНГ, в большинстве случаев, имеют плохой уровень жизни или находятся за чертой бедности, что позволяет говорить о том, что смертность среди данной категории населения довольно высока.

  1. Количество безработных.
  2. Общая площадь жилых помещений.
  3. Численность врачей.

Численность врачей помогает оценить насколько  хорошо население обеспечено медицинскими услугами, что несомненно ведет к  уменьшению смертности населения, поскольку  позволяет снизить смертность от болезней, которые могут быть излечены при своевременном вмешательстве  медицинского персонала.

  1. Число зарегистрированных преступлений.

Число преступлений указывает не только на смертность населения (гибель людей при особо тяжких преступлениях(убийство, разбой и т.д.), но и позволяет дополнительно говорить об уровне жизни населения, т.е. чем выше уровень жизни, тем меньше зарегистрированных преступлений.

  1. Выбросы загрязняющие атмосферу.

Этот  показатель также влияет на смертность населения. Количество вредных выбросов в атмосферу ведет к увеличению заболеваний, связанных с дыхательными путями, что в свою очередь ведет к увеличению смертности. Количество выбросов говорит и о техническом уровне развития страны, поскольку современные технологии позволяют не загрязнять атмосферу.

 

Как только данные показатели были отобраны необходимо объединить их в нижеследующую  таблицу для дальнейшего анализа. Следует отметить, что данные, которые  были описаны выше представлены в  абсолютных величинах, что составляет изрядное неудобство или вообще невозможность  построения адекватной эконометрической модели, поскольку абсолютные значения некоторых показателей могут  отличаться друг от друга в тысячи или даже десятки тысяч раз, поэтому  в таблице представлены не абсолютные, а относительные факторы (начальный вариант данных представлен в Приложении 1)1.

 

На этом обработка  исходных данных заканчивается и  можно переходить к следующему этапу  моделирования.

 

Исследование зависимости  между факторами и результирующим признаком.

 

Перейдем  к изучению влияния данных факторов на исследуемый признак. Сначала построим модель

yt=a0+a1x1+a2x2+a3x3+a4x4+a5x5+a6x6+a7x7+a8x8, где  y- смертность населения, x1,2...,8 - факторы

Коэффициенты  a1,..,a8 будем искать методом наименьших квадратов. Модель будет иметь вид:

yt =-19,1922 - 0,528081*x1 + 0,0581601*x2 + 0,26937*x3 - 0,0821491*x4 + 0,20563*x5 + 3,53077*x6 + 0,0585942*x7 - 0,424382*x8

исследуем характеристики качества данной модели,

R2 = 75,8731

R2 (adjusted for d.f.) = 58,3263

Столь большое различие между обычным  показателем R2 и показателем R2 , скорректированным относительно количества степеней свободны наглядно демонстрирует тот факт, что модель перегружена факторами, в дальнейшей постараемся уменьшить эту разницу.

Теперь проанализируем коэффициенты модели с помощью тестов Стьюдента  и Фишера и оценим их значимость:

   

Standard

T

 

Parameter

Estimate

Error

Statistic

P-Value

CONSTANT

-19,1922

22,6271

-0,848198

0,4144

x1

-0,528081

0,195078

-2,70703

0,0204

x2

0,0581601

0,0340341

1,70887

0,1155

x3

0,26937

0,221115

1,21824

0,2486

x4

-0,0821491

0,042115

-1,95059

0,0770

x5

0,20563

1,26387

0,162699

0,8737

x6

3,53077

3,54875

0,994933

0,3412

x7

0,0585942

0,0741049

0,790693

0,4458

x8

-0,424382

0,356783

-1,18947

0,2593


Таблица 2. Тест Стьюдента

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

x1

0,0873399

1

0,0873399

0,19

0,6731

x2

1,58148

1

1,58148

3,40

0,0923

x3

1,49607

1

1,49607

3,22

0,1004

x4

0,112198

1

0,112198

0,24

0,6330

x5

11,3186

1

11,3186

24,33

0,0004

x6

0,482119

1

0,482119

1,04

0,3305

x7

0,353961

1

0,353961

0,76

0,4017

x8

0,658083

1

0,658083

1,41

0,2593

Model

16,0899

8

     

Таблица 3. Тест Фишера

 

Значение графы P-Value > 0,05 говорит о том, что коэффициенты в модели являются незначимыми, с точки зрения 95% доверительного уровня.

Однако общий коэффициент R2=75,8731, можно характеризовать как достаточно хороший при построении модели на макроэкономических факторах, и его можно расценивать как показатель того, что данная модель может быть построена.

На текущий момент модель не проходит не по одному из критериев, что может  быть связано с тем, что показатели должны быть взяты нелинейно, поэтому исследуем графическую зависимость факторов и признака.

 

Мультиколлинеарность.

 

Мультиколлинеарность -  тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат. Эта связь затрудняет оценивание параметров регрессии. Проверим нашу модель на мультиколлинеарность, для этого рассмотрим матрицу парных корреляций

 

x1

x2

x3

x4

x5

x6

x7

x8

x1

 

0,9074

-0,3804

-0,5588

0,9234

0,8295

0,3649

-0,2398

x2

0,9074

 

-0,4832

-0,6795

0,8192

0,6727

0,4800

-0,0333

x3

-0,3804

-0,4832

 

0,0630

-0,5759

-0,5457

-0,3275

0,3686

x4

-0,5588

-0,6795

0,0630

 

-0,3281

-0,2488

-0,2602

-0,5393

x5

0,9234

0,8192

-0,5759

-0,3281

 

0,9416

0,3787

-0,5402

x6

0,8295

0,6727

-0,5457

-0,2488

0,9416

 

0,4138

-0,5604

x7

0,3649

0,4800

-0,3275

-0,2602

0,3787

0,4138

 

-0,0150

x8

-0,2398

-0,0333

0,3686

-0,5393

-0,5402

-0,5604

-0,0150

 

Таблица 4. Матрица корреляций

Матрица демонстрирует факт того, что в модели ярко выражена мультиколлинеарность, поскольку между факторами присутствует тесная корреляционная связь. Для более  наглядного изображения рассмотрим графики зависимостей между некоторыми отдельными факторами, корреляция между которыми наиболее очевидна.

 

 

 

Более общую картину можно увидеть  на следующем рисунке, иллюстрирующем корреляции между факторами:

Рисунок 1. Иллюстрация зависимостей между факторами

 

Метод главных компонент.

 

Как уже было сказано выше мультиколлинеарность не позволяет "адекватно" оценивать  коэффициенты модели, поэтому она  подлежит обязательному устранению. Существует много способов борьбы с  мультиколлинеарностью, однако в данной работы мы применим метод главных  компонент, поскольку он является одним  из основных методов, позволяющих уменьшить размерность данных, потеряв наименьшее количество информации.

Основная идея метода главных компонент  состоит в замене объясняющих  переменный xi, i=1,2,..,n на новые переменные zj, j=1,1,2,...,k, которые с одной стороны свободны от недостатков, вызванных корреляционной зависимостью, а с другой содержат в себе максимально возможную долю информации "старых" переменных xi.

Главные компоненты формируются как  линейные комбинации "старых центрированных переменных" с учетом введения для  них двух следующих принципиальных ограничений.

1.Полная совокупность главных  компонент должны содержать в  себе всю изменчивость переменных  xi, i=1,2,..,n.

2.Главные компоненты должны  быть ортогональны между собой,  т.е. для любой пары компонент  j и r, j≠r должно выполняться соотношение

 2

Теперь используем метод главных  компонент в нашем случае. Сначала  центрируем наши объясняющие переменные и зависимый фактор(см. Приложение 3). После чего рассмотрим какое количество главных компонент необходимо для  того чтобы, с одной стороны сохранить  максимально возможное количество информации, а с другой не перегружать  модель лишними факторами .Поможет  нам в этом следующая таблица 

Component

 

Percent of

Cumulative

Number

Eigenvalue

Variance

Percentage

1

4,48625

56,078

56,078

2

1,83733

22,967

79,045

3

0,822506

10,281

89,326

4

0,577707

7,221

96,547

5

0,166478

2,081

98,628

6

0,0843817

1,055

99,683

7

0,0221202

0,277

99,960

8

0,00322916

0,040

100,000

Информация о работе Зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей