Зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей

Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 16:26, курсовая работа

Краткое описание

Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость

Содержание

Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30

Прикрепленные файлы: 1 файл

Текст курсовой.docx

— 836.98 Кб (Скачать документ)

Таблица 5. Общая дисперсия, описываемая компонентами

Видно, что уже две главные  компонент обеспечат сохранение 79,045% вариации, а три компоненты сохранят 89,326% вариации. Именно эти модели будут  рассмотрены далее.

 

 

Теперь построим линейный комбинации "старых зависимых переменных" с учетом введенных ограничений.

 

Component

Component

Component

 

1

2

3

x1

0,440659

0,106375

-0,287694

x2

0,426043

0,247145

-0,0474932

x3

-0,295752

0,219947

-0,398713

x4

-0,224834

-0,610958

0,152787

x5

0,456913

-0,134229

-0,177018

x6

0,430204

-0,188722

-0,0977092

x7

0,250783

0,126007

0,823434

x8

-0,171901

0,660641

0,117196


Таблица 6. Выбор количества главных компонент

Данная таблица показывает коэффициенты, с которыми старые переменные формируют  главные компоненты, т.е. первая главная  компонента будет иметь вид 

z1=0,440659*x1 + 0,426043*x2 - 0,295752*x3 - 0,224834*x4 + 0,456913*x5 + 0,430204*x6 + 0,250783*x7 - 0,171901*x8.

В окончательном виде таблица главных  компонент будет иметь вид:

 

Component

Component

Component

Row

1

2

3

1

-2,27679

3,68031

0,235946

2

-2,15417

2,33293

0,202989

3

-2,95473

1,11721

-1,10841

4

-2,28055

0,183871

-0,343526

5

-2,06561

-0,436449

-0,329988

6

-2,21887

-1,54003

-0,603141

7

-2,08166

-2,19915

-0,0664081

8

-1,33139

-1,85695

0,949743

9

-1,00175

-0,870688

0,555784

10

-0,235721

-0,874483

0,688922

11

-0,109292

-0,788906

-0,24333

12

0,50931

-0,505963

0,146915

13

0,811731

-0,318189

0,394975

14

1,65221

0,212098

1,37341

15

2,3519

0,500405

1,71137

16

2,55226

0,925675

0,758769

17

2,6691

0,335076

-0,114435

18

2,59222

-0,0171416

-0,863364

19

2,61816

-0,0369514

-1,53719

20

2,95364

0,157324

-1,80902


Таблица 7. Значения главных компонент

Матрица корреляций между главными компонентами будет иметь вид:

 

z1

z2

z3

z1

 

0,0000

0,0000

z2

0,0000

 

0,0000

z3

0,0000

0,0000

 

Таблица 8. Матрица корреляций главных компонент

Она нулевая, это то к чему мы стремились, чтобы избавить от мультиколлинеарности.

 

Теперь построим графики  зависимостей переменной yi на главные компоненты.

 

Рассмотрим первую модель построения зависимой переменной yi на три главные компоненты.

Модель примет вид 

yCentr = 1,41027 - 0,0856293*z1 + 0,341784*z2 + 0,189784*z3 - 0,204268*z12 - 0,312063*z22

Исследуем  модель с помощью  тестов Стьюдента и Фишера

   

Standard

T

 

Parameter

Estimate

Error

Statistic

P-Value

CONSTANT

1,41027

0,29437

4,7908

0,0003

z1

-0,0856293

0,0711602

-1,20333

0,2488

z2

0,341784

0,12105

2,8235

0,0135

z3

0,189784

0,166255

1,14153

0,2728

z12

-0,204268

0,0591221

-3,45502

0,0039

z22

-0,312063

0,0535119

-5,83165

0,0000


Таблица 9. Тест Стьюдента

R2= 81,8321 percent

R2 (adjusted for d.f.) = 75,3435 percent

Durbin-Watson statistic = 1,86267 (P=0,0450)

Lag 1 residual autocorrelation = 0,05658

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

z1

0,744386

1

0,744386

2,73

0,1207

z2

1,53538

1

1,53538

5,63

0,0325

z3

2,57073

1

2,57073

9,43

0,0083

z12

3,06995

1

3,06995

11,26

0,0047

z22

9,27207

1

9,27207

34,01

0,0000

Model

17,1925

5

     

Таблица 10. Тест Фишера

Видно, что как минимум две  переменные z1, z3 не проходят по тесту Стьюдента, а к тому же z1 не удовлетворяет и F-тесту.

Рисунок 2. Окончательный вид модели 1 

Рассмотрим вторую модель построения зависимой переменной yi на две главные компоненты.

Модель примет вид 

yCentr = 1,54208 + 0,336911*z2 - 0,250149*z12 - 0,27555*z22

Исследуем  модель с помощью  тестов Стьюдента и Фишера

   

Standard

T

 

Parameter

Estimate

Error

Statistic

P-Value

CONSTANT

1,54208

0,260865

5,9114

0,0000

z2

0,336911

0,116049

2,90317

0,0104

z12

-0,250149

0,0476532

-5,24936

0,0001

z22

-0,27555

0,0446356

-6,17333

0,0000


Таблица 11. Тест Стьюдента

R2= 78,8635 percent

R2 (adjusted for d.f.) = 74,9004 percent

Durbin-Watson statistic = 1,6966 (P=0,0838)

Lag 1 residual autocorrelation = 0,103142

Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

z2

1,53538

1

1,53538

5,53

0,0318

z12

4,45634

1

4,45634

16,06

0,0010

z22

10,5771

1

10,5771

38,11

0,0000

Model

16,5688

3

     

Таблица 12. Тест Фишера

Несомненно, что эта модель более "удачна", поскольку с одной  стороны все переменные проходят по всем тестам, с другой стороны  отличие коэффициента R2 от R2 скорректированного на степени свободы составляет всего 4%, напомним, что в изначальной модели это отличие было около 17%. Таким образом были выполнены обе задачи, поставленные после построения первой модели.(Соответствие тестам и уменьшение различия).

Рисунок 3. Окончательный вид модели 2

 

Автокорреляция.

 

Следующим шагом в курсовой работе будет проверка на автокорреляцию. Проверка автокорреляции первого порядка  будет осуществляться с помощью  критерия Дарбина-Уотсона.  Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. Альтернативные гипотезы состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках.  Значение критерия определяется следующим образом:

далее определяются критические значения критерия Дарбина–Уотсона  и  для заданного числа наблюдений n, числа независимых переменных модели k и уровня значимости α. По этим значениям числовой промежуток [0;4] разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью (1–α) рассматривается на рисунке.

Рисунок 4. Механизм проверки гипотезы о наличии автокорреляции остатков3

Применим критерий к нашей модели соответственно. Значение критерия Дарбина-Уотсона было получено выше и составляет 1,6966.

Теперь определим критические  значения критерия для количества наблюдений n=20, числа независимых переменных модели k=2, уровня значимости α=0.05. Из таблицы( см. Приложение 3) определяем dL= 1,10; dU=1,54.

Таким образом интервал принятия гипотезы Н0=[1,10 ; 2,46]. Значение 1,6966 принадлежит заданному интервалу, следовательно нет оснований отклонять гипотезу Н0 , что говорит о том, что автокорреляция остатков первого порядка отсутствует.

 

Кроме того можно использовать другой тест для проверки модели на автокорреляцию, например, тест Бреуша-Годфри

Тест основан на следующей идее: если имеется корреляция между соседними  наблюдениями, то естественно ожидать, что в уравнении

коэффициент p значимо отличается от нуля.

Однако и этот тест дает отрицательные  результаты при проверки на автокорреляцию первого порядка. Построенная модель ,описанная выше, будет иметь вид

 

 

et = 0,112439*et-1 ,

т.о. коэффициент p существенно не отличается от нуля (P-value=0,6489 при уровне значимости α=0.05). То есть, автокорреляция первого порядка отсутствует.

Однако проверка модели на автокорреляцию второго порядка дает положительный  результат, построенная модель имеет  вид 

et = 0,145051*et-1-0,525978et-2

коэффициент p2 существенно отличается от нуля (P-value=0,333 при уровне значимости α=0,05).

Автокорреляция третьего порядка  не обнаружена:

et = 0,160952*et-1-0,443724*et-2-0,00115766* et-3

коэффициент p2 существенно не  отличается от нуля (P-value=0,9956 при уровне значимости α=0.05).

Вычисленные показатели легко объясняются  с экономической точки зрения, поскольку меры предпринимаемые  правительством для решения демографической  проблемы, а точнее снижения смертности населения, не могут оказывать мгновенного  действия на ситуацию. Необходимо, чтобы прошло какое-то время. Автокорреляция второго порядка показывает, что это время составляет 2 года.

 

Исследование на гетероскедастичность.

 

Следующей проблемой, с которой предстоит столкнуться , является проверка построенной модели на гетероскедастичность. Напомним, что  гетероскедастичностью в эконометрике называют эффект, означающий неоднородность наблюдений и выражающийся в неодинаковой (непостоянной) дисперсии случайной ошибки регрессионной модели4.  
Для проверки используем несколько тестов, первым из которых будет тест Голдфелда-Квандта.

Алгоритм применения теста Голдфелда-Квандта следующий:

 

1. Выделяется фактор пропорциональности Z,. Данные упорядочиваются в порядке возрастания величины Z.

Информация о работе Зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей