Автор работы: Пользователь скрыл имя, 24 Мая 2013 в 16:26, курсовая работа
Тема работы: проанализировать зависимость смертности населения в Российской Федерации от экономических, социальных и экологических показателей. В качестве таких показателей были взяты: валовой внутренний продукт, численность экономически активного населения, миграционный прирост, численность безработных, площадь жилых помещений, численность врачей, количество преступлений, выбросы загрязняющих веществ в атмосферу.
Задачи: выявить факторы, которые оказывают наибольшее влияние на смертность населения страны в течении последних 20 лет, и на их основе построить наиболее удачную эконометрическую модель, отражающую данную зависимость
Введение. 7
Построение эконометрической модели. 8
Поиск и обработка исходных данных. 8
Исследование зависимости между факторами и результирующим признаком. 10
Мультиколлинеарность. 12
Метод главных компонент. 15
Автокорреляция. 20
Исследование на гетероскедастичность. 23
Прогнозирование с помощью построенной модели. 28
Заключение. 29
Список литературы 30
2. Выбрасывается средняя треть упорядоченных наблюдений. Для первой и последней третей строятся две отдельные регрессии (каждая по n’
наблюдений), используя спецификацию первоначального уравнения. Берутся суммы квадратов остатков для регрессий по первой трети RSS1 и последней трети RSS3 и рассчитывается их отношение
(количество наблюдений
Используется F-тест для проверки гипотезы гомоскедастичности: если величина GQ превышает критическое значение F c n'−k −1 степенями свободы (и для числителя и для знаменателя, n’ – объем подвыборок), то гипотеза гомоскедастичности отвергается.
Следуя вышеописанному алгоритму для фактора z1 получаем:
Сортируем по возрастанию фактора z1 и разбиваем на две регрессии, имеем:
(1)
(3)
Строим для каждой выборки свою регрессионную модель, с учетом общего уравнения регрессии:
y = -1,04139 + 0,178232*z2 + 0,21547*z12 - 0,220552*z22 для (1)
y= 2,28887 + 1,65568*z2- 0,409269*z12 - 1,44959*z22 для (3)
Для каждого уравнения посчитаем квадраты ошибок, тогда RSS1= 9,482282
RSS3= 4,121347
Рассчитаем отношение 0,434637 и сравним этот показатель с критическим значение Фишера для выборки n=7, кол-ва факторов k=2, тогда F=6,39
GQ<F4,4 можно сделать вывод, что гипотеза H0 не отвергается, следовательно гетероскедастичность по фактору z1 в модели отсутствует.
Повторив вышеописанную процедуру для фактора z2 получим, RSS1= 7,717051
RSS2= 8,019252
GQ= 1,03916
GQ<F4,4 можно сделать вывод, что гипотеза H0 не отвергается, следовательно гетероскедастичность по фактору z2 в модели отсутствует.
Таким образом модель "выдержала проверку" по тесту Голдфелда-Квандта.
Воспользуемся еще одним тестом для более надежного результата.
Тест Парка (The Park test).
Алгоритм теста следующий:
1. Получают остатки оцененного уравнения регрессии.
Y = β0 + β1Xi + β2X2 +ε
e=Y - β1 X1 - β2 X2
2. Выбирают фактор пропорциональности и оценивают
вспомогательное уравнение регрессии.
ln(e2) = α0 + α1 ln(Z) + u
3. Проверяют значимость коэффициента при ln(Z)
Последуем приведенному выше алгоритму.
Сначала получим остатки уравнения регрессии, затем вычислим натуральный логарифм квадратов остатков модели:
Наконец, построим уравнение регрессии натурального логарифма квадратов остатков от натурального логарифма каждого из факторов( по отдельности).
Сначала на фактор z1:
ln(e2) = -3,41299 + 0,395757*ln(z1)+u
Тест Стьюдента говорит о незначимости коэффициента α1:
Standard |
T |
|||
Parameter |
Estimate |
Error |
Statistic |
P-Value |
CONSTANT |
-3,41299 |
0,981059 |
-3,47888 |
0,0103 |
ln(z1) |
0,395757 |
1,16975 |
0,338325 |
0,7450 |
Теперь на фактор z2, получим:
ln(e2) = -3,2152 - 0,192693*ln(z2)+u
Тест Стьюдента говорит о незначимости коэффициента α1:
Standard |
T |
|||
Parameter |
Estimate |
Error |
Statistic |
P-Value |
CONSTANT |
-3,2152 |
0,874289 |
-3,67751 |
0,0079 |
ln(z2) |
-0,192693 |
0,733065 |
-0,262859 |
0,8002 |
Таким образом, тест Парка также не дал положительных результатов при проверке модели на гетероскедастичность.
Вывод: проверка построенной модели на гетероскедастичность с помощью тестов Голдфелда-Квандта и Парка показала отсутствие гетероскедастичноти. Следовательно, с построенной моделью можно строить прогноз будущих периодов, не опасаясь что увеличение значений факторов, будет приводить к росту вариации зависимой величины.
Построенная модель имеет вид:
yCentr = 1,54208 + 0,336911*z2 - 0,250149*z12 - 0,27555*z22+ԑt
Эта модель успешно
выдержала испытания всеми
В
данной работе была проанализирована
смертность населения в Российской
Федерации за последние 20 лет. Была
построена эконометрическая модель,
которая отвечает всем критериям
качества. В данной отсутствует
1. Эконометрика: Учебник / Н.П.Тихомиров, Е.Ю. Дорохина - М.:Издательство "Экзамен"
2. Эконометрика. Начальный курс. Магнус Я.Р., Катышев П.К., Пересецкий А.А., - М.: Дело, 2004.
3. Эконометрика - И. И. Елисеева - Учебник, 2003
4. gks.ru
5. rbc.ru
6. grandars.ru
Приложение 1. Исходные данные в абсолютных величинах.
Приложение 2. Статистика Дарбина-Уотсона, 5-% уровень значимости
Приложение 3. Таблица значений F-критерия Фишера на уровне значимости α = 0,05.
1 Социально-экономические показатели Российской Федерации в 1992 - 2011гг. (приложение к статистическому сборнику "Российский статистический ежегодник. 2012")
2 Эконометрика: Учебник / Н.П.Тихомиров, Е.Ю. Дорохина - М.:Издательство "Экзамен"
3 Эконометрика. Начальный курс. Магнус Я.Р., Катышев П.К., Пересецкий А.А., - М.: Дело, 2004.
4 Эконометрика - И. И. Елисеева - Учебник, 2003