Автор работы: Пользователь скрыл имя, 22 Декабря 2013 в 16:56, курсовая работа
Цель данной работы – проанализировать и исследовать поведение цены на рынке золота в зависимости от макроэкономических факторов. В настоящее время, сразу после всемирного кризиса, который так или иначе отразился не только на большинстве стран, но и на валютных, фондовых и товарно-сырьевых биржах, эта проблема становится все более и более актуальной. Общеизвестно, что в периоды экономической нестабильности, инвесторы, трейдеры и нередко обычные люди, начинают скупать золото, считая его «убежищем» из-за крайней ограниченности в природе.
Введение 3
Сбор данных 4
Анализ данных 5
Парный корреляционный анализ 5
Анализ мультиколлинеарности факторов 7
Построение регрессионной модели 9
Выбор функциональной зависимости 10
Анализ качества модели регрессии: 13
Анализ остатков 13
Анализ качества коэффициентов регрессии 17
Проверка качества модели в целом 18
Заключение 19
Список источников: 21
Полулогарифмическая модель
Dependent Variable: LOG(GOLD) |
||||
Method: Least Squares |
||||
Date: 05/10/11 Time: 19:53 |
||||
Sample: 1 102 |
||||
Included observations: 102 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
16.37182 |
1.228033 |
13.33174 |
0.0000 |
DEM |
0.025311 |
0.063606 |
0.397937 |
0.6916 |
LOG(DJI) |
-0.142890 |
0.060331 |
-2.368443 |
0.0199 |
LOG(INF) |
0.020328 |
0.010994 |
1.849113 |
0.0676 |
QE |
0.573639 |
0.116630 |
4.918452 |
0.0000 |
LOG(T10) |
-0.523644 |
0.135437 |
-3.866332 |
0.0002 |
LOG(USDX) |
-1.817422 |
0.210341 |
-8.640377 |
0.0000 |
R-squared |
0.755930 |
Mean dependent var |
6.068408 | |
Adjusted R-squared |
0.740515 |
S.D. dependent var |
0.413896 | |
S.E. of regression |
0.210837 |
Akaike info criterion |
-0.209302 | |
Sum squared resid |
4.222970 |
Schwarz criterion |
-0.029157 | |
Log likelihood |
17.67441 |
Hannan-Quinn criter. |
-0.136355 | |
F-statistic |
49.03864 |
Durbin-Watson stat |
0.530121 | |
Prob(F-statistic) |
0.000000 |
|||
Логлинейная модель
Как можно видеть из данных, полученных
в EViews, по всем критериям предпочтительней
является логлинейная модель.
Анализ качества модели необходим для того, чтобы узнать, соответствует ли модель основным предпосылкам регрессионного анализа, а также для проверки адекватности модели. Проверка качества модели заключается в следующем:
В регрессионной модели остатками называется последовательный ряд чисел , который является разностью между фактическим значением случайной величины и значениями , которые получены на основе модели регрессии путем подстановки в уравнение модели численных значений факториальных признаков. Остатки - это та часть вариации , которая объясняется влиянием тех факторов, которые не включены в модель.
К остаткам предъявляются очень серьезные и жесткие требования: они должны быть независимыми случайными величинами, распределенными по нормальному закону, должны иметь нулевую среднюю и постоянную конечную дисперсию, не должны быть автокоррелированными.
Проведём анализ остатков .
На основе полученных величин остатков построим график:
Рис 4.
На графике видно чередование знаков остатков, что является признаком независимости и случайности остатков. Но на основе того, что «полоса» остатков «расширяется», можно сделать предположение, что требование постоянства дисперсии не выполняется, а это указывает на возможную гетероскедастичность.
Проведем тест White heteroskedasticity на выявление гетероскедастичность. Результаты этого теста подтверждают, что в модели наблюдается гетероскедастичность:
Probability (F-statistic)= 0.000002 < 0,05
Heteroskedasticity Test: White |
||||
F-statistic |
7.378178 |
Prob. F(6,95) |
0.0000 | |
Obs*R-squared |
32.42246 |
Prob. Chi-Square(6) |
0.0000 | |
Scaled explained SS |
32.55179 |
Prob. Chi-Square(6) |
0.0000 | |
Test Equation: |
||||
Dependent Variable: RESID^2 |
||||
Method: Least Squares |
||||
Date: 05/15/11 Time: 16:27 |
||||
Sample: 1 102 |
||||
Included observations: 102 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
0.662933 |
0.168591 |
3.932196 |
0.0002 |
DEM^2 |
0.020061 |
0.016472 |
1.217873 |
0.2263 |
(LOG(DJI))^2 |
-0.003442 |
0.001001 |
-3.439847 |
0.0009 |
(LOG(INF))^2 |
-0.000368 |
0.000210 |
-1.752807 |
0.0829 |
QE^2 |
-0.073537 |
0.028947 |
-2.540422 |
0.0127 |
(LOG(T10))^2 |
-0.053006 |
0.011055 |
-4.794697 |
0.0000 |
(LOG(USDX))^2 |
-0.009522 |
0.005863 |
-1.624020 |
0.1077 |
R-squared |
0.317867 |
Mean dependent var |
0.041402 | |
Adjusted R-squared |
0.274785 |
S.D. dependent var |
0.063301 | |
S.E. of regression |
0.053907 |
Akaike info criterion |
-2.936947 | |
Sum squared resid |
0.276069 |
Schwarz criterion |
-2.756802 | |
Log likelihood |
156.7843 |
Hannan-Quinn criter. |
-2.864000 | |
F-statistic |
7.378178 |
Durbin-Watson stat |
1.305811 | |
Prob(F-statistic) |
0.000002 |
|||
При гетероскедостичности OLS-оценки остаются несмещенными и состоятельными, но уже не налучшими. При этом статистические выводы, полученные при использовании t- и F- статистик могут быть уже не верны. T-статистики, вычисленные обычным способом, по скорректированным стандартным ошибкам будут иметь асимптотически распределение Стьюдента.
Если между остатками одного и того же ряда существует корреляция, то говорят, что модели присуща автокорреляция. Последствиями автокорреляции является неэффективность оценок параметров модели (т.е. они не будут иметь минимальную дисперсию), что приводит к увеличению стандартных ошибок и тем самым к снижению расчетного значения t-статистики, широким доверительным интервалам для коэффициентов регрессии.2
Проверка осуществляется с помощью критерия Дарбина-Уотсона, и производится на основе показателя:
Используя Eviews, получаем DW=1,3. Данный показатель необходимо сравнить со значениями статистики, найденными по таблице Дарбина-Уотсона. В таблице, в зависимости от объема выборки n, уровня значимости α и числа включенных в модель факторов k, определяются значения dL и dU. В исследуемом нами случае: n=102, k=6, α=0,05, dL=1,55 и dU=1,803. Сравнение удобно провести с помощью следующей схемы:
После подстановки имеющихся данных получается следующая схема:
0________1,55________1,803____
Статистика DW попадает в отрезок, где автокорреляция положительна.
При автокорреляции оценки коэффициентов будут несмещенными и состоятельными, однако оценки дисперсий коэффициентов будут смещены вниз. Как следствие, t и f-статистики уже не имеют соответствующих распределений.3
Поскольку в нашей модели присутствует автокорреляция и гетероскедастичность одновременно, то необходимо скорректировать ошибки по форме Ньювей-Веста. Получаем:
Dependent Variable: LOG(GOLD) |
||||
Method: Least Squares |
||||
Date: 05/15/11 Time: 16:30 |
||||
Sample: 1 102 |
||||
Included observations: 102 |
||||
Newey-West HAC Standard Errors & Covariance (lag truncation=4) | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
16.37182 |
1.598015 |
10.24510 |
0.0000 |
DEM |
0.025311 |
0.117792 |
0.214881 |
0.8303 |
LOG(DJI) |
-0.142890 |
0.107340 |
-1.331197 |
0.1863 |
LOG(INF) |
0.020328 |
0.009025 |
2.252367 |
0.0266 |
QE |
0.573639 |
0.179136 |
3.202261 |
0.0019 |
LOG(T10) |
-0.523644 |
0.266046 |
-1.968242 |
0.0520 |
LOG(USDX) |
-1.817422 |
0.335409 |
-5.418527 |
0.0000 |
R-squared |
0.755930 |
Mean dependent var |
6.068408 | |
Adjusted R-squared |
0.740515 |
S.D. dependent var |
0.413896 | |
S.E. of regression |
0.210837 |
Akaike info criterion |
-0.209302 | |
Sum squared resid |
4.222970 |
Schwarz criterion |
-0.029157 | |
Log likelihood |
17.67441 |
Hannan-Quinn criter. |
-0.136355 | |
F-statistic |
49.03864 |
Durbin-Watson stat |
0.530121 | |
Prob(F-statistic) |
0.000000 |
|||
Из предыдущей таблицы видно, что такие факторы, как DEM и DJI и t10 незначимы, поскольку их Р значения больше, чем уровень значимости 5%. Исключим факторы из модели по одному, начиная с того, у которого Р значение самое большое.
Последовательно исключаем вышеперечисленные факторы, получаем:
Dependent Variable: LOG(GOLD) |
||||
Method: Least Squares |
||||
Date: 05/15/11 Time: 16:54 |
||||
Sample: 1 102 |
||||
Included observations: 102 |
||||
Newey-West HAC Standard Errors & Covariance (lag truncation=4) | ||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
15.17456 |
2.039699 |
7.439608 |
0.0000 |
LOG(INF) |
0.009958 |
0.004800 |
2.074484 |
0.0407 |
QE |
0.725514 |
0.127333 |
5.697761 |
0.0000 |
LOG(USDX) |
-2.025689 |
0.444670 |
-4.555488 |
0.0000 |
R-squared |
0.706474 |
Mean dependent var |
6.068408 | |
Adjusted R-squared |
0.697488 |
S.D. dependent var |
0.413896 | |
S.E. of regression |
0.227647 |
Akaike info criterion |
-0.083615 | |
Sum squared resid |
5.078670 |
Schwarz criterion |
0.019325 | |
Log likelihood |
8.264358 |
Hannan-Quinn criter. |
-0.041931 | |
F-statistic |
78.62370 |
Durbin-Watson stat |
0.501522 | |
Prob(F-statistic) |
0.000000 |
|||
Данная проверка предназначена для оценки совместного влияния всех включенных в модель факторов на результативную переменную. Качество построенной модели оценивает коэффициент детерминации R2.
Он показывает, насколько факторы, включенные в модель, объясняют вариацию ŷ.
Принимается гипотеза Н0: β1 = …= о βk = 0 (том, что все включенные в модель регрессоры не влияют на зависимую переменную). Альтернативная гипотеза Н1 выглядит так: Н1 : : β12 + … + βk2 > 0. Значимость уравнения регрессии в целом оценивается с помощью критерия Фишера:
Где n – объем выборки, m – количество параметров
По таблице определяется Fкритич (уровень значимости;кол-во параметров-1;объем выборки – кол-во параметров)
Fнабл=78,623
Fкритич = 3,08
Следовательно, регрессия в целом значима. Это значит, что все факторы осуществляют статистически значимое воздействие на объясняемую переменную: значение зависимой переменной на 70,64% определяется переменными, включёнными в модель.
Окончательный вариант регрессии выглядит следующим образом:
LOG(GOLD) = 15.1745615233 + 0.00995784340243*LOG(INF) + 0.725514400274*QE - 2.0256891599*LOG(USDX)
Основной целью данной работы является исследование зависимости цены на золото от ряда показателей, таких как индекс доллара, индекс Доу Джонса, Т-Bonds, уровень инфляции в США, наличие программы количественного смягчения, демократическая партия у власти. Анализ и все проведенные расчеты осуществлялись с использованием MS Excel и Eviews.
Все статистические данные были получены из официальных источников, с помощью экспертной оценки в модель были включены все основные факторы, которые могли бы повлиять на цену золота. Изначально, была предложена следующая спецификация модели:
GOLD = 967.496795806 - 7.33169377368*USDX + 0.0155192164947*DJI + 23.2383761785*INF - 8.767444357*T10 + 427.380477251*QE + 131.917788723*DEM
В ходе выбора подходящей для целей работы функциональной формы зависимости было доказано, что наилучшей является логлинейная модель. Также была проведена проверка модели на наличие автокорреляции и корректировка на гетероскедастичность, что позволило значительно улучшить модель.
В процессе исследования модели были выявлены и исключены факторы, незначительно влияющие на цену золота: наличие демократов у власти, индекс Доу Джонса и доходность 10-летних облигаций. После этого модель приняла следующий вид:
LOG(GOLD) = 15.1745615233 + 0.00995784340243*LOG(INF) + 0.725514400274*QE - 2.0256891599*LOG(USDX)
Приведенная выше модель оказалась не подверженной эффекту мультиколлинеарности и оказалась в целом значимой. Причем, значение зависимой переменной на 70,64% объясняется переменными, включёнными в модель (уровнем инфляции, проведением политики количественного смягчения, значением индекса доллара).