Автор работы: Пользователь скрыл имя, 17 Июля 2013 в 20:07, курсовая работа
Целью данной работы является анализ динамики и прогнозирование средней цены на первичном и вторичном рынке жилья в России.
Можно выделить следующие задачи:
1. Изучить понятие, структуру, виды и функции рынка недвижимости.
2. Изучить методы прогнозирования.
В моментных временных
рядах уровни характеризуют
4. по расстоянию между датами и интервалами времени:
• равноотстоящие — когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами;
• неполные (неравноотстоящие) — когда принцип равных интервалов не соблюдается;
5. по наличию пропущенных значений:
• полные
• неполные временные ряды.
Временные ряды бывают
В зависимости от наличия основной тенденции выделяют стационарные ряды, в которых среднее значение и дисперсия постоянны, и нестационарные, содержащие основную тенденцию развития.
2.3. Нестационарные временные ряды
Начнем рассмотрение именно с нестационарных рядов, которые могут быть приведены к стационарному виду с помощью взятия последовательных разностей. Начнем с простейшего вида ряда I(1). Оказалось, что 2 разных по свойствам типа нестационарных рядов приводятся к стационарному виду с помощью взятия последовательных разностей.
1 тип: процесс с
Xt= Pk(t) ,где Pk(t) – полином степени k от t, а εt – стационарный процесс, необязательно белый шум. Если ограничиться рассмотрением только линейного тренда Xt = a + βt + εt , то можно записать:
∆ Xt = Xt - Xt-1 =(1-L) Xt= β+( εt - εt-1).
Поскольку εt – стационарный процесс, то его первая разность также стационарный процесс, хотя если εt – белый шум, то появляется МА-часть. В случае полиномиального тренда для приведения к стационарному виду нужно взять последовательную разность несколько раз.
2 тип: процесс случайного блуждания: Xt = µ + Xt-1 + εt . В этом случае Xt = µ+ εt и процесс Xt называется случайным блужданием с дрейфом. Мы можем записать решение этого разностного уравнения в следующем виде: Xt = µt + .
Если случайное блуждание можно привести к стационарному виду только взятием первой разности, то ряд первого типа можно привести к стационарному виду также выделением линейного тренда, например построив линейную регрессию на время и рассмотрев стационарный остаток. Применим ли такой подход к случайному блужданию? Мы получим значимый по t-статистике коэффициент b. Метод наименьших квадратов как бы преобразует непостоянную дисперсию в значимый тренд, т.е. в непостоянное математическое ожидание. Таким образом, мы эти 2 типа процесса спутаем. Вопрос о том, насколько опасно путать эти 2 процесса между собой, привлек внимание относительно поздно. Для краткости введем следующие названия для этих типов нестационарных процессов.
1 тип: процесс, приводимый
к стационарному путем
Xt = a + βt + εt , он приводится к стационарному процессу путем включения в регрессию линейного тренда. Это, в принципе, процесс, у которого есть детерминированный тренд. Иногда такой процесс называют TS.
2 тип: процесс, приводимый к стационарному путем взятия первой разности – DSP (diferencing stationary process). Вид этого процесса таков:
Xt = Xt-1 + εt. Иногда такой процесс называют DS.
Таким образом получаем следующее:
Процесс TSP не стационарен из-за непостоянного тренда, конечная память о шоках, он забывает об ошибке на предыдущем шаге сразу. Если вместо белого шума будет стоять более общий процесс ARMA(p,q), то, конечно, шоки сказываются некоторое время,но их влияние со временем ослабевает.
Процесс DSP не стационарен из-за непостоянной дисперсии, так как в явном решении стоит сумма всех предыдущих , то шоки помнятся все время. Это процесс с бесконечной памятью. Экономически это не оченьпонятно, шоки не должны сказываться постоянно.
Но ряды типа TS и DS можно сделать стационарным.
2.4 Стационарные временные ряды
Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.
Временной ряд xt,(t = 1, 2, ..., n) называется строго стационарным (или
стационарным в узком смысле) , если совместное распределение вероятностей n наблюдений x1, x2, . . . , xn такое же, как и n наблюдений x1+k, x2+k, . . . , xn+k при любых n, t и k. Другими словами, свойства строго стационарных 2 рядов xt, не зависят от момента k, т. е. закон распределения и его числовые характеристики не зависят от k. Следовательно, математическое ожидание M(xt) = a, среднее квадратическое отклонение; σ(xt) = σ могут быть оценены по наблюдениям xt (t = 1, 2, ..., n) по формулам:
=
=
Простейшим примером стационарного временного ряда, у которого математическое ожидание равно нулю, а ошибки εt некоррелированы, является белый шум. Следовательно, можно сказать, что возмущения (ошибки) εt ( в классической линейной регрессионной модели образуют белый шум, а в случае их нормального распределения нормальный (гауссовский) белый шум.
Степень тесноты связи между последовательностями наблюдений временного ряда x1, x2, . . . , xn и x1+k, x2+k, . . . , xn+k (сдвинутых относительно друг друга на k единиц, или, как говорят, с лагом k) может быть определена с помощью коэффициента корреляции:
)
Так как M()=M(xt+k)=a, δ(t)=δ(t+k)=δ.
Так как коэффициент ρ(k) измеряет корреляцию между членами одного и того же ряда, его называют коэффициентом автокорреляции, а зависимость ρ(k) - автокорреляционной функцией или (ACF autocorrelation function) .
Автокорреляционная функция безразмерна, т.е. не зависит от масштаба измерения анализируемого временного ряда. Ее значения могут изменяться в пределах от −1 до +1; при этом ρ(0) = 1.
Кроме того, используется и автоковариационная функция
γ(k)=M((,
где . Эти функции, очевидно, связаны соотношением
ρ(k) = γ(k)/γ(0). В силу стационарности временного ряда xt (t = 1, 2, ..., n) автокорреляционная функция ρ(k) зависит только от лага k, причем ρ(−k) = ρ(k), т. е. при изучении ρ(k) можно ограничиться рассмотрением только положительных значений k. Функцию r(k) называют выборочной автокорреляционной функцией сокращенно ACF, а ее график коррелограммой.
Наряду с автокорреляционной
функцией при исследовании стационарных
временных рядов
2.5 Q-статистика
До 1978г использовалась Q-статистика Бокса-Пирса, но выяснилось, что она имеет малую мощность, Бокс и Льюнг в 1978 г. предложили использовать для тех же целей улучшенную Q-статистику Бокса-Льюнга
,
которую, как и статистику Бокса Пирса, часто называют портманто-статистикой (port-manteau - statistics) . По сравнению со статистикой БоксаПирса различным слагаемым приданы разные веса.
Нулевая гипотеза в Q-критерии заключается в том, что ряд представляет собой белый шум, то есть является чисто случайным процессом. Используется стандартная процедура проверки: если расчетное значение Q-статистики больше заданного квантиля распределения , то нулевая гипотеза отвергается и признается наличие автокорреляции до m-го порядка в исследуемом ряду.
Для проверки наличия автокорреляции в моделях ARMA лучше воспользоваться более мощным и универсальным способом, а именно методом множителей Лагранжа (Lagrange multiplier LM) , применительно к проверке автокорреляции остатков его еще называют тестом Бреуша-Годфри (Breusch-Godfrey).
Пусть рассматривается модель множественной регрессии
где x1, ..., xk - разные регрессоры, в том числе, возможно, и лаговые значения
как объясняющих, так и объясняемой переменных. Проверим предположение, что et подчиняется авторегрессионой схеме порядка p, т.е. задается уравнением
, где – белый шум.
В терминах коэффициентов модели основная и альтернативная гипотезы принимают вид:
H0 : γ1 = · · · = γp = 0,
H1 : + · · · + > 0.
Для проверки модели на нормальность проводят тест Жарге-Бера (Jarque Bera). Этот тест выглядит следующим образом. Он вычисляет выборочные значения для коэффициентов асимметрии
и эксцесса
Где выборочное среднее, а σ - выборочное среднеквадратичное остатков модели.
Таким образом, можно сделать вывод о том, что для оценки качества моделей существует много способов. Среди них тесты на автокорреляцию и нормальность распределения. Так же используется построение автокорреляционных функций.
Рассмотрим два временных ряда:
Данные взяты по годам с 1998 года по 2012 с официального сайта ГОСКОМСТАТа:
Y |
X |
4216 |
4431 |
5704 |
5371 |
7690 |
6422 |
9122 |
8789 |
11443 |
11254 |
14320 |
13659 |
18131 |
17911 |
22008 |
21916 |
32504 |
36198 |
40971 |
44630 |
49138 |
53752 |
44481 |
48940 |
46807 |
56762 |
44777 |
44002 |
49872 |
48102 |
Все расчеты выполняются с помощью программы EViews.
Сначала, чтобы убедиться, что эти ряды связаны между собой проведем тест Грэйнжера, нулевые гипотезы которого заключаются в следующем:
Н0: ряд У не является причиной по Грейнджеру для ряда Х;
Н0: ряд Х не является причиной по Грейнджерудля ряда У.
А альтернативные гипотезы:
Н1: ряд Уявляется причиной по Грейнджеру для ряда Х;
Н1: ряд Х является причиной по Грейнджерудля ряда У.
Pairwise Granger Causality Tests | |||
Date: 05/07/13 Time: 09:44 | |||
Sample: 1 15 |
|||
Lags: 2 |
|||
Null Hypothesis: |
Obs |
F-Statistic |
Prob. |
X does not Granger Cause Y |
13 |
1.02299 |
0.4022 |
Y does not Granger Cause X |
4.11036 |
0.0592 | |
Fкрит = 3.805565
Fнабл> Fкрит , значит гипотеза «Y does not Granger Cause X» (У не является причиной по Грэйнжеру для Х) отвергается, т.е. средние цены на первичном рынке жилья влияют на изменение цен на вторичном рынке.
Теперь проверим являются ли наши ряды стационарными или же нет. Для анализа ряда на стационарность используется тест на наличие единичного корня – тест Дики-Фуллера (DF) или расширенный тест Дики-Фуллера (ADF). В ADF-тесте нулевая гипотеза заключается в наличии единичного корня. Проверка гипотезы осуществляется путем сравнения фактической величины t-статистики с соответствующим табличным значением. Если абсолютное значение фактического значения t превысит табличное на установленном уровне значимости, то нулевая гипотеза должна быть отвергнута и принята альтернативная гипотеза, заключающаяся в отсутствии единичных корней и стационарности временного ряда.
После проверки на стационарность без нахождения первой производной выяснили, что оба ряда не являются типа TS, так как они не являлись стационарным ни на одном из уровней значимости. Но после нахождения первой производной и выделения тренда и константы мы получили, что ряды стационарны:
Null Hypothesis: D(Y) has a unit root |
||||
Exogenous: Constant, Linear Trend |
||||
Lag Length: 2 (Automatic - based on SIC, maxlag=2) | ||||
t-Statistic |
Prob.* | |||
Augmented Dickey-Fuller test statistic |
-4.719551 |
0.0248 | ||
Test critical values: |
1% level |
-5.521860 |
||
5% level |
-4.107833 |
|||
10% level |
-3.515047 |
|||
|
||||