Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 16:59, лабораторная работа
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
ЧАСТЬ 1. ПАРНАЯ РЕГРЕССИЯ
1.1 Линейная регрессия
1.2 Логарифмическая регрессия
1.3 Нахождение и анализ уравнения показательной регрессии
1.4. Степенная регрессия
ВЫВОД
t-статистика. Критерий Стьюдента.
t-статистика. Критерий Стьюдента.
Находим критическое значение t-критерия в таблице
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Рассчитаем фактическое значение данного критерия
. Поскольку 41.32> 2.262, то статистическая значимость коэффициента регрессии b подтверждается.
>
2.262, статистическая значимость
Определим
доверительные интервалы
(b - tкритSb; b + tкритSb)
(0.43 - 2.262 • 0.0103; 0.43 + 2.262 • 0.0103)
(0.4;0.45)
(a - tкритSa; a + tкрит Sa)
(1.06 - 2.262 • 0.0271; 1.06 + 2.262 • 0.0271)
(1;1.13)
С вероятностью 95% можно утверждать, что значения параметров aи b будут лежать в найденных интервалах.
F-статистика.
Критерий Фишера для оценки
значимости всего уравнения
Определим определяют фактическое значение F-критерия:
Найдём табличное значение
Fтабл = 5.12
Поскольку фактическое значение F >Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
2. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
уравнение множественной регрессии с 2 признаками имеет вид:
Y = β0 + β1X1 + β2X2
Определим вектор оценок коэффициентов регрессии
с |
200 |
1.5 |
1 |
250 |
2.1 |
1 |
300 |
2.7 |
1 |
350 |
3 |
1 |
400 |
3.2 |
1 |
450 |
3.4 |
1 |
500 |
3.6 |
1 |
550 |
3.7 |
1 |
600 |
4 |
1 |
650 |
3.8 |
1 |
700 |
3.7 |
Матрица Y
110 |
120 |
135 |
140 |
150 |
159 |
194 |
170 |
176 |
180 |
190 |
Умножаем матрицы, (XTX)
Умножаем матрицы, (XTY)
Вектор оценок коэффициентов регрессии равен
s = (XTX)-1XTY =
Уравнение регрессии (оценка уравнения регрессии)
Y = 65.97 + 0.0889X1 + 16.09X2
Найдём матрицу парных коэффициентов корреляции
Ошибка! Закладка не определена. , где
Матрица парных коэффициентов корреляции.
- |
y |
x1 |
x2 |
y |
1 |
0.93 |
0.92 |
x1 |
0.93 |
1 |
0.91 |
x2 |
0.92 |
0.91 |
1 |
Проверим значимость полученных парных коэффициентов корреляции с помощью t-критерия Стьюдента. Коэффициенты, для которых значения t-статистики по модулю больше найденного критического значения, считаются значимыми.
Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле:
где m = 1 - количество факторов в уравнении регрессии.
По
таблице Стьюдента находим
tкрит(n-m-1;α/2) = (9;0.025) = 2.262
Поскольку tнабл>tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле:
Поскольку tнабл>tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
Таким образом, связь между (y и xx1), (y и xx2 ) является существенной.
Наибольшее влияние на результативный признак оказывает фактор x1 (r = 0.93), значит, при построении модели он войдет в регрессионное уравнение первым.
Рассчитаем частные коэффициенты корреляции.
Теснота связи умеренная
Определим значимость коэффициента корреляции ryx1 /x2 .
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
где k = 1 - число фиксируемых факторов.
По
таблице Стьюдента находим
tкрит(n-k-2;α/2) = (8;0.025) = 2.306
Поскольку tнабл<tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
Как видим, связь y и x1 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x1 остается нецелесообразным.
Теснота связи не сильная
Определим значимость коэффициента корреляции ryx2 /x1 .
Для этого рассчитаем наблюдаемые значения t-статистики по формуле:
Поскольку tнабл<tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
Проведём анализ параметров уравнения регрессии
Y |
Y(x) |
ε = Y - Y(x) |
ε2 |
(Y-Yср)2 |
|ε|/Y |
110 |
107.88 |
2.12 |
4.47 |
2183.44 |
0.42 |
120 |
121.98 |
-1.98 |
3.93 |
1348.89 |
0.31 |
135 |
136.08 |
-1.08 |
1.17 |
472.07 |
0.16 |
140 |
145.35 |
-5.35 |
28.63 |
279.8 |
0.12 |
150 |
153.01 |
-3.01 |
9.08 |
45.26 |
0.0448 |
159 |
160.68 |
-1.68 |
2.81 |
5.17 |
0.0143 |
194 |
168.34 |
25.66 |
658.55 |
1389.26 |
0.19 |
170 |
174.39 |
-4.39 |
19.28 |
176.17 |
0.0781 |
176 |
183.66 |
-7.66 |
58.71 |
371.44 |
0.11 |
180 |
184.89 |
-4.89 |
23.91 |
541.62 |
0.13 |
190 |
187.73 |
2.27 |
5.17 |
1107.07 |
0.18 |
0 |
815.71 |
7920.18 |
1.75 |
Средняя ошибка аппроксимации
Оценка дисперсии равна:
se2 = (Y - X*s)T(Y - X*s) = 815.71
Несмещенная оценка дисперсии равна:
Оценка среднеквадратичного отклонения равна (стандартная ошибка для оценки Y):
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:
Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат ус увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.
Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Рассчитаем множественный коэффициент корреляции
Связь между признаком Y факторами X сильная
Коэффициент детерминации.
R2= 0.952 = 0.9
1) t-статистика
Tтабл (n-m-1;α/2) = (8;0.025) = 2.306
Находим стандартную ошибку коэффициента регрессии b0:
Статистическая значимость коэффициента регрессии b0 подтверждается.
Находим стандартную ошибку коэффициента регрессии b1:
Статистическая значимость коэффициента регрессии b1 подтверждается.
Находим стандартную ошибку коэффициента регрессии b2:
Статистическая значимость коэффициента регрессии b2 подтверждается.
Доверительный интервал для коэффициентов уравнения регрессии.
Определим
доверительные интервалы
(bi - tiSbi; bi + tiSbi)
b0: (65.97 - 2.306 • 4.79 ; 65.97 + 2.306 • 4.79) = (54.92;77.03)
b1: (0.0889 - 2.306 • 0.0146 ; 0.0889 + 2.306 • 0.0146) = (0.0553;0.12)
b2: (16.09 - 2.306 • 3.11 ; 16.09 + 2.306 • 3.11) = (8.93;23.25)
Выполним проверка общего качества уравнения множественной регрессии.
Найдём фактическое значение критерия Фишера
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 11 - 2 - 1 = 8, Fkp(2;8) = 4.46
Поскольку фактическое значение F >Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно
ВЫВОД:
Занесём в таблицу результаты корреляционно-регрессионного анализа
Уравнение регрессии |
Коэффициент корреляции |
Коэффициент детерминации |
F-критерий Фишера |
y = 0.1522 x + 85.5182 |
0,99 |
0.9795 |
430.35 |
y = -223,3402 + 62,4813 ln x |
0.999999 |
0,99 |
1445.6 |
y= 95.8932*1.0008x |
0,98 |
0,95 |
188.48 |
y = 11.61393x0.4258 |
0,999999 |
0,99 |
1707.09 |
y = 65.97 + 0.0889X1 + 16.09X2 |
0,95 |
0,91 |
34,87 |
Проанализировав все модели регрессии, предпочтение можно отдать степенной функции y = 11.61393x0.4258, для которой значения коэффициентов корреляции и детерминации и F-критериев Фишера наибольшие.
Для xp = 800 рассчитаем прогнозное значение и построим доверительный интервал прогноза.
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 800
(2.45 + 0.43*800 ± e0.0175)
(342.07;344.11)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.