Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 16:59, лабораторная работа
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
ЧАСТЬ 1. ПАРНАЯ РЕГРЕССИЯ
1.1 Линейная регрессия
1.2 Логарифмическая регрессия
1.3 Нахождение и анализ уравнения показательной регрессии
1.4. Степенная регрессия
ВЫВОД
ЧАСТЬ 1. ПАРНАЯ РЕГРЕССИЯ
Исходные данные запишем в таблице
x |
y |
200 |
110 |
250 |
120 |
300 |
135 |
350 |
140 |
400 |
150 |
450 |
159 |
500 |
164 |
550 |
170 |
600 |
176 |
650 |
180 |
700 |
190 |
Х – фактор-признак, доход семьи в тыс. руб.
У – расход на потребление определённого товара в тыс. руб.
1.1 Линейная регрессия
Уравнение парной регрессии.
Линейное уравнение регрессии имеет вид y = bx + a Здесь ε - случайная ошибка (отклонение, возмущение).
Для оценки параметров a и b - используют МНК. Метод наименьших квадратов дает наилучшие оценки параметров уравнения регрессии.
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
11a + 4950 b = 1694
4950 a + 2502500 b = 804150
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.1522, a = 85.5182
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.1522 x + 85.5182
Для расчета параметров регрессии построим расчетную таблицу
x |
y |
x2 |
y2 |
x • y |
200 |
110 |
40000 |
12100 |
22000 |
250 |
120 |
62500 |
14400 |
30000 |
300 |
135 |
90000 |
18225 |
40500 |
350 |
140 |
122500 |
19600 |
49000 |
400 |
150 |
160000 |
22500 |
60000 |
450 |
159 |
202500 |
25281 |
71550 |
500 |
164 |
250000 |
26896 |
82000 |
550 |
170 |
302500 |
28900 |
93500 |
600 |
176 |
360000 |
30976 |
105600 |
650 |
180 |
422500 |
32400 |
117000 |
700 |
190 |
490000 |
36100 |
133000 |
4950 |
1694 |
2502500 |
267378 |
804150 |
Рассчитаем выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Для анализа тесноты связи между факторами рассчитаем коэффициент корреляции
- связь между признаком Y фактором X весьма высокая и прямая.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Для этих целей вычисляются коэффициенты эластичности.
Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат уот своей средней величины при изменении фактора x на 1% от своего среднего значения.
Коэффициент эластичности находится по формуле:
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит дляизмерение тесноты зависимости. Изменяется в пределах [0;1].
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще
всего, давая интерпретацию
R2= 0.992 = 0.9795
т.е. в 97.95 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 2.05 % изменения Y объясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
200 |
110 |
115.95 |
1936 |
35.46 |
62500 |
0.0541 |
250 |
120 |
123.56 |
1156 |
12.7 |
40000 |
0.0297 |
300 |
135 |
131.17 |
361 |
14.65 |
22500 |
0.0284 |
350 |
140 |
138.78 |
196 |
1.48 |
10000 |
0.0087 |
400 |
150 |
146.39 |
16 |
13.03 |
2500 |
0.0241 |
450 |
159 |
154 |
25 |
25 |
0 |
0.0314 |
500 |
164 |
161.61 |
100 |
5.72 |
2500 |
0.0146 |
550 |
170 |
169.22 |
256 |
0.61 |
10000 |
0.0046 |
600 |
176 |
176.83 |
484 |
0.68 |
22500 |
0.0047 |
650 |
180 |
184.44 |
676 |
19.68 |
40000 |
0.0246 |
700 |
190 |
192.05 |
1296 |
4.18 |
62500 |
0.0108 |
4950 |
1694 |
1694 |
6502 |
133.19 |
275000 |
0.24 |
Изобразим
фактические и расчётные
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.
Найдём табличное значение данного критерия
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Рассчитаем фактическое значения для сравнения
Поскольку 20.75 > 2.262, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 24.44 > 2.262, то статистическая значимость коэффициента регрессии aподтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим
доверительные интервалы
(b - tкритSb; b + tкритSb)
(0.15 - 2.262 • 0.00734; 0.15 + 2.262 • 0.00734)
(0.14;0.17)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкритSa; a + tкрит Sa)
(85.52 - 2.262 • 3.5; 85.52 + 2.262 • 3.5)
(77.6;93.43)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
F-статистика. Критерий Фишера.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Определим фактическое значение F-критерия:
где m=1 для парной регрессии.
Табличное значение критерия со степенями свободы k1=1 и k2=9, Fтабл = 5.12
Поскольку фактическое значение F >Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
1.2 Логарифмическая регрессия
Логарифмическое уравнение
Составим таблицу вспомогательных величин:
|
|
|
|
|
|
1 |
200 |
110 |
5.2983 |
28.0722 |
582.8149 |
2 |
250 |
120 |
5.5215 |
30.4865 |
662.5753 |
3 |
300 |
135 |
5.7038 |
32.5331 |
770.0106 |
4 |
350 |
140 |
5.8579 |
34.3154 |
820.1106 |
5 |
400 |
150 |
5.9915 |
35.8976 |
898.7197 |
6 |
450 |
159 |
6.1092 |
37.3229 |
971.3704 |
7 |
500 |
164 |
6.2146 |
38.6214 |
1019.1957 |
8 |
550 |
170 |
6.3099 |
39.8151 |
1072.6861 |
9 |
600 |
176 |
6.3969 |
40.9207 |
1125.8596 |
10 |
650 |
180 |
6.477 |
41.9512 |
1165.855 |
11 |
700 |
190 |
6.5511 |
42.9167 |
1244.7053 |
|
4950 |
1694 |
66.4317 |
402.8527 |
10333.9033 |
Вычислим коэффициенты и уравнения логарифмической регрессии
Итак, искомое уравнение регрессии имеет вид: .
Сделаем общий чертёж диаграммы рассеяния и графика уравнения регрессии
Для оценки значимости параметров регрессии и корреляции сначала рассчитаем выборочные средние.
Рассчитаем коэффициент эластичности находится по формуле:
В
нашем примере коэффициент
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит дляизмерение тесноты зависимости. Изменяется в пределах [0;1].
– высокая связь между
Рассчитаем индекс корреляции для анализа тесноты связи между факторами
Полученная величина свидетельствует о том, что фактор x существенно влияет на y
Рассчитаем индекс детерминации.
т.е. в 99.38 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 0.62 % изменения Y объясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
ln(x) |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
2.3 |
110 |
107.71 |
1936 |
5.26 |
0.1 |
0.0209 |
2.4 |
120 |
121.65 |
1156 |
2.72 |
0.0506 |
0.0137 |
2.48 |
135 |
133.04 |
361 |
3.84 |
0.0212 |
0.0145 |
2.54 |
140 |
142.67 |
196 |
7.14 |
0.0062 |
0.0191 |
2.6 |
150 |
151.01 |
16 |
1.03 |
0.000431 |
0.00676 |
2.65 |
159 |
158.37 |
25 |
0.39 |
0.000924 |
0.00394 |
2.7 |
164 |
164.96 |
100 |
0.92 |
0.0058 |
0.00583 |
2.74 |
170 |
170.91 |
256 |
0.83 |
0.0138 |
0.00536 |
2.78 |
176 |
176.35 |
484 |
0.12 |
0.0241 |
0.00198 |
2.81 |
180 |
181.35 |
676 |
1.82 |
0.0361 |
0.0075 |
2.85 |
190 |
185.98 |
1296 |
16.16 |
0.0494 |
0.0212 |
28.85 |
1694 |
1694 |
6502 |
40.23 |
0.31 |
0.12 |
t-статистика. Критерий Стьюдента.
Найдём табличное значениеt-критерия Стьюдента
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Рассчитаем фактическое значение t-критерия Стьюдента
Поскольку 38.02 > 2.262, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 22.46 > 2.262, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим
доверительные интервалы
(b - tкритSb; b + tкритSb)
(143.87 - 2.262 • 3.78; 143.87 + 2.262 • 3.78)
(135.31;152.43)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкритSa; a + tкрит Sa)
(-223.34 - 2.262 • 9.94; -223.34 + 2.262 • 9.94)
(-245.84;-200.84)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
F-статистика. Критерий Фишера – для оценки значимости всего уравнения регрессии.
определим фактическое значение F-критерия:
Табличное значение критерия со степенями свободы k1=1 и k2=9, Fтабл = 5.12
Поскольку фактическое значение F >Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
1.3 Нахождение и анализ уравнения показательной регрессии
Составим таблицу вспомогательных величин:
|
|
|
|
|
|
1 |
200 |
110 |
40000 |
4.7005 |
940.0961 |
2 |
250 |
120 |
62500 |
4.7875 |
1196.8729 |
3 |
300 |
135 |
90000 |
4.9053 |
1471.5824 |
4 |
350 |
140 |
122500 |
4.9416 |
1729.5748 |
5 |
400 |
150 |
160000 |
5.0106 |
2004.2541 |
6 |
450 |
159 |
202500 |
5.0689 |
2281.0069 |
7 |
500 |
164 |
250000 |
5.0999 |
2549.9332 |
8 |
550 |
170 |
302500 |
5.1358 |
2824.6891 |
9 |
600 |
176 |
360000 |
5.1705 |
3102.2904 |
10 |
650 |
180 |
422500 |
5.193 |
3375.422 |
11 |
700 |
190 |
490000 |
5.247 |
3672.9169 |
|
4950 |
1694 |
2502500 |
55.2606 |
25148.6389 |