Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 16:59, лабораторная работа
Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов. Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.
ЧАСТЬ 1. ПАРНАЯ РЕГРЕССИЯ
1.1 Линейная регрессия
1.2 Логарифмическая регрессия
1.3 Нахождение и анализ уравнения показательной регрессии
1.4. Степенная регрессия
ВЫВОД
Вычислим коэффициенты и уравнения показательной регрессии
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
11a + 4950 b = 24
4950 a + 2502500 b = 10921.92
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.000444, a = 1.9818
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 101.9818*100.000444x
y= 95.89337*1.00102x
Сделаем общий чертёж диаграммы рассеяния и графика уравнения регрессии
Коэффициент эластичности находится по формуле:
E = b = 0.000444
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит дляизмерение тесноты зависимости. Изменяется в пределах [0;1].
– высокая теснота зависимости
Рассчитаем индекс корреляции
– Полученная величина
Рассчитаем индекс детерминации
, т.е. в 95.44 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 4.56 % изменения Y объясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
log(y) |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
200 |
2.04 |
2.07 |
0.0197 |
0.000857 |
62500 |
0.0143 |
250 |
2.08 |
2.09 |
0.0105 |
0.000188 |
40000 |
0.00659 |
300 |
2.13 |
2.12 |
0.00264 |
0.000232 |
22500 |
0.00715 |
350 |
2.15 |
2.14 |
0.00127 |
7.8E-5 |
10000 |
0.0041 |
400 |
2.18 |
2.16 |
3.2E-5 |
0.000274 |
2500 |
0.00761 |
450 |
2.2 |
2.18 |
0.000386 |
0.000386 |
0 |
0.00892 |
500 |
2.21 |
2.2 |
0.00109 |
0.000118 |
2500 |
0.00491 |
550 |
2.23 |
2.23 |
0.00237 |
1.8E-5 |
10000 |
0.00191 |
600 |
2.25 |
2.25 |
0.00406 |
8.0E-6 |
22500 |
0.00129 |
650 |
2.26 |
2.27 |
0.0054 |
0.000236 |
40000 |
0.00681 |
700 |
2.28 |
2.29 |
0.00941 |
0.000199 |
62500 |
0.00619 |
4950 |
24 |
24 |
0.0569 |
0.00259 |
275000 |
0.0698 |
t-статистика. Критерий Стьюдента.
Находим критическое значение t-критерия в таблице
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Рассчитаем фактическое значение данного критерия
Поскольку 4.44 > 2.262, то статистическая значимость коэффициента регрессии b подтверждается.
Поскольку 128.36 > 2.262, то статистическая
значимость коэффициента
Определим
доверительные интервалы
(b - tкритSb; b + tкритSb)
(0.000444 - 2.262 • 3.2E-5; 0.000444 + 2.262 • 3.2E-5)
(0.000218;0.000671)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкритSa; a + tкрит Sa)
(1.98 - 2.262 • 0.0154; 1.98 + 2.262 • 0.0154)
(1.95;2.02)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
F-статистика.
Критерий Фишера для оценки
значимости всего уравнения
Определим определяют фактическое значение F-критерия:
Найдём табличное значение
Fтабл = 5.12
Поскольку фактическое значение F >Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
1.4. Степенная регрессия
y = axb (lny = lna + blnx)
После линеаризации уравнения имеем Y*=lny, X*=lnx, A=lna
С помощью МНК найдём коэфф-ты уравнения регрессии
A•n + b∑x = ∑y
A∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
11A + 28.85 b = 24
28.85 A + 75.98 b = 63.08
Получаем эмпирические коэффициенты регрессии: b = 0.4258, A = 1.065
y = 101.06497903x0.4258 = 11.61393x0.4258
Для расчета параметров регрессии построим расчетную таблицу
ln(x) |
ln(y) |
ln(x)2 |
y2 |
x • y |
2.3 |
2.04 |
5.29 |
4.17 |
4.7 |
2.4 |
2.08 |
5.75 |
4.32 |
4.99 |
2.48 |
2.13 |
6.14 |
4.54 |
5.28 |
2.54 |
2.15 |
6.47 |
4.61 |
5.46 |
2.6 |
2.18 |
6.77 |
4.74 |
5.66 |
2.65 |
2.2 |
7.04 |
4.85 |
5.84 |
2.7 |
2.21 |
7.28 |
4.91 |
5.98 |
2.74 |
2.23 |
7.51 |
4.97 |
6.11 |
2.78 |
2.25 |
7.72 |
5.04 |
6.24 |
2.81 |
2.26 |
7.91 |
5.09 |
6.34 |
2.85 |
2.28 |
8.09 |
5.19 |
6.48 |
28.85 |
24 |
75.98 |
52.42 |
63.08 |
Рассчитаем выборочные средние Выборочные средние.
Коэффициент эластичности находится по формуле:
E = b = 0.43
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Вычислим эмпирическое корреляционное отношение
– высокая теснота связи
Рассчитаем индекс корреляции
- фактор x существенно влияет на y
Рассчитаем индекс детерминации
т.е. в 99.48 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 0.52 % изменения Y объясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
ln(x) |
ln(y) |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
2.3 |
2.04 |
2.04 |
0.0197 |
1.1E-5 |
0.1 |
0.00164 |
2.4 |
2.08 |
2.09 |
0.0105 |
4.7E-5 |
0.0506 |
0.00328 |
2.48 |
2.13 |
2.12 |
0.00264 |
0.000113 |
0.0212 |
0.00498 |
2.54 |
2.15 |
2.15 |
0.00127 |
4.0E-6 |
0.0062 |
0.00098 |
2.6 |
2.18 |
2.17 |
3.2E-5 |
1.0E-5 |
0.000431 |
0.00146 |
2.65 |
2.2 |
2.19 |
0.000386 |
4.5E-5 |
0.000924 |
0.00304 |
2.7 |
2.21 |
2.21 |
0.00109 |
0 |
0.0058 |
0.000296 |
2.74 |
2.23 |
2.23 |
0.00237 |
2.0E-6 |
0.0138 |
0.000611 |
2.78 |
2.25 |
2.25 |
0.00406 |
6.0E-6 |
0.0241 |
0.00106 |
2.81 |
2.26 |
2.26 |
0.0054 |
5.5E-5 |
0.0361 |
0.0033 |
2.85 |
2.28 |
2.28 |
0.00941 |
6.0E-6 |
0.0494 |
0.00103 |
28.85 |
24 |
24 |
0.0569 |
0.000298 |
0.31 |
0.0217 |
Изобразим фактические и расчётные значения фактора у.
t-статистика. Критерий Стьюдента.
t-статистика. Критерий Стьюдента.
Находим критическое значение t-критерия в таблице
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Рассчитаем фактическое значение данного критерия
Поскольку 41.32> 2.262, то статистическая значимость коэффициента регрессии b подтверждается.
Поскольку 39,32 > 2.262, то статистическая
значимость коэффициента
Определим
доверительные интервалы
(b - tкритSb; b + tкритSb)
(0.43 - 2.262 • 0.0103; 0.43 + 2.262 • 0.0103)
(0.4;0.45)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкритSa; a + tкрит Sa)
(1.06 - 2.262 • 0.0271; 1.06 + 2.262 • 0.0271)
(1;1.13)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
F-статистика.
Критерий Фишера для оценки
значимости всего уравнения
Определим определяют фактическое значение F-критерия:
Найдём табличное значение
Fтабл = 5.12
Поскольку фактическое значение F >Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
1.4 Построение степенной регрессии.
Степенное уравнение регрессии имеет вид y = axb (lny = lna + blnx)
Для расчета параметров коэффициентов уравнения построим расчетную таблицу
ln(x) |
ln(y) |
ln(x)2 |
y2 |
x • y |
2.3 |
2.04 |
5.29 |
4.17 |
4.7 |
2.4 |
2.08 |
5.75 |
4.32 |
4.99 |
2.48 |
2.13 |
6.14 |
4.54 |
5.28 |
2.54 |
2.15 |
6.47 |
4.61 |
5.46 |
2.6 |
2.18 |
6.77 |
4.74 |
5.66 |
2.65 |
2.2 |
7.04 |
4.85 |
5.84 |
2.7 |
2.21 |
7.28 |
4.91 |
5.98 |
2.74 |
2.23 |
7.51 |
4.97 |
6.11 |
2.78 |
2.25 |
7.72 |
5.04 |
6.24 |
2.81 |
2.26 |
7.91 |
5.09 |
6.34 |
2.85 |
2.28 |
8.09 |
5.19 |
6.48 |
28.85 |
24 |
75.98 |
52.42 |
63.08 |
Методом наименьших квадратов найдём параметры aи b
•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
11a + 28.85 b = 24
28.85 a + 75.98 b = 63.08
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.4258, a = 1.065
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 101.06497903x0.4258 = 11.61393x0.4258
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х. Коэффициент эластичности находится по формуле:
E = b = 0.43
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит дляизмерение тесноты зависимости
– сильная связь между
Величина индекса корреляции R находится в границах от 0 до 1. Чем ближе она к единице, тем теснее связь рассматриваемых признаков, тем более надежно уравнение регрессии.
Полученная величина свидетельствует о том, что фактор x существенно влияет на y
Рассчитаем индекс детерминации
т.е. в 99.48 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 0.52 % изменения Y объясняются факторами, не учтенными в модели.
Для оценки качества параметров регрессии построим расчетную таблицу
ln(x) |
ln(y) |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
2.3 |
2.04 |
2.04 |
0.0197 |
1.1E-5 |
0.1 |
0.00164 |
2.4 |
2.08 |
2.09 |
0.0105 |
4.7E-5 |
0.0506 |
0.00328 |
2.48 |
2.13 |
2.12 |
0.00264 |
0.000113 |
0.0212 |
0.00498 |
2.54 |
2.15 |
2.15 |
0.00127 |
4.0E-6 |
0.0062 |
0.00098 |
2.6 |
2.18 |
2.17 |
3.2E-5 |
1.0E-5 |
0.000431 |
0.00146 |
2.65 |
2.2 |
2.19 |
0.000386 |
4.5E-5 |
0.000924 |
0.00304 |
2.7 |
2.21 |
2.21 |
0.00109 |
0 |
0.0058 |
0.000296 |
2.74 |
2.23 |
2.23 |
0.00237 |
2.0E-6 |
0.0138 |
0.000611 |
2.78 |
2.25 |
2.25 |
0.00406 |
6.0E-6 |
0.0241 |
0.00106 |
2.81 |
2.26 |
2.26 |
0.0054 |
5.5E-5 |
0.0361 |
0.0033 |
2.85 |
2.28 |
2.28 |
0.00941 |
6.0E-6 |
0.0494 |
0.00103 |
28.85 |
24 |
24 |
0.0569 |
0.000298 |
0.31 |
0.0217 |