Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа
Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .
Для вычисления коэффициентов используется МНК.
a1= 2,933; a0 = 31,222
Уравнение тренда имеет вид: Y(t) = 31,222 + 2,933 ∙ t
Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна.
Проверка адекватности модели реальному явлению является важным этапом прогнозирования социально - экономических процессов. Для этого исследуют ряд остатков , т.е. отклонения расчетных значений от фактических данных.
Таблица 17 Расчет случайной величины
t |
E(t) |
Точки поворота |
E2(t) |
(E(t)- E(t+1))2 |
|E(t)|/Y(t) |
1 |
0,84 |
0,71 |
0,871 |
2,41% | |
2 |
-0,09 |
* |
0,01 |
0,004 |
0,24% |
3 |
-0,02 |
* |
0,00 |
3,738 |
0,06% |
4 |
-1,96 |
* |
3,82 |
1,138 |
4,77% |
5 |
-0,89 |
0,79 |
9,404 |
1,98% | |
6 |
2,18 |
* |
4,74 |
3,738 |
4,27% |
7 |
0,24 |
* |
0,06 |
0,004 |
0,47% |
8 |
0,31 |
* |
0,10 |
0,871 |
0,57% |
9 |
-0,62 |
0,39 |
1,09% | ||
∑ |
0,00 |
6 |
10,62 |
19,77 |
15,85% |
1. Проверка условия случайности возникновения отдельных отклонений от тренда.
Для проверки случайности уровней ряда может быть использован критерий «пиков», или критерий поворотных точек.
Рисунок 3 - График случайной величины εt
Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как
где р – фактическое количество поворотных точек в случайном ряду; 1,96 – квантиль нормального распределения для 5%-го уровня значимости. Квадратные скобки здесь так же означают, что от результата вычисления следует взять целую часть.
p0 = [1,95] = 1.
Случайная величина E(t) содержит как положительные, так и отрицательные значения. Число поворотных точек p = 6.
Так как неравенство p = 6 > po = 1 соблюдается, то ряд остатков можно считать случайным (т.е. он содержит регулярную компоненту).
2. Проверка соответствия
ряда остатков нормальному
где и - максимальный и минимальный уровни ряда остатков;
- несмещенная оценка среднеквадратического отклонения ряда остатков
S = 1,152; RS = (2,18 - (-1,96))/1,152 = 3,587
Так как расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности: RS = 3,587 > 3,54, то гипотеза о нормальном распределении ряда остатков не принимается. (Для n = 9 и 5%-ного уровня значимости α интервал равен (2,58; 3,54)).
3. Для проверки отсутствия
автокорреляции используется
Под автокорреляцией понимается зависимость последующих уровней ряда от предыдущих.
При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия Дарбина–Уотсона по формуле:
d0 = 19,77/10,62 = 1,861
d0 = 1,861 < 2, d = = 1,861. Значение случайной величины d сравнивается с критическими числами d1 = 1,08; d2 = 1,36. Исходя из неравенства d = 1,861 > d2 = 1,36, автокорреляция ряда отсутствует.
Так как все пункты проверки, кроме второго, дают положительный результат, то выбранная трендовая модель является не полностью адекватной. Необходимо осуществить оценку точности модели прогноза.
Оценка точности линейной модели тренда.
Вычислим среднюю
средняя относительная ошибка: Еотн = 1/ n ∙ ∑|Еmax| / Yt ∙100%
Еотн = 1,76 %
Модель имеет
Построим точечный и доверительный прогноз на два шага вперед для Y(t). Для точечного прогноза необходимо подставить вместо значения t в уравнение модели Y(t) = 31,222 + 2,933 ∙ t значения t =10;11
Yp(10) = 31,222 + 2,933 ∙ 10 = 60,56
Yp(11) = 31,222 + 2,933 ∙ 11 = 63,49
Для доверительного прогноза необходимо вычислить U = S ∙ t1-L, N-2 = 2,73.
S = 1,152; t1-L, N-2 = 2,37
Yp(10) (60,56 - 2,73; 60,56 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (57,82; 63,29).
Yp(11) (63,49 - 2,73; 63,49 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (60,76; 66,22).
Для проверки используем надстройку Excel «Анализ данных». В диалоговом окне Анализ данных необходимо выбрать инструмент Регрессия. В диалоговом окне Регрессия в поле Входной интервал Y нужно ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х - адрес диапазона, который содержат значения независимой переменной t Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Рисунок 4 - Диалоговое окно Регрессия
Таблица 18 Проверка расчетов с помощью Excel
Коэффициенты |
Стандартная ошибка |
t-статистика | ||
Y-пересечение |
A0 |
31,22222 |
0,89492 |
34,88828 |
t |
A1 |
2,933333 |
0,159031 |
18,44499 |
Таблица 19 Вывод остатка
Наблюдение |
Предсказанное Y(t) |
Остатки |
1 |
34,15556 |
0,844444 |
2 |
37,08889 |
-0,08889 |
3 |
40,02222 |
-0,02222 |
4 |
42,95556 |
-1,95556 |
5 |
45,88889 |
-0,88889 |
6 |
48,82222 |
2,177778 |
7 |
51,75556 |
0,244444 |
8 |
54,68889 |
0,311111 |
9 |
57,62222 |
-0,62222 |
Во втором столбце таблицы 17 содержатся коэффициенты уравнения регрессии a0, a1, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом – t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Предсказанные значения и остатки полностью совпадают с рассчитанными.
Регрессионная модель: Y(t) = a0+a1 ∙ x(t)
Таблица 20 Расчет показателей регрессионной модели
t |
Y(t) |
X(t) |
Yp(t) | |||||
1 |
35 |
65 |
6 |
-10,89 |
118,57 |
36 |
-65,333 |
38,22 |
2 |
37 |
67 |
8 |
-8,89 |
79,01 |
64 |
-71,111 |
35,66 |
3 |
40 |
63 |
4 |
-5,89 |
34,68 |
16 |
-23,556 |
40,78 |
4 |
41 |
60 |
1 |
-4,89 |
23,90 |
1 |
-4,889 |
44,61 |
5 |
45 |
56 |
-3 |
-0,89 |
0,79 |
9 |
2,667 |
49,72 |
6 |
51 |
53 |
-6 |
5,11 |
26,12 |
36 |
-30,667 |
53,56 |
7 |
52 |
57 |
-2 |
6,11 |
37,35 |
4 |
-12,222 |
48,45 |
8 |
55 |
59 |
0 |
9,11 |
83,01 |
0 |
0,000 |
45,89 |
9 |
57 |
51 |
-8 |
11,11 |
123,46 |
64 |
-88,889 |
56,11 |
Итого |
413 |
531 |
0 |
0,00 |
526,89 |
230 |
-294,000 |
413,00 |
Среднее значение |
45,9 |
59 |
0 |
0,00 |
58,54 |
25,56 |
-32,667 |
45,89 |
Для вычисления коэффициентов используются формулы:
a1 = ∑(
a1= -1,278; a0 = 121,31
Уравнение регрессии имеет вид: Y(t) = 121,31 - 1,278 ∙ x (t)
Коэффициент a1= - 1,278 выражает величину изменения признака y при изменении фактора x на 1 единицу измерения (%). Так как a1 < 0, между факторами существует обратная связь.
Величина влияния фактора x на y оценивается с помощью коэффициента корреляции (связи). Коэффициент корреляции Rxy = - 0,713. Таким образом, связь между y и x обратная, устойчивая, высокая.
Покажем, что построенная модель адекватна и может быть использована для прогноза.
Таблица 21 Расчет случайной величины
t |
E(t) |
Точки поворота |
E2(t) |
(E(t)- E(t +1))2 |
|E(t)|/Y(t) |
1 |
-3,22 |
10,36 |
20,762 |
9,20% | |
2 |
1,34 |
* |
1,79 |
4,465 |
3,61% |
3 |
-0,78 |
0,60 |
8,036 |
1,94% | |
4 |
-3,61 |
13,04 |
1,239 |
8,81% | |
5 |
-4,72 |
* |
22,31 |
4,688 |
10,50% |
6 |
-2,56 |
6,55 |
37,369 |
5,02% | |
7 |
3,55 |
12,64 |
30,875 |
6,84% | |
8 |
9,11 |
* |
83,01 |
67,669 |
16,57% |
9 |
0,89 |
0,78 |
- |
1,55% | |
∑ |
0,00 |
3 |
151,08 |
175,10 |
64,03% |