Автор работы: Пользователь скрыл имя, 03 Февраля 2014 в 22:58, практическая работа
Имеются следующие данные: ... 1) Найти коэффициенты парной корреляции и и выбрать фактор наиболее тесно связанный с зависимой переменной y(t). 2) Для выбранного фактора построить линейную однопараметрическую модель регрессии . 3) Проверить модель на адекватность и оценить ее точность. 4) Построить точечный и интервальный прогноз на два шага вперед по модели регрессии. 5) Отобразить на графиках фактические данные, результаты расчетов и прогнозирования.
Практическое задание
Имеются следующие данные:
Y(t) |
82 |
79 |
78 |
72 |
69 |
70 |
64 |
61 |
59 |
X1(t) |
25 |
27 |
26 |
29 |
32 |
32 |
30 |
33 |
35 |
X2(t) |
32 |
34 |
38 |
40 |
42 |
46 |
50 |
52 |
53 |
Решение:
Таблица №1
t |
X1(t) |
X2(t) |
Y(t) |
[X1(t)-X1ср]2 |
[X2(t)-X2ср]2 |
[Y(t)- Yср]2 |
[X1(t)- X1ср]∙[Y(t)- Yср] |
[X2(t)- X2ср]∙[Y(t)- Yср] |
1 |
25 |
32 |
82 |
23,90 |
121,00 |
133,53 |
-56,49 |
-127,11 |
2 |
27 |
34 |
79 |
8,35 |
81,00 |
73,20 |
-24,72 |
-77,00 |
3 |
26 |
38 |
78 |
15,12 |
25,00 |
57,09 |
-29,38 |
-37,78 |
4 |
29 |
40 |
72 |
0,79 |
9,00 |
2,42 |
-1,38 |
-4,67 |
5 |
32 |
42 |
69 |
4,46 |
1,00 |
2,09 |
-3,05 |
1,44 |
6 |
32 |
46 |
70 |
4,46 |
9,00 |
0,20 |
-0,94 |
-1,33 |
7 |
30 |
50 |
64 |
0,01 |
49,00 |
41,53 |
-0,72 |
-45,11 |
8 |
33 |
52 |
61 |
9,68 |
81,00 |
89,20 |
-29,38 |
-85,00 |
9 |
35 |
53 |
59 |
26,12 |
100,00 |
130,98 |
-58,49 |
-114,44 |
Σ |
269 |
387 |
634 |
92,89 |
476,00 |
530,22 |
-204,56 |
-491,00 |
Где ; ; ;
Вычислим коэффициенты парной корреляции, используя формулу:
Тогда коэффициенты парной корреляции равны:
;
Полученные значения
коэффициентов парной
;
.
- выборочное уравнение прямой регрессии Y на X2.
3) Оценим качество построенной модели, исследовав ее адекватность и точность.
Составим
расчетную таблицу №2:
t |
Y(t) |
Yр(t) |
E(t)=Y(t)- -Yp(t) |
Точки поворота |
E2(t) |
E(t)-E(t-1) |
[E(t)-E(t-1)]2 |
|
1 |
82 |
81,79 |
0,21 |
- |
0,04 |
- |
- |
0,51 |
2 |
79 |
79,73 |
-0,73 |
1 |
0,53 |
-0,94 |
0,88 |
0,00 |
3 |
78 |
75,60 |
2,40 |
1 |
5,75 |
3,13 |
9,77 |
6,15 |
4 |
72 |
73,54 |
-1,54 |
0 |
2,37 |
-3,94 |
15,50 |
0,00 |
5 |
69 |
71,48 |
-2,48 |
1 |
6,13 |
-0,94 |
0,88 |
0,00 |
6 |
70 |
67,35 |
2,65 |
1 |
7,02 |
5,13 |
26,28 |
7,57 |
7 |
64 |
63,22 |
0,78 |
0 |
0,60 |
-1,87 |
3,51 |
2,43 |
8 |
61 |
61,16 |
-0,16 |
0 |
0,03 |
-0,94 |
0,88 |
0,00 |
9 |
59 |
60,13 |
-1,13 |
- |
1,28 |
-0,97 |
0,94 |
0,00 |
Σ |
634 |
634,00 |
0,00 |
4 |
23,75 |
58,63 |
16,66 |
Значения Yр(t) получены из выборочного уравнения прямой регрессии Y на X2
а) Математическое ожидание отклонений равно нулю: M(E)=0,00 (см.4-ый столбец таблицы№2).
б) Проверим на случайность с помощью критерия поворотных точек: каждый уровень ряда остатков сравним с соседними. Если он больше обоих соседних уровней, или меньше их обоих, то ему соответствует поворотная точка и присваивается значение 1. В противном случае – присваивается значение 0. В случайном ряду должно выполняться неравенство:
В нашем случае N=9 и имеем
.
Таким образом, p=4>2.4 и в соответствии с критерием поворотных точек последовательность уровней остатков ряда является случайной.
в) Проверим независимость (отсутствие автокорреляции уровней ряда остатков) с помощью d-критерия Дарбина-Уотсона:
.
По критерию найденное значение необходимо сравнить с двумя табличными. Для N=9 имеем ; . Таким образом, , и в соответствии с критерием Дарбина-Уотсона уровни независимы.
г) Проверим соответствие ряда остатков нормальному закону распределения с помощью RS –критерия: . Для N=9 и при 5% уровне значимости значение RS должно попасть в интервал (2,7 ; 3,7). В нашем случае это условие выполняется. Следовательно, гипотеза о нормальном законе распределения остатков принимается.
e) Оценим точность модели с помощью средней ошибки аппроксимации:
%. Полученное значение меньше 10%, что говорит об адекватности модели.
4) Построим точечный и интервальный прогноз на два шага вперед по модели регрессии.
В начале построим точечный прогноз на два шага вперед для : и на основании среднего абсолютного прироста: .
Таким образом,
.
Точечный прогноз для построим на основании полученных значений и и уравнения регрессии :
Доверительный интервал
где .
Значение находим по таблице критических точек распределения Стъюдента при доверительной вероятности p=0,7 и n=N-2=9-2=7 степенях свободы.
Тогда
В итоге получаем:
t |
Yp(t) |
Нижняя граница |
Верхняя граница |
10 |
55,625 |
55,625 – 2,25 = 53,375 |
55,625 + 2,25 = 57,875 |
11 |
58,25 |
58,25 – 2,44= 55,81 |
58,25 + 2,44= 60,69 |
5) Отобразим на графиках фактические данные, результаты расчетов и прогнозирования.
Вывод: Факторы x1(t) и x2(t) оказывают существенное влияние на результативный признак y(t). Наиболее тесно с y(t) связан фактор x2(t). Существующая между ними обратная линейная зависимость имеет вид: . Полученное уравнение имеет приемлемую точность и может быть использовано для прогнозирования.