Автор работы: Пользователь скрыл имя, 18 Июня 2013 в 08:07, контрольная работа
Оцінка параметрів простої лінійної моделі методом найменших квадратів
Оцінити параметри простої лінійної регресії, знайти коефіцієнти кореляції та детермінації. Оцінити її адекватність.
Помилка апроксимації.
Оцінимо якість рівняння тренда за допомогою помилки абсолютної апроксимації.
Помилка апроксимації в межах 5%-7% свідчить про хороше підборі рівняння тренда до вихідних даних.
Оскільки помилка менше 7%, то дане рівняння можна використовувати як тренда.
Однофакторний дисперсійний аналіз.
Середні значення:
Дисперсія:
Середньоквадратичне відхилення:
Коефіцієнт еластичності являє собою показник сили зв'язку фактора t з результатом у, який показує, на скільки відсотків зміниться значення у при зміні значення фактора на 1%.
E = b = $ar
Коефіцієнт еластичності менше 1. Отже, при зміні t на 1%, Y зміниться менш ніж на 1%. Іншими словами - вплив t на Y не істотно.
Емпіричне кореляційне відношення обчислюється для всіх форм зв'язку і служить для вимірювання тісноти залежності. Змінюється в межах [0;1].
, де
На відміну від лінійного коефіцієнта кореляції він характеризує тісноту нелінійної зв'язку і не характеризує її напрямок. Змінюється в межах [0;1].
Зв'язки між ознаками можуть бути слабкими і сильними (тісними). Їх критерії оцінюються за шкалою Чеддока:
0.1 < η < 0.3: слабкий;
0.3 < η < 0.5: помірний;
0.5 < η < 0.7: помітний;
0.7 < η < 0.9: високий;
0.9 < η < 1: дуже високий;
Отримана величина свідчить про те, що зміна часового періоду t істотно впливає на y.
Індекс детермінації:
тобто в 100% випадків впливає на зміну даних. Іншими словами - точність підбору рівняння тренда - висока.
ln(t) |
ln(y) |
t 2 |
y 2 |
t•y |
y(t) |
(y-y cp) 2 |
(y-y(t))2 |
(t-t p) 2 |
(y-y(t)) : y |
0 |
7.75 |
0 |
60.05 |
0 |
7.75 |
0.0002 |
0 |
1.48 |
0.0001 |
0.69 |
7.76 |
0.48 |
60.15 |
5.38 |
7.76 |
0 |
0 |
0.28 |
0.0002 |
1.1 |
7.76 |
1.21 |
60.28 |
8.53 |
7.76 |
0 |
0 |
0.0142 |
0.0002 |
1.39 |
7.77 |
1.92 |
60.36 |
10.77 |
7.77 |
0 |
0 |
0.0284 |
0.0003 |
1.61 |
7.76 |
2.59 |
60.25 |
12.49 |
7.77 |
0 |
0 |
0.15 |
0.001 |
1.79 |
7.77 |
3.21 |
60.45 |
13.93 |
7.77 |
0.0001 |
0 |
0.33 |
0.0003 |
1.95 |
7.78 |
3.79 |
60.49 |
15.13 |
7.77 |
0.0001 |
0 |
0.53 |
0.0003 |
8.53 |
54.35 |
13.2 |
422.03 |
66.23 |
54.35 |
0.0004 |
0 |
2.81 |
0.0025 |
2. Аналіз точності визначення оцінок параметрів рівняння тренду.
де m = 1 - кількість факторів, що впливають в моделі тренда.
Аналіз точності визначення оцінок параметрів рівняння тренду:
S b = 0
Довірчі інтервали для залежної змінної:
По таблиці Стьюдента знаходимо Tтабл:
Tтабл (n-m-1;α/2) = (5;0.025) = 2.571
Розрахуємо межі інтервалу, в якому буде зосереджено 95% можливих значень Y при необмежено великому числі спостережень і t = 1.
(7.75 10.01 - 2.571*0 ; 7.75 10.01 + 2.571*0)
(2316.62;2316.62)
Інтервальний прогноз.
Визначимо середньоквадратичне помилку прогнозованого показника.
m = 1 - кількість факторів,
що впливають в рівнянні
де L - період попередження; уn+L - точковий прогноз за моделлю на (n + L)-й момент часу; n - кількість спостережень в тимчасовому ряді; Sy - стандартна помилка прогнозованого показника; Tтабл - табличне значення критерію Стьюдента для рівня значущості α і для числа ступенів свободи, рівного n-2.
Точковий прогноз, t = 8: y(8) = 7.75*80.01 = 2384.08
K1 = 0
2384.08 - 0 = 2384.08 ; 2384.08 + 0 = 2384.08
Iнтервальний прогноз:
t = 8: (2384.08;2384.08)
Точковий прогноз, t = 9: y(9) = 7.75*90.01 = 2387.96
K2 = 0
2387.96 - 0 = 2387.96 ; 2387.96 + 0 = 2387.96
Iнтервальний прогноз:
t = 9: (2387.96;2387.96)
3. Перевірка
гіпотез щодо коефіцієнтів
1) t-статистика. Критерій Стьюдента.
;
Статистична значимість коефіцієнта b підтверджується.
;
Статистична значимість коефіцієнта a підтверджується.
Довірчий інтервал для коефіцієнтів рівняння тренда.
Визначимо довірчі інтервали коефіцієнтів тренда, які з надійність 95% будуть наступними:
(b - tнабл Sb; b + tнабл Sb)
(0.0138 - 2.571•0; 0.0138 + 2.571•0)
(0.0135;0.0141)
(a - t набл S a; a + t набл S a)
(7.75 - 2.571•0; 7.75 + 2.571•0)
(7.7476;7.7481)
2) F-статистика. Критерій Фішера.
Fkp = 6.61
де m - кількість чинників в рівнянні тренду (m=1).
Оскільки F < Fkp, то коефіцієнт детермінації (і в цілому рівняння тренда) статистично не значущий.
2. Коефіцієнт автокореляції.
Якщо коефіцієнт автокореляції rei < 0.5, то є підстави стверджувати, що автокореляція відсутня.
3. Критерій Дарбіна-Уотсона.
Цей критерій є найбільш
відомим для виявлення
При статистичному аналізі рівняння регресії на початковому етапі часто перевіряють здійснимість однієї передумови: умови статистичної незалежності відхилень між собою.
y |
y(x) |
ei = y-y(x) |
e2 |
(ei - ei-1)2 |
7.75 |
7.75 |
0.001 |
0 |
0 |
7.76 |
7.76 |
-0.0017 |
0 |
0 |
7.76 |
7.76 |
0.0013 |
0 |
0 |
7.77 |
7.77 |
0.0024 |
0 |
0 |
7.76 |
7.77 |
-0.0079 |
0.0001 |
0.0001 |
7.77 |
7.77 |
0.0023 |
0 |
0.0001 |
7.78 |
7.77 |
0.0026 |
0 |
0 |
0.0001 |
0.0002 |
Для аналізу корелірованності відхилень використовують статистику Дарбіна-Уотсона:
Критичні значення d1 i d2 визначаються на основі спеціальних таблиць для необхідного рівня значущості α, числа спостережень n = 7 та кількості пояснюють змінних m=1.
Автокореляція відсутня, якщо виконується така умова:
d1 < DW и d2 < DW < 4 - d2.
Не звертаючись до
таблиць, можна користуватися
Для більш надійного виведення доцільно звертатися до табличних значень.
По таблиці Дарбіна-Уотсона для n=7 i k=1 (рівень значимості 5%) знаходимо: d1 = 1.08; d2 = 1.36.
Оскільки 1.08 < 2.64 i 1.36 < 2.64 < 4 - 1.36, то автокореляція залишків присутня.
Перевірка наявності гетероскедастичності за допомогою тесту рангової кореляції Спірмена.
Привласнимо ранги ознакою ei і фактору X. Знайдемо суму різниці квадратів d2.
За формулою обчислимо коефіцієнт рангової кореляції Спірмена.
X |
ei |
ранг X, dx |
ранг ei, dy |
(dx - dy)2 |
0 |
-0.001 |
1 |
5 |
16 |
0.69 |
0.0017 |
2 |
6 |
16 |
1.1 |
-0.0013 |
3 |
4 |
1 |
1.39 |
-0.0024 |
4 |
2 |
4 |
1.61 |
0.0079 |
5 |
7 |
4 |
1.79 |
-0.0023 |
6 |
3 |
9 |
1.95 |
-0.0026 |
7 |
1 |
36 |
86 |
Зв'язок між ознакою ei і фактором X помірний і зворотній.
Значимість коефіцієнта рангової кореляції Спірмена:
По таблиці Стьюдента знаходимо tтабл:
tтабл (n-m-1;α/2) = (5;0.05/2) = 2.571
не значущий Tнабл < tтабл, то приймаємо гіпотезу про рівність 0 коефіцієнт рангової кореляції. Іншими словами, коефіцієнт рангової кореляції статистично - не значущий.
Інтервальна оцінка для коефіцієнта кореляції (довірчий інтервал).
Довірчий інтервал для коефіцієнта рангової кореляції.
r(-1.2286;0.1572)
Перевіримо гіпотезу H0: гетероскедастичності відсутня.
Оскільки 2.571 > 1.42, то гіпотеза
про відсутність