Автор работы: Пользователь скрыл имя, 18 Июня 2013 в 08:07, контрольная работа
Оцінка параметрів простої лінійної моделі методом найменших квадратів
Оцінити параметри простої лінійної регресії, знайти коефіцієнти кореляції та детермінації. Оцінити її адекватність.
Дисперсія:
Середньоквадратичне відхилення:
Коефіцієнт кореляції:
2) Для y и x2 :
Дисперсія:
Середньоквадратичне відхилення:
Коефіцієнт кореляції:
3) Для x1 и x2:
Дисперсія:
Середньоквадратичне відхилення:
Коефіцієнт кореляції:
Матриця парних коефіцієнтів кореляції.
- |
y |
x1 |
x2 |
y |
1 |
0.22 |
-0.12 |
x1 |
0.22 |
1 |
0.69 |
x2 |
-0.12 |
0.69 |
1 |
Аналіз першого рядка цієї матриці дозволяє зробити відбір факторних ознак, які можуть бути включені в модель множинної кореляційної залежності. Факторні ознаки, у яких ryxi < 0.5 виключають з моделі.
Колінеарність – залежність між факторами. В якості критерію мультиколінеарності може бути прийнято дотримання наступних нерівностей:
r(xjy) > r(xkxj) ; r(xky) > r(xkxj).
Якщо одне з нерівностей не дотримується, то виключається той параметр xk або xj, зв'язок якого з результативним показником Y виявляється найменш тісною.
Коефіцієнт частинної кореляції відрізняється від простого коефіцієнта лінійної парної кореляції тим, що він вимірює парну кореляцію відповідних ознак (y i xi) за умови, що вплив на них інших факторів (xj) усунуто.
- Тіснота зв'язку не сильна.
- Тіснота зв'язку не сильна.
- Тіснота зв'язку не сильна.
- Тіснота зв'язку сильна.
- Тіснота зв'язку не сильна.
- Тіснота зв'язку сильна.
3. Аналіз параметрів рівняння регресії.
Перейдемо до статистичного
аналізу отриманого рівняння регресії:
перевірці значимості рівняння і
його коефіцієнтів, дослідженню абсолютних
і відносних помилок
Для незміщеної оцінки дисперсії проробимо наступні обчислення: незміщена помилка ε = Y - Y(x) = Y - X*s (абсолютна помилка апроксимації).
Y |
Y(x) |
ε |
(Y-Yср)2 |
9 |
11.77 |
-2.77 |
17.64 |
10 |
12.19 |
-2.19 |
10.24 |
14 |
13.06 |
0.94 |
0.64 |
15 |
12.19 |
2.81 |
3.24 |
12 |
12.56 |
-0.56 |
1.44 |
19 |
15.17 |
3.83 |
33.64 |
13 |
13.35 |
-0.35 |
0.04 |
11 |
15.51 |
-4.51 |
4.84 |
14 |
13.35 |
0.65 |
0.64 |
15 |
12.86 |
2.14 |
3.24 |
0 |
0 |
0 |
75.6 |
se2 = (Y - X*s)T(Y - X*s) = 61.6879
Незміщена оцінка дисперсії дорівнює:
Оцінка середньоквадратичного відхилення дорівнює (стандартна помилка для оцінки Y):
Знайдемо оцінку коваріаціонной матриці вектора k = S • (XTX)-1:
Дисперсії параметрів моделі визначаються співвідношенням S 2i = Kii, тобто це елементи, що лежать на головній діагоналі.
З метою розширення можливостей змістовного аналізу моделі регресії використовуються частинні коефіцієнти еластичності, які визначаються за формулою:
;
Частинний коефіцієнт еластичності E1 < 1. Отже, його вплив на результативну ознаку Y незначний.
Частинний коефіцієнт еластичності E2 < 1. Отже, його вплив на результативну ознаку Y незначний.
Тісноту сукупного впливу факторів на результат оцінює індекс множинної кореляції (від 0 до 1).
Зв'язок між ознакою Y факторами X слабкий.
Значимість коефіцієнта кореляції.
По таблиці Стьюдента знаходимо Tтабл:
Tкрит(n-m-1;a) = (7;0.05) = 1.895
Оскільки Tнабл < Tкрит, то приймаємо гіпотезу про рівність 0 коефіцієнта кореляції. Іншими словами, коефіцієнта кореляції статистично - не значущий.
Інтервальна оцінка для коефіцієнта кореляції (довірчий інтервал).
Довірчий інтервал для коефіцієнта кореляції:
r(-0.0599;0.918)
Коефіцієнт детермінації:
R2= 0.432 = 0.1841
тобто в 18.41 % випадків зміни х призводять до зміни y. Іншими словами - точність підбору рівняння регресії – низька.
4. Оцінка значення
результативної ознаки при
Y(0.0,0.0,) = 11.55 + 0.4153 * 0.0-0.8703 * 0.0 = 11.55
Довірчі інтервали з ймовірністю 0.95 для середнього значення результативної ознаки M(Y).
S2 = X0T(XTX)-1X0, де
X0T = [ 1 ; 0.0 ; 0.0]
(XTX)-1
1.87 |
-0.0886 |
-0.0684 |
-0.0886 |
0.0134 |
-0.0217 |
-0.0684 |
-0.0217 |
0.0731 |
X0 :
1 |
0 |
0 |
Множимо матриці, знаходимо S2 = 1.87.
(Y – t*SY ; Y + t*SY )
(11.55 – 1.895*4.06 ; 11.55 + 1.895*4.06)
(3.86;19.24)
C ймовірністю 0.95 середнє значення Y при X0i знаходиться у зазначених межах.
Довірчі інтервали з ймовірністю 0.95 для індивідуального значення результативної ознаки.
(11.55 – 1.895*5.03 ; 11.55 + 1.895*5.03)
(2.02;21.08)
C ймовірністю 0.95 індивідуальне значення Y при X0i знаходиться у зазначених межах.
5. Перевірка
гіпотез щодо коефіцієнтів
1) t-статистика
Tтабл (n-m-1;a) = (7;0.05) = 1.895
Статистична значимість коефіцієнта регресії b0 підтверджується.
Статистична значимість коефіцієнта регресії b1 підтверджується.
Статистична значимість коефіцієнта регресії b2 не підтверджується.
Довірчий інтервал для коефіцієнтів рівняння регресії.
Визначимо довірчі інтервали коефіцієнтів регресії, які з надійність 95% будуть наступними:
(bi - ti Sbi; bi + ti Sbi)
b0: (11.553 - 1.895 • 2.3589 ; 11.553 + 1.895 • 2.3589) = (7.0829;16.0231)
b1: (0.4153 - 1.895 • 0.1993 ; 0.4153 + 1.895 • 0.1993) = (0.0376;0.793)
b2: (-0.8703 - 1.895 • 0.4657 ; -0.8703 + 1.895 • 0.4657) = (-1.7528;0.0121)
2) F-статистика. Критерій Фішера
Табличне значення при ступенях свободи k1 = 2 i k2 = n-m-1 = 7, Fkp(2;7) = 4.74.
Оскільки фактичне значення F < Fkp, то коефіцієнт детермінації статистично не значущий і рівняння регресії статистично ненадійно.
Використовуючи показники ефективності роботи локомотивного депо, розрахувати параметри моделі степеневої залежності.
Використовуючи метод екстраполяція знайти прогнозні дані для наступного року динамічного ряду.
Показник |
Роки | ||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 | |
Продуктивність локомотива у вантажному русі, тис. т-км |
2319 |
2335 |
2355 |
2367 |
2350 |
2380 |
2386 |
Рішення
При виборі виду функції тренда можна скористатися методом кінцевих різниць (обов'язковою умовою застосування даного підходу є рівність інтервалів між рівнями ряду).
Кінцевими різницями першого порядку є різниці між послідовними рівнями ряду:
Δ1t = Yt - Yt-1
Кінцевими різницями другого порядку є різниці між послідовними кінцевими різницями 1-го порядку:
Δ2t = Δ1t - Δ1t-1
Кінцевими різницями j-го
порядку є різниці між послідов
Δjt = Δj-1t - Δj-1t-1
Якщо загальна тенденція виражається лінійним рівнянням Y = a + bt, тоді кінцеві різниці першого порядку постійні: Δ12 = Δ13 = ... = Δ1n, а різниці другого порядку дорівнюють нулю.
Якщо загальна тенденція виражається параболою другого порядку: Y = a+ bt + ct2, то отримаємо постійними кінцеві різниці другого порядку: Δ23 = Δ24 = ... = Δ2n, нульовими - різниці третього порядку.
Якщо приблизно постійними виявляються темпи зростання, то для вирівнювання застосовується показова функція.
При виборі форми рівняння слід виходити з обсягу наявної інформації. Чим більше параметрів містить рівняння, тим більше має бути спостережень при одній і тій же мірі надійності оцінювання.
Вибір форми кривої може здійснюватися і на основі прийнятого критерію якості рівняння регресії, в якості якого може служити сума квадратів відхилень фактичних значень рівня ряду від значень рівнів, розрахованих за рівнянням тренду.
Із сукупності кривих вибирається та, якій відповідає мінімальне значення критерію. Іншим статистичним критерієм є коефіцієнт множинної детермінації R2.
yi |
Δ1t |
Δ2t |
Темп росту |
2319 |
- |
- |
- |
2335 |
16 |
- |
1.01 |
2355 |
20 |
4 |
1.01 |
2367 |
12 |
-8 |
1.01 |
2350 |
-17 |
-29 |
0.99 |
2380 |
30 |
47 |
1.01 |
2386 |
6 |
-24 |
1 |
Ступінь рівняння тренду має вигляд y = a tb (ln y = ln a + b ln t).
1. Знаходимо
параметри рівняння методом
Система рівнянь МНК:
a0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y•t
Для наших даних система рівнянь має вигляд:
7a0 + 8.53a1 = 54.35
8.53a0 + 13.2a1 = 66.23
З першого рівняння висловлюємо а0 і підставимо в друге рівняння
Отримуємо a0 = 0.0138, a1 = 7.75.
Рівняння тренду:
y = 2316.62t0.0138
Емпіричні коефіцієнти тренду a i b є лише оцінками теоретичних коефіцієнтів βi, а саме рівняння відображає лише загальну тенденцію в поведінці розглянутих змінних.
Коефіцієнт тренда b статечної функції є відносний показник сили зв'язку, або коефіцієнт еластичності. Він показує, на скільки відсотків зміниться в середньому значення результативного ознаки при зміні періоду t на 1%.