Автор работы: Пользователь скрыл имя, 16 Января 2014 в 15:52, контрольная работа
Линейная модель множественной регрессии имеет вид:
,
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.
Оценим значимость модели в целом на основе вычисления F-критерия Фишера.
По данным дисперсионного анализа F = 129,268
Табличное значение F-критерия со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений), k = 1 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()
F табл = 4,19597
Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.
Определим среднюю относительную ошибку аппроксимации
Поскольку Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.
Сравним модель со значимыми факторами (двухфакторную) и однофакторную модель с наиболее значимым фактором.
Двухфакторная модель |
Однофакторная модель |
y = -4,5414 + 0,3445 x1 + 1,1026 x2 |
y = 2,934 + 0,412 x1 |
|
|
R = 0,9265 |
R = 0,9066 |
F = 81,8519 |
F = 129,268 |
Средняя относительная ошибка аппроксимации Еотн.ср. в двухфакторной модели несколько лучше.
Коэффициент множественной корреляции R в двухфакторной модели несколько лучше.
Чем ближе величина R к единице, тем теснее выбранный вид функции связывает между собой факторные переменные и исследуемый признак, тем лучше качество модели.
Чем больше расчётное значение F-критерия, тем лучше качество модели.
F-критерий Фишера значительно лучше в однофакторной модели, следовательно модель, в которой цена квартиры зависит только от общей площади квартиры (однофакторная) обладает лучшим качеством.
5. Осуществим прогнозирование
(для однофакторной модели) среднего
значения показателя Y при условии,
что прогнозное значения
Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:
Для однофакторной модели максимальное значение Х = 137,7*80% = 110,16
Доверительный интервал прогноза зависит от стандартной ошибки, удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза α :
Стандартная ошибка Sст = 4,397 (по данным таблицы 6)
t0,1 = СТЬЮДРАСПОБР(0,1; 28) = 1,701
Доверительный интервал L = 1,32
Тогда фактические значения исследуемого признака с вероятностью (1-α) попадут в интервал
6. Представим графически:
фактические и модельные
Таблица 7 - Прогнозирование |
|||||||
№ п/п |
Фактическое y - цена |
x1 – общая площадь |
Предсказанное y - цена | ||||
1 |
15,9 |
39 |
19,01444394 | ||||
2 |
27 |
68,4 |
31,13647903 | ||||
3 |
13,5 |
34,8 |
17,28272464 | ||||
4 |
15,1 |
39 |
19,01444394 | ||||
5 |
21,1 |
54,7 |
25,4877756 | ||||
6 |
28,7 |
74,7 |
33,73405798 | ||||
7 |
27,2 |
71,1 |
32,24972715 | ||||
8 |
28,3 |
74,5 |
33,65159516 | ||||
9 |
52,3 |
137,7 |
59,70984747 | ||||
10 |
22 |
40 |
19,42675806 | ||||
11 |
28 |
53 |
24,7868416 | ||||
12 |
45 |
86 |
38,39320752 | ||||
13 |
51 |
98 |
43,34097695 | ||||
14 |
34,4 |
62,6 |
28,74505714 | ||||
15 |
24,7 |
45,3 |
21,61202289 | ||||
16 |
30,8 |
56,4 |
26,18870961 | ||||
17 |
15,9 |
37 |
18,1898157 | ||||
18 |
29 |
67,5 |
30,76539633 | ||||
19 |
15,4 |
37 |
18,1898157 | ||||
20 |
28,6 |
69 |
31,3838675 | ||||
21 |
15,6 |
40 |
19,42675806 | ||||
22 |
27,7 |
69,1 |
31,42509892 | ||||
23 |
34,1 |
68,1 |
31,0127848 | ||||
24 |
37,7 |
75,3 |
33,98144645 | ||||
25 |
41,9 |
83,7 |
37,44488505 | ||||
26 |
24,4 |
48,7 |
23,01389089 | ||||
27 |
21,3 |
39,9 |
19,38552665 | ||||
28 |
36,7 |
68,6 |
31,21894186 | ||||
29 |
21,5 |
39 |
19,01444394 | ||||
30 |
26,4 |
48,6 |
22,97265948 | ||||
31 |
110,16 |
48,355 | |||||
Таблица 8 – Результаты прогнозных оценок | |||||||
Прогнозируемое значение |
48,355 | ||||||
Уровень значимости |
0,1 | ||||||
Стандартная ошибка |
4,396788203 | ||||||
Размер выборки |
30 | ||||||
Число степеней свободы |
28 | ||||||
Табличное t-статистики Стьюдента |
1,701130908 | ||||||
Доверительный интервал |
1,320389844 | ||||||
Нижняя граница y |
47,034 | ||||||
Верхняя граница y |
49,675 |
Таблица 2.1 – Исходные данные |
|||||||||||
Дан временной ряд, характеризующий месячную динамику численности занятых в сфере услуг фирмы yt (чел.) за 8 месяцев: | |||||||||||
Месяц, t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 | |||
Число занятых yt, чел. |
5 |
8 |
7 |
15 |
22 |
23 |
26 |
33 |
1. Проверим наличие аномальных наблюдений.
Наличие аномальных наблюдений приводит
к искажению результатов
Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина yt.
где
Если рассчитанная величина yt превышает табличный уровень (например, для 10 наблюдений значение критерия Ирвина равно 1,5), то уровень yt считается аномальным.
Для расчета l воспользуемся функцией Excel СТАНДОТКЛОН().
Таблица 2.2 – Результаты расчетов по методу Ирвина
Месяц, t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 | |
Число занятых yt, чел. |
5 |
8 |
7 |
15 |
22 |
23 |
26 |
33 | |
l |
0,58 |
0,35 |
0,12 |
0,93 |
0,81 |
0,12 |
0,35 |
0,81 |
Из результатов мы видим, что аномальных значений не наблюдается.
2. Проверим наличие тренда.
Поделим исходный временной ряд на две равные части и для каждой части найдем среднее и дисперсию, воспользовавшись пакетом анализа Excel.
Число занятых yt, чел. |
5 |
8 |
7 |
15 |
22 |
23 |
26 |
33 |
Таблица 2.3 – Результаты двухвыборочного F-теста для дисперсии
Переменная 1 |
Переменная 2 | |
Среднее |
8,75 |
26 |
Дисперсия |
18,92 |
24,67 |
Наблюдения |
4 |
4 |
df |
3 |
3 |
F |
0,767 |
|
P(F<=f) одностороннее |
0,416 |
|
F критическое одностороннее |
0,108 |
Среднее значение и дисперсия второй части значительно превышают среднее значение и дисперсию первой части, следовательно можно сделать вывод, что имеется повышающий тренд.
3. Построим линейную
модель временного ряда ,
параметры которой оценить с помощью метода
наименьших квадратов.
Согласно методу наименьших квадратов
при оценке параметров модели всем
наблюдениям присваиваются
Для определения параметров модели воспользуемся инструментом Регрессия в надстройке Excel Анализ данных.
Из анализа таблицы 4 получаем коэффициенты уравнения регрессии:
а0 = -0,893, а1 = 4,06
Тогда уравнение модели примет вид:
Коэффициент детерминации R2 = 0,95354, что говорит о высокой точности модели.
Таблица 4 – Протокол регрессивного анализа линейной модели временного ряда | ||||||
Месяц, t |
Число занятых yt, чел. |
|||||
1 |
5 |
|||||
2 |
8 |
|||||
3 |
7 |
|||||
ВЫВОД ИТОГОВ |
4 |
15 |
||||
5 |
22 |
|||||
Регрессионная статистика |
6 |
23 |
||||
Множественный R |
0,97649 |
7 |
26 |
|||
R-квадрат |
0,95354 |
8 |
33 |
|||
Нормированный R-квадрат |
0,94579 |
|||||
Стандартная ошибка |
2,37087 |
|||||
Наблюдения |
8 |
|||||
Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
692,1488 |
692,149 |
123,136 |
3,19E-05 |
|
Остаток |
6 |
33,72619 |
5,62103 |
|||
Итого |
7 |
725,875 |
||||
Коэффи-циенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
-0,89286 |
1,8474 |
-0,4833 |
0,646 |
-5,413 |
3,627 |
Месяц, t |
4,05952 |
0,3658 |
11,0966 |
3,2E-05 |
3,164 |
4,955 |
ВЫВОД ОСТАТКА |
||||||
Предска-занное Число занятых yt, чел. |
Остатки |
|||||
1 |
3,16667 |
1,833333 |
||||
2 |
7,22619 |
0,77381 |
||||
3 |
11,2857 |
-4,285714 |
||||
4 |
15,3452 |
-0,345238 |
||||
5 |
19,4048 |
2,595238 |
||||
6 |
23,4643 |
-0,464286 |
||||
7 |
27,5238 |
-1,52381 |
||||
8 |
31,5833 |
1,416667 |
4. Оценим адекватность
модели, используя свойства
а) Независимость остаточной компоненты (отсутствие автокорреляции) проверим с помощью d-критерия Дарбина–Уотсона по формуле
Месяц, t |
Остатки |
Точки поворота |
||
1 |
1,833333 |
3,361111 |
||
2 |
0,77381 |
0,598781 |
1,122591 | |
3 |
-4,285714 |
* |
18,36735 |
25,59878 |
4 |
-0,345238 |
0,119189 |
15,52735 | |
5 |
2,595238 |
* |
6,735261 |
8,6464 |
6 |
-0,464286 |
0,215561 |
9,360686 | |
7 |
-1,52381 |
* |
2,321995 |
1,122591 |
8 |
1,416667 |
2,006944 |
8,6464 | |
Сумма |
0 |
33,72619 |
70,0248 |
Значение статистики Дарбина-Уотсона изменяется в диапазоне от 0 до 4. При этом d = 2 указывает на отсутствие автокорреляции элементов временного ряда. Если d меньше двух, то имеет место положительная автокорреляции, а больше двух - отрицательная.
d = 70,0248 / 33,7269 = 2,076
Так как d попало в интервал от 2 до 4, то вычисляем d’ :
d’ = 4 – 2.076 = 1,924
Зададим уровень значимости равной
0,05. По таблицам значений критерия Дарбина-
Поскольку d’ попало в интервал от d2<d’<2, по данному критерию модель адекватна.
Информация о работе Построение и анализ модели множественной регрессии