Автор работы: Пользователь скрыл имя, 15 Января 2014 в 22:16, задача
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
Задача 1. Построение и анализ модель множественной регрессии
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.
4. Построитьипроанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.
5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости a = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).
6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).
Изучите зависимость стоимости квартиры от ряда основных факторов.
№ п/п |
x1 – число комнат в квартире |
x2 – общая площадь квартиры (м2) |
x3 – жилая площадь квартиры (м2) |
x4 – площадь кухни (м2) |
y - цена квартиры, тыс. долл. |
1 |
2 |
93,2 |
49,5 |
14,0 |
46,6 |
2 |
3 |
117,0 |
55,2 |
25,0 |
58,5 |
3 |
1 |
42,0 |
21,0 |
10,2 |
24,2 |
4 |
2 |
62,0 |
35,0 |
11,0 |
35,7 |
5 |
3 |
89,0 |
52,3 |
11,5 |
51,2 |
6 |
4 |
132,0 |
89,6 |
11,0 |
75,9 |
7 |
1 |
40,8 |
19,2 |
10,1 |
21,2 |
8 |
2 |
59,2 |
31,9 |
11,2 |
30,8 |
9 |
3 |
65,4 |
38,9 |
9,3 |
34,0 |
10 |
2 |
60,2 |
36,3 |
10,9 |
31,9 |
11 |
3 |
82,2 |
49,7 |
13,8 |
43,6 |
12 |
3 |
98,4 |
52,3 |
15,3 |
52,2 |
13 |
3 |
76,7 |
44,7 |
8,0 |
43,1 |
14 |
1 |
38,7 |
20 |
10,2 |
25,0 |
15 |
2 |
56,4 |
32,7 |
10,1 |
35,2 |
16 |
3 |
76,7 |
44,7 |
8,0 |
40,8 |
17 |
1 |
38,7 |
20 |
10,2 |
18,2 |
18 |
1 |
41,5 |
20 |
10,2 |
20,1 |
19 |
2 |
48,8 |
28,5 |
8,0 |
22,7 |
20 |
2 |
57,4 |
33,5 |
10,1 |
27,6 |
21 |
3 |
76,7 |
44,7 |
8,0 |
36,0 |
22 |
1 |
37 |
17,5 |
8,3 |
17,8 |
23 |
2 |
54 |
30,5 |
8,3 |
25,9 |
24 |
3 |
68 |
42,5 |
8,3 |
32,6 |
25 |
1 |
40,5 |
16 |
11,0 |
19,8 |
26 |
2 |
61 |
31 |
11,0 |
29,9 |
27 |
3 |
80 |
45,6 |
11,0 |
39,2 |
28 |
1 |
52 |
21,2 |
11,2 |
22,4 |
29 |
2 |
78,1 |
40 |
11,6 |
35,2 |
30 |
3 |
91,6 |
53,8 |
16,0 |
41,2 |
Решение.
1. Построим линейную модель множественной регрессии:
С помощью инструмента Регрессия в надстройке Анализ Данных ВExcel найдем уравнение регрессии принимает вид:
y =0,72 - 1,76*x1+0,27*x2+0,49*x3+0,1*
Коэффициент детерминации:
Коэффициент множественной корреляции:
Значения коэффициентов детерминации и множественной корреляции:
Оценим значимость модели в целом с помощью F-критерия Фишера:
Для нахождения Fтабличное используем Таблицу значений F-критерия Фишера при
уровне значимости :
=F.ОБР.ПХ(0,05;4;25)
Вывод заключается в том, что модель значима и надежна,тк. Fфак>Fтабл( 123,1>2,78).
Находим параметры Стьюдента t-статистики.
Из представленной выше таблицы берем нужные нам коэффициенты,t1 и t2.
Для нахождения t табличное воспользуемся таблицей критических значений t-критерия Стьюдента при уровне значимости 0,10, 0,05, 0,01 (двухсторонний)
Вывод заключается в том, что параметр b1 статистически не значим, т.к меньше t табличное. Поэтому фактор x1 можно исключить из модели.
Так же можем убрать из модели фактор x4,потому что он меньше связан с моделью.
Y=f(x2,x3)
Найдем уравнение регрессии для двухфакторной модели:
Y=0,32+0,33*x2+0,33*x3.
7-41111
Задача 2. Построение и анализ модели временного ряда
По исходным данным требуется:
1. Проверить наличие аномальных наблюдений.
2. Проверить наличие тренда.
3. Построить линейную модель временного ряда , параметры которой оценить с помощью метода наименьших квадратов.
4. Оценить адекватность модели, используя свойства независимости остаточной компоненты, случайности уровней ряда остатков и соответствия ряда остатков нормальному закону распределения (при использовании R/S-критерия воспользоваться таблицами).
5. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
6. Осуществить прогноз (точечный прогноз и доверительный интервал) результирующего показателя на следующие два временных шага (доверительный интервал прогноза рассчитать при доверительной вероятности 0,85).
7. Представить графически фактические значения исследуемого показателя, результаты моделирования и прогнозирования
Вариант 10.
Задолженность по кредитам yt (тыс. руб.) на некотором предприятии за последние 12 месяцев составляет следующую последовательность:
Месяц, t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Задолженность yt, тыс. руб. |
16,6 |
25,4 |
26,0 |
34,1 |
44,0 |
34,0 |
48,0 |
45,5 |
62,8 |
67,6 |
76,1 |
80,0 |
Решение.
2. Наличие аномальных
наблюдений приводит к
Проверим наличие аномальных наблюдений. Для этого воспользуемся методом Ирвина. Вычислим :
Рис. 2. Нахождение аномальных наблюдений
3. Для того, чтобы проверить
наличие тренда, воспользуемся анализом
данных – «Двухвыборочный t-
Рис. 3. Двухвыборочный t-тест с одинаковыми дисперсиями
Результат выполненного теста, показывает, что дисперсии отличаются существенно, значит, временной ряд имеет тенденцию к тренду.
4. Линейная модель временного ряда y = 10,1545x +5,6185
Рис. 4. Коэффициенты уравнения регрессии
5. Оценка параметров модели.
6. Проверим соответствие
ряда остатков нормальному
Рис. 5. Вывод остатков
Модель по этому критерию адекватна.
7. Для оценки точности воспользуемся формулой
Еотн = 49,117 % − хороший
уровень точности.
Список литературы.
Информация о работе Построение и анализ модель множественной регрессии