Автор работы: Пользователь скрыл имя, 16 Января 2014 в 15:52, контрольная работа
Линейная модель множественной регрессии имеет вид:
,
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.
Федеральное государственное высшего профессионального образования финансовый университет при правительстве российской федерации ярославский филиал | ||
Кафедра математики и информатики | ||
Факультет: экономики Направление: финансы и кредит | ||
Контрольная работа | ||
по дисциплине | ||
«Эконометрика» | ||
Вариант № 12 | ||
Студент: |
Козлова Виктория Сергеевна | |
Курс: |
3 | |
Форма обучения: |
День | |
Личное дело №: |
100.31/120185 | |
Преподаватель: |
Черномордик Владимир Дмитриевич | |
Ярославль 2013 | ||
План работы
Изучите зависимость стоимости квартиры от ряда основных факторов.
№ п/п |
x1 – общая площадь квартиры (м2) |
x2 – жилая площадь квартиры (м2) |
x3 – площадь кухни (м2) |
x4 – тип дома (1 - кирпичный, 0 - другой) |
y - цена квартиры, тыс. долл. |
1 |
39,0 |
20,0 |
8,2 |
0 |
15,9 |
2 |
68,4 |
40,5 |
10,7 |
0 |
27,0 |
3 |
34,8 |
16,0 |
10,7 |
0 |
13,5 |
4 |
39,0 |
20,0 |
8,5 |
0 |
15,1 |
5 |
54,7 |
28,0 |
10,7 |
0 |
21,1 |
6 |
74,7 |
46,3 |
10,7 |
0 |
28,7 |
7 |
71,1 |
45,9 |
10,7 |
0 |
27,2 |
8 |
74,5 |
47,5 |
10,4 |
0 |
28,3 |
9 |
137,7 |
87,2 |
14,6 |
0 |
52,3 |
10 |
40,0 |
17,7 |
11,0 |
1 |
22,0 |
11 |
53,0 |
31,1 |
10,0 |
1 |
28,0 |
12 |
86,0 |
48,7 |
14,0 |
1 |
45,0 |
13 |
98,0 |
65,8 |
13,0 |
1 |
51,0 |
14 |
62,6 |
21,4 |
11,0 |
1 |
34,4 |
15 |
45,3 |
20,6 |
10,4 |
1 |
24,7 |
16 |
56,4 |
29,7 |
9,4 |
1 |
30,8 |
17 |
37,0 |
17,8 |
8,3 |
0 |
15,9 |
18 |
67,5 |
43,5 |
8,3 |
0 |
29,0 |
19 |
37,0 |
17,8 |
8,3 |
0 |
15,4 |
20 |
69,0 |
42,4 |
8,3 |
0 |
28,6 |
21 |
40,0 |
20,0 |
8,3 |
0 |
15,6 |
22 |
69,1 |
41,3 |
8,3 |
0 |
27,7 |
23 |
68,1 |
35,4 |
13,0 |
1 |
34,1 |
24 |
75,3 |
41,4 |
12,1 |
1 |
37,7 |
25 |
83,7 |
48,5 |
12,1 |
1 |
41,9 |
26 |
48,7 |
22,3 |
12,4 |
1 |
24,4 |
27 |
39,9 |
18,0 |
8,1 |
1 |
21,3 |
28 |
68,6 |
35,5 |
17,0 |
1 |
36,7 |
29 |
39,0 |
20,0 |
9,2 |
1 |
21,5 |
30 |
48,6 |
31,0 |
8,0 |
1 |
26,4 |
Решение:
Линейная модель множественной регрессии имеет вид:
где - расчётные значения исследуемой переменной,
- факторные переменные.
- коэффициенты уравнения,
Рассмотрим факторные признаки для построения регрессионной модели.
- Цена квартиры – это зависимая переменная Y;
Независимые объясняющие переменные:
- общая площадь квартиры Х1;
- жилая площадь квартиры Х2;
- площадь кухни Х3;
- тип дома Х4
1. Построим классическую модель множественной регрессии
Классическая линейная модель множественной регрессии можно представить в виде:
Проведем регрессивный анализ, используя инструмент Excel «Регрессия» (Сервис – Анализ данных – Регрессия).
Таблица 2 - Протокол выполнения регрессивного анализа многофакторной модели | ||||
ВЫВОД ИТОГОВ |
||||
Регрессионная статистика |
||||
Множественный R |
0,988184182 |
|||
R-квадрат |
0,976507977 |
|||
Нормированный R-квадрат |
0,972749254 |
|||
Стандартная ошибка |
1,690232392 |
|||
Наблюдения |
30 |
|||
Дисперсионный анализ |
||||
df |
SS |
MS |
F | |
Регрессия |
4 |
2968,85 |
742,2125 |
259,7978 |
Остаток |
25 |
71,42214 |
2,856886 |
|
Итого |
29 |
3040,272 |
||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
-0,919569337 |
1,553442 |
-0,59196 |
0,559196 |
x1 – общая площадь квартиры (м2) |
0,413111875 |
0,076969 |
5,367227 |
1,45E-05 |
x2 – жилая площадь квартиры (м2) |
0,000524556 |
0,098309 |
0,005336 |
0,995785 |
x3 – площадь кухни (м2) |
-0,017685345 |
0,220126 |
-0,08034 |
0,936605 |
x4 – тип дома (1 - кирпичный, 0 - другой) |
7,946876901 |
0,727228 |
10,92763 |
5,2E-11 |
Из анализа получаем коэффициенты уравнения.
Уравнение регрессии зависимости цены квартиры от независимых объясняющих переменных принимает вид:
y = -0,9196 + 0,4131 x1 + 0,0005 x2 + -0,0177 x3 + 7,9469 x4
Оценим качество модели.
Определим коэффициент детерминации.
= 1 - 71,422 / 3040,272 = 2968,85 / 3040,272 = 0,9765
Коэффициент детерминации показывает, что около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R = 0,9882
Он показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.
Оценим значимость модели в целом на основе вычисления F-критерия Фишера.
По данным дисперсионного анализа F = 259,798
Табличное значение F-критерия со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений), k = 4 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()
F табл = 2,75871
Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.
С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.
По данным дисперсионного анализа:
tb0 = -0,592, tb1 = 5,367, tb2 = 0,005, tb3 = -0,080, tb4 = 10,928
Табличное значение t-статистики Стьюдента
найдем с помощью функции
t табл = 2,0595
Среди всех коэффициентов значимыми (tb > tтабл) являются коэффициенты b1 и b4.
По такой модели прогноз сделать не представляется возможным, поскольку большинство коэффициентов регрессии при переменных не значимы.
2. Проведем корреляционный
анализ для исключения
Используем инструмент Excel «Корреляция» (Сервис – Анализ данных – Корреляция).
Таблица 3 - Матрица коэффициентов парной корреляции |
||||||
y - цена |
x1 –
общая |
x2 – |
x3 – |
x4 –
тип дома | ||
y - цена |
1 |
|||||
x1 – общая |
0,906620301 |
1 |
||||
x2 – |
0,84380517 |
0,972572884 |
1 |
|||
x3 – |
0,70841664 |
0,615372581 |
0,505214415 |
1 |
||
x4 – тип дома |
0,392706276 |
-0,000451759 |
-0,097618434 |
0,387353613 |
1 | |
Анализ матрицы показывает, что цена квартиры имеет тесную связь с индексами: | ||||||
x1 – общая площадь квартиры (0,907) |
||||||
x2 – жилая площадь квартиры (0,844) |
||||||
x3 – площадь кухни (0,708) |
||||||
Факторы х1 и х2 тесно связаны между собой (0,97 > 0,8) |
||||||
Т. е. наблюдается мультиколлинеарность |
||||||
Оставляем в модели фактор х1 и фактор х3 |
||||||
После исключения незначимых факторов n = 30, k = 2 |
3. Построим линейную модель регрессии только со значимыми факторами.
Из анализа получаем коэффициенты уравнения регрессии а0, а1, а2
Уравнение регрессии зависимости цены квартиры от общей площади квартиры и площади кухни принимает вид:
y = -4,5414 + 0,3445 x1 + 1,1026 x2
Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 344,5 доллара при увеличении общей площади квартиры на 1 кв. м и увеличивалась на 1102,6 долларов при увеличении площади кухни на 1 кв. м. (Экономическая интерпретация коэффициентов модели).
Оценим качество построенной модели.
Определим коэффициент детерминации.
R2 = 1 - 430,444 / 3040,272 = 2609,827 / 3040,272 = 0,8584192
Коэффициент детерминации показывает, что около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Коэффициент множественной корреляции R = 0,9265
Он показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.
Оценим значимость модели в целом на основе вычисления F-критерия Фишера.
По данным дисперсионного анализа F = 81,8519
Табличное значение F-критерия со степенями свободы n1= k и n2 = (n - k - 1), где n = 30 (количество наблюдений), k = 2 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()
F табл = 3,354
Поскольку F > Fтабл , уравнение регрессии следует признать адекватным.
Определим среднюю относительную ошибку аппроксимации
Она выражается в процентах и характеризует точность модели. Широко применяется критерий, в соответствии с которым точность считается удовлетворительной, если средняя относительная погрешность меньше 15%. Если Eотн.ср. меньше 5%, то говорят, что модель имеет высокую точность. Не рекомендуется применять для анализа и прогноза модели с неудовлетворительной точностью, то есть, когда Eотн.ср. больше 15%.
В нашей модели Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.
С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.
По данным дисперсионного анализа ta0 = -1,2799, ta1 = 8,2461, ta2 = 2,6368
Табличное значение t-статистики Стьюдента
найдем с помощью функции
t табл = 2,052
Поскольку ta > tтабл коэффициенты a1 и a2 является значимыми.
Оценим влияние значимых факторов
на результат с помощью
Эластичность Y по отношению к Х определяется как процентное изменение Y, отнесенное к соответствующему процентному изменению Х.
Тогда
Эyx1 = 0,3445 (60,89 / 28,04) = 0,748
Следовательно при увеличении общей площади квартиры на 1% цена квартиры увеличивается на 0,75%
Эyx2 = 1,1026 (10,52 / 28,04) = 0,414
Следовательно при увеличении площади кухни на 1% цена квартиры увеличивается на 0,414%
Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.
где Sxj — среднеквадратическое отклонение фактора j
Тогда
byx1 = 0,3445 (22,514 / 10,239) = 0,758
byx2 = 1,1026 (2,249 / 10,239) = 0,242
Долю влияния фактора в
где — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной.
Dyx1 = 0,907 × 0,758 / 0,8584 = 0,80
Dyx2 = 0,708 × 0,242 / 0,8584 = 0,20
Значения дельта – коэффициентов показывают, что доля влияния первого фактора составила 80%, а второго – 20%.
(Заметим, что сумма дельта – коэффициентов всегда равна 1. Этот факт можно использовать для проверки правильности произведённых вычислений.)
Анализ коэффициентов
4. Построим линейную модель парной регрессии с наиболее значимым фактором.
Из анализа получаем коэффициенты уравнения регрессии а0, а1
Уравнение регрессии зависимости цены квартиры только от общей площади квартиры принимает вид:
y = 2,934 + 0,412 x1
Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 412 долларов при увеличении общей площади квартиры на 1 кв. м .
Оценим качество построенной модели.
Определим коэффициент детерминации.
R2 = 1 - 541,288/ 3040,272 = 2498,983 / 3040,272 = 0,82196
Коэффициент детерминации показывает, что около 82% вариации зависимой переменной учтено в модели и обусловлено влиянием наиболее значимого фактора.
Коэффициент множественной корреляции R = 0,9066
Он показывает высокую тесноту связи зависимой переменной Y с объясняющим фактором.
Информация о работе Построение и анализ модели множественной регрессии