Автор работы: Пользователь скрыл имя, 18 Января 2014 в 14:16, контрольная работа
Задание: 1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции. 2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора. 3. Рассчитайте параметры линейной парной регрессии для всех факторов Х. 4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель. 5. Для лучшей модели осуществите прогнозирование среднего значения показателя при уровне значимости, если прогнозное значение фактора составит 80% от его максимального значения.
Б) Среднюю ошибку аппроксимации рассчитаем по формуле:
, где числитель – сумма
Среднее значение цены квартиры рассчитаем в Excel с помощью функции СРЗНАЧ. = 93,65025 тыс. долл.
При проведении экономических расчетов модель считается достаточно точной, если средняя ошибка аппроксимации меньше 5%, модель считается приемлемой, если средняя ошибка аппроксимации меньше 15%.
По данному критерию, наиболее адекватной является математическая модель для уравнения регрессии зависимости цены квартиры от жилой площади квартиры (Х4).
В) Для проверки значимости модели регрессии используется F-тест. Для этого выполняется сравнение и критического (табличного) значений F-критерия Фишера.
Расчетные значения приведены в таблицах 1.5б, 1.6б, 1.7б (обозначены буквой F).
Табличное значение F-критерий Фишера рассчитаем в Excel с помощью функции FРАСПОБР. Вероятность возьмем равной 0,05. Получили:
= 4,10
Расчетные значения F-критерий Фишера для каждого фактора сравним с табличным значением:
= 81,84 > = 4,10 модель по данному критерию адекватна.
= 34,19 > = 4,10 модель по данному критерию адекватна.
= 7,38 > = 4,10 модель по данному критерию адекватна.
Проанализировав данные по всем трем критериям, можно сделать вывод, что наиболее лучшей является математическая модель, построена для фактора жилая площадь квартиры, которая описана линейным уравнением .
5. Для выбранной
модели зависимости цены
Рассчитаем прогнозное значение Х, по условию оно составит 80% от максимального значения.
Рассчитаем Хmax в Excel с помощью функции МАКС.
= 84кв.м
=0,8 *84 = 67,2 кв.м
Для получения прогнозных оценок зависимой переменной подставим полученное значение независимой переменной в линейное уравнение:
= -1,3+2,4*67,2 = 159,98 тыс.долл.
Определим доверительный интервал прогноза, который будет иметь следующие границы:
Для вычисления доверительного интервала для прогнозного значения рассчитываем величину отклонения от линии регрессии. Для модели парной регрессии величина отклонения рассчитывается:
, т.е. значение стандартной ошибки из таблицы 1.5а.
(Так как число степеней свободы равно единицы, то знаменатель будет равен n-2).
= 29,37
Для расчета коэффициента воспользуемся функцией Excel СТЬЮДРАСПОБР, вероятность возьмем равную 0,1, число степеней свободы 38.
= 1,686
Значение рассчитаем с помощью Excel, получим 12294.
Определим верхнюю и нижнюю границы интервала.
159,98+51,63= 211,61
159,98-51,63= 108,35
Таким образом, прогнозное значение = 159,98 тыс.долл., будет находиться между нижней границей, равной 108,35 тыс.долл. и верхней границей, равной 211,61 тыс.долл.
Фактические и модельные значения, точки прогноза представлены графически на рисунке 1.2.
Рисунок 1.2.
6. Используя
пошаговую множественную
Для построения множественной регрессии воспользуемся функцией Регрессия программы Excel, включив в нее все факторы. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.
Таблица 1.8.а.
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
30,45 |
10,14617717 |
3,001135 |
0,004862638 |
X4 (жилая площадь квартиры) |
3,849 |
0,499544248 |
7,704503 |
3,99877E-09 |
X2 (число комнат в квартире) |
-28,532 |
8,441863622 |
-3,379775 |
0,00175709 |
X1 (город области) |
-36,176 |
7,070149312 |
-5,116777 |
1,05101E-05 |
Таблица 1.8.б.
Регрессионная статистика | |
Множественный R |
0,913962927 |
R-квадрат |
0,835328231 |
Нормированный R-квадрат |
0,821605584 |
Стандартная ошибка |
21,74863765 |
Наблюдения |
40 |
Таблица 1.8.в.
Дисперсионный анализ | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
3 |
86378,29447 |
28792,76482 |
60,87223598 |
3,55864E-14 |
Остаток |
36 |
17028,11663 |
473,0032397 |
||
Итого |
39 |
103406,4111 |
Получаем модель вида:
.
Поскольку < (4,10 < 60,87), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-3,38│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36: =1,688.
Поскольку │-3,38│> 1,688 модель следует признать адекватной.
Коэффициент парной корреляции независимых переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) = 0,92. Так как это больше 0,8, следовательно в исходных данных имеется мультиколлинеарность. Чтобы избавиться от мультиколлинеарности из переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) оставим в модели X4, так как он в большей степени связан с зависимой переменной Y(цена квартиры).
Вычисляем новую математическую модель.
Таблица 1.9.а.
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
21,44848618 |
11,0838945 |
1,935103784 |
0,060649342 |
X4 (жилая площадь квартиры) |
2,297644203 |
7,921039863 |
10,28689171 |
0,000196621 |
X1(город области) |
-32,73940067 |
0,223356507 |
-4,133220036 |
2,11022E-12 |
Таблица 1.9.б.
Регрессионная статистика | |
Множественный R |
0,884916669 |
R-квадрат |
0,783077511 |
Нормированный R-квадрат |
0,771351971 |
Стандартная ошибка |
24,62210392 |
Наблюдения |
40 |
Таблица 1.9.в.
Дисперсионный анализ | |||||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
80975,23504 |
40487,61752 |
66,78391916 |
5,26787E-13 |
Остаток |
37 |
22431,17605 |
606,2480015 |
||
Итого |
39 |
103406,4111 |
Получаем модель вида: .
Поскольку < (4,10 < 66,78), уравнение регрессии следует признать адекватным.
Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-4,13│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-3=37: = 1,687.
Поскольку │-4,13│> 1,687 модель следует признать адекватной.
Мультиколлинеарность
7. Оцените качество построенной модели.
а) Для модели коэффициент детерминации составил 0,78, для модели он составил 0,683, поскольку чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели, то первая модель является лучшей по данному критерию.
б) Рассчитаем среднюю ошибку аппроксимации:
Для предыдущей модели она составила 30,57.
в) Рассчитаем табличное значение F-критерия Фишера при вероятности 0,05:
=3,25
= 66,78
= 66,78 > =3,25 модель по данному критерию адекватна.
Для оценки значимого фактора полученной математической модели, рассчитаем коэффициенты эластичности, и - коэффициенты.
Коэффициент
эластичности показывает, насколько
процентов изменится
.
Э X4 = 2,29 *(39,62/93,65) = 1%.
Э X1 = (-32,74) * (0,58/93,65) = - 0,2 %.
То есть с ростом общей площади квартиры на 1% стоимость квартиры в среднем возрастает на 1%.
А при изменении города Люберцы на Подольск при неизменной общей площади квартиры величина стоимости квартиры уменьшится в среднем на 0,2%.
То есть наибольшее воздействие на цену квартиры оказывает величина жилой площади (X4), а наименьшее - X1 (город области).
-коэффициент показывает на
какую часть величины среднего
квадратического отклонения
= 2,29* (17,755/51,492) = 0,79.
= (-32,74) * (0,5/51,492) = - 0,32.
Данные средних квадратических отклонений взяты из таблиц, полученных с помощью инструменты Описательная статистика.
Таблица 1.11.
Описательная статистика (Y)
Y-цена квартиры, тыс. руб. | |
Среднее |
93,65025 |
Стандартная ошибка |
8,141631 |
Медиана |
79,45 |
Мода |
115 |
Стандартное отклонение |
51,4922 |
Дисперсия выборки |
2651,446 |
Эксцесс |
3,611985 |
Асимметричность |
1,805953 |
Интервал |
225,5 |
Минимум |
39,5 |
Максимум |
265 |
Сумма |
3746,01 |
Счет |
40 |
Таблица 1.12.
Описательная статистика (Х4)
X4(жилая площадь квартиры), кв.м | |
Среднее |
39,6175 |
Стандартная ошибка |
2,807241 |
Медиана |
35,5 |
Мода |
46 |
Стандартное отклонение |
17,75455 |
Дисперсия выборки |
315,224 |
Эксцесс |
-0,044 |
Асимметричность |
0,671167 |
Интервал |
68,7 |
Минимум |
15,3 |
Максимум |
84 |
Сумма |
1584,7 |
Счет |
40 |
Информация о работе Эконометрическое моделирование стоимости квартир в Московской области