Эконометрическое моделирование стоимости квартир в Московской области

Автор работы: Пользователь скрыл имя, 18 Января 2014 в 14:16, контрольная работа

Краткое описание

Задание: 1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции. 2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора. 3. Рассчитайте параметры линейной парной регрессии для всех факторов Х. 4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель. 5. Для лучшей модели осуществите прогнозирование среднего значения показателя при уровне значимости, если прогнозное значение фактора составит 80% от его максимального значения.

Прикрепленные файлы: 1 файл

готовая конт.docx

— 220.07 Кб (Скачать документ)

Б) Среднюю ошибку аппроксимации  рассчитаем по формуле:

, где числитель – сумма квадратов  отклонения расчетных значений  от фактических. В таблицах  она находится в столбце SS, строке Остатки.

Среднее значение цены квартиры рассчитаем в Excel с помощью функции СРЗНАЧ.         = 93,65025 тыс. долл.

При проведении экономических расчетов модель считается  достаточно точной, если средняя ошибка аппроксимации меньше 5%, модель считается  приемлемой, если средняя ошибка аппроксимации  меньше 15%.

По данному  критерию, наиболее адекватной является математическая модель для уравнения  регрессии зависимости цены квартиры от жилой площади квартиры (Х4).

В) Для  проверки значимости модели регрессии  используется F-тест. Для этого выполняется сравнение и критического (табличного) значений F-критерия Фишера.

Расчетные значения приведены в  таблицах 1.5б, 1.6б, 1.7б (обозначены буквой F).

Табличное значение F-критерий Фишера рассчитаем в Excel с помощью функции FРАСПОБР. Вероятность возьмем равной 0,05. Получили:

= 4,10

Расчетные значения F-критерий Фишера для каждого фактора сравним с табличным значением:

= 81,84  > = 4,10 модель по данному критерию адекватна.

= 34,19 > = 4,10 модель по данному критерию адекватна.

= 7,38  > = 4,10 модель по данному критерию адекватна.

Проанализировав данные по всем трем критериям, можно сделать вывод, что наиболее лучшей является математическая модель, построена для фактора  жилая площадь квартиры, которая описана линейным уравнением .

5. Для выбранной  модели зависимости цены квартиры  от жилой площади квартиры осуществим прогнозирование среднего значения показателя при уровне значимости  , если прогнозное значения фактора составит 80% от его максимального значения. Представим графически: фактические и модельные значения, точки прогноза.

Рассчитаем прогнозное значение Х, по условию оно составит 80% от максимального  значения.

Рассчитаем Хmax в Excel с помощью функции МАКС.

= 84кв.м

=0,8 *84 = 67,2 кв.м

Для получения  прогнозных оценок зависимой переменной подставим полученное значение независимой  переменной в линейное уравнение:

= -1,3+2,4*67,2 = 159,98 тыс.долл.

Определим доверительный интервал прогноза, который будет иметь  следующие границы:

Для вычисления доверительного интервала  для прогнозного значения рассчитываем величину отклонения от линии регрессии. Для модели парной регрессии величина отклонения рассчитывается:

, т.е. значение стандартной ошибки из таблицы 1.5а.

(Так  как число степеней свободы  равно единицы, то знаменатель  будет равен n-2).

= 29,37

Для расчета коэффициента воспользуемся функцией Excel СТЬЮДРАСПОБР, вероятность возьмем равную 0,1, число степеней свободы 38.

= 1,686

Значение  рассчитаем с помощью Excel, получим 12294.

Определим верхнюю и нижнюю границы  интервала.

159,98+51,63= 211,61

159,98-51,63= 108,35

Таким образом, прогнозное значение = 159,98 тыс.долл., будет находиться между нижней границей, равной 108,35 тыс.долл. и верхней границей, равной 211,61 тыс.долл.

Фактические и модельные значения, точки прогноза представлены графически на рисунке 1.2.

Рисунок 1.2.

6. Используя  пошаговую множественную регрессию  (метод исключения), построим модель  формирования цены квартиры за  счёт значимых факторов.

Для построения множественной регрессии  воспользуемся функцией Регрессия  программы Excel, включив в нее все факторы. В результате получаем результативные таблицы, из которых нам необходим t-критерий Стьюдента.

Таблица 1.8.а.

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

30,45

10,14617717

3,001135

0,004862638

X4 (жилая площадь квартиры)

3,849

0,499544248

7,704503

3,99877E-09

X2 (число комнат в квартире)

-28,532

8,441863622

-3,379775

0,00175709

X1 (город области)

-36,176

7,070149312

-5,116777

1,05101E-05


 

Таблица 1.8.б.

Регрессионная статистика

Множественный R

0,913962927

R-квадрат

0,835328231

Нормированный R-квадрат

0,821605584

Стандартная ошибка

21,74863765

Наблюдения

40


 

Таблица 1.8.в.

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

3

86378,29447

28792,76482

60,87223598

3,55864E-14

Остаток

36

17028,11663

473,0032397

   

Итого

39

103406,4111

     

Получаем  модель вида:

.

Поскольку < (4,10 < 60,87), уравнение регрессии следует признать адекватным.

Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-3,38│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-4=36:  =1,688.

Поскольку │-3,38│> 1,688 модель следует признать адекватной.

Коэффициент парной корреляции независимых переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) = 0,92. Так как это больше 0,8, следовательно в исходных данных имеется мультиколлинеарность. Чтобы избавиться от мультиколлинеарности из переменных X2 (число комнат в квартире) и X4 (жилая площадь квартиры) оставим в модели X4, так как он в большей степени связан с зависимой переменной Y(цена квартиры).

Вычисляем новую математическую модель.

Таблица 1.9.а.

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

21,44848618

11,0838945

1,935103784

0,060649342

X4 (жилая площадь квартиры)

2,297644203

7,921039863

10,28689171

0,000196621

X1(город области)

-32,73940067

0,223356507

-4,133220036

2,11022E-12


Таблица 1.9.б.

Регрессионная статистика

Множественный R

0,884916669

R-квадрат

0,783077511

Нормированный R-квадрат

0,771351971

Стандартная ошибка

24,62210392

Наблюдения

40


 

Таблица 1.9.в.

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

80975,23504

40487,61752

66,78391916

5,26787E-13

Остаток

37

22431,17605

606,2480015

   

Итого

39

103406,4111

     

Получаем  модель вида: .

Поскольку < (4,10 < 66,78), уравнение регрессии следует признать адекватным.

Выберем наименьшее по модулю значение t-критерия Стьюдента, оно равно │-4,13│, сравниваем его с табличным значением, которые рассчитываем в Excel, уровень значимости берем равным 0,10, число степеней свободы n-m-1=40-3=37: = 1,687.

Поскольку │-4,13│> 1,687 модель следует признать адекватной.

Мультиколлинеарность отсутствует.

7. Оцените качество  построенной модели.

а) Для  модели коэффициент детерминации составил 0,78, для модели он составил 0,683, поскольку чем больше значение коэффициента детерминации, тем теснее связь между признаками в построенной математической модели, то первая модель является лучшей по данному критерию.

б) Рассчитаем среднюю ошибку аппроксимации:

Для предыдущей модели она составила 30,57.

в) Рассчитаем табличное значение F-критерия Фишера при вероятности 0,05:

=3,25

= 66,78

= 66,78 > =3,25 модель по данному критерию адекватна.

Для оценки значимого фактора полученной математической модели, рассчитаем коэффициенты эластичности, и - коэффициенты.

Коэффициент эластичности показывает, насколько  процентов изменится результативный признак при изменении факторного признака на 1%:

.

Э X4 = 2,29 *(39,62/93,65) = 1%.

Э X1 =  (-32,74) * (0,58/93,65) = - 0,2 %.

То есть с ростом общей площади квартиры на 1% стоимость квартиры в среднем  возрастает на 1%.

А при  изменении города Люберцы на Подольск при неизменной общей площади  квартиры величина стоимости квартиры уменьшится в среднем на 0,2%.

То есть наибольшее воздействие на цену квартиры оказывает величина жилой площади (X4), а наименьшее - X1 (город области).

-коэффициент показывает на  какую часть величины среднего  квадратического отклонения меняется  среднее значение зависимой переменной  с изменением независимой переменной  на одно среднеквадратическое  отклонение.

= 2,29* (17,755/51,492) = 0,79.

= (-32,74) * (0,5/51,492) = - 0,32.

Данные  средних квадратических отклонений взяты из таблиц, полученных с помощью  инструменты Описательная статистика.

Таблица 1.11.

Описательная статистика (Y)

Y-цена квартиры, тыс. руб.

Среднее

93,65025

Стандартная ошибка

8,141631

Медиана

79,45

Мода

115

Стандартное отклонение

51,4922

Дисперсия выборки

2651,446

Эксцесс

3,611985

Асимметричность

1,805953

Интервал

225,5

Минимум

39,5

Максимум

265

Сумма

3746,01

Счет

40


 

Таблица 1.12.

Описательная статистика (Х4)

X4(жилая площадь квартиры), кв.м

Среднее

39,6175

Стандартная ошибка

2,807241

Медиана

35,5

Мода

46

Стандартное отклонение

17,75455

Дисперсия выборки

315,224

Эксцесс

-0,044

Асимметричность

0,671167

Интервал

68,7

Минимум

15,3

Максимум

84

Сумма

1584,7

Счет

40

Информация о работе Эконометрическое моделирование стоимости квартир в Московской области