Автор работы: Пользователь скрыл имя, 14 Мая 2014 в 12:05, контрольная работа
Задача 1
Эконометрическое моделирование стоимости квартир в Московской области
Таблица 1
Исследуемые факторы
Обозначение Наименование показателя Единица измерения (возможные значения)
Y цена квартир тыс. долл.
X1 город области 1 - Подольск
0 - Люберцы
X2 число комнат в квартире
X4 жилая площадь квартиры кв. м
Задача 1
Эконометрическое моделирование стоимости квартир в Московской области
Таблица 1
Исследуемые факторы
Обозначение |
Наименование показателя |
Единица измерения (возможные значения) |
Y |
цена квартир |
тыс. долл. |
X1 |
город области |
1 - Подольск |
0 - Люберцы | ||
X2 |
число комнат в квартире |
|
X4 |
жилая площадь квартиры |
кв. м |
Таблица 2
Исходные данные для эконометрического моделирования стоимости квартир
Y |
X1 |
X3 |
X5 |
38 |
1 |
41,9 |
112 |
62.2 |
1 |
69 |
39 |
125 |
0 |
67 |
11 |
61.1 |
1 |
58,1 |
10 |
67 |
0 |
32 |
2 |
93 |
0 |
57,2 |
1 |
118 |
1 |
107 |
2 |
132 |
0 |
81 |
8 |
92.5 |
0 |
89,9 |
9 |
105 |
1 |
75 |
8 |
42 |
1 |
36 |
8 |
125 |
1 |
72,9 |
16 |
170 |
0 |
90 |
3 |
38 |
0 |
29 |
3 |
130.5 |
0 |
108 |
1 |
85 |
0 |
60 |
3 |
98 |
0 |
80 |
3 |
128 |
0 |
104 |
4 |
85 |
0 |
85 |
8 |
160 |
1 |
70 |
2 |
60 |
0 |
60 |
4 |
41 |
1 |
35 |
10 |
90 |
1 |
75 |
5 |
83 |
0 |
69,5 |
1 |
45 |
0 |
32,8 |
3 |
39 |
0 |
32 |
3 |
86.9 |
0 |
97 |
10 |
40 |
0 |
32,8 |
2 |
80 |
0 |
71,3 |
2 |
227 |
0 |
147 |
2 |
235 |
0 |
150 |
9 |
40 |
1 |
34 |
8 |
67 |
1 |
47 |
1 |
123 |
1 |
81 |
9 |
100 |
0 |
57 |
6 |
105 |
1 |
80 |
3 |
70.3 |
1 |
58,1 |
10 |
82 |
1 |
81,1 |
5 |
280 |
1 |
155 |
5 |
200 |
1 |
108,4 |
4 |
Решение Задачи 1.
При решении данной задачи расчеты и построение графиков и диаграмм производится с использованием настройки Excel Анализ данных.
1. Расчет матрицы
парных коэффициентов
Коэффициент парной корреляции используется для измерения силы линейных связей различных пар признаков из их множества и вычисляется по формуле:
.
Чтобы рассчитать матрицу парных коэффициентов корреляции в Excel копируется таблица с исходными данными. Далее воспользуемся инструментом Корреляция:
1) в главном меню
последовательно выбирается
2) в диалоговом окне Корреляция в поле Входной интервал вводится диапазон ячеек, содержащих исходные данные (так как вводились и заголовки столбцов, то устанавливается флажок Метки в первой строке);
3) результаты вычислений –
Таблица 3
Матрица парных коэффициентов корреляции
Y |
X1 |
X3 |
X5 | |
Y |
1 |
|||
X1 |
-0,011 |
1 |
||
X3 |
0,892 |
-0,045 |
1 |
|
X5 |
-0,071 |
0,349 |
-0,026 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная Y (цена квартиры) имеет наиболее тесную связь с факторными признаками Х3 и Х5 (общая площадь квартир и этаж квартиры). Коэффициенты парной корреляции равны: r(Y; X1) = -0,01<0, следовательно, между переменными (Y; X1) наблюдается обратная корреляционная зависимость, в Подольске цена квартиры ниже, чем в Люберцах;
r(Y; X3) = 0,89>0, то между переменными (Y; X3) наблюдается прямая корреляционная зависимость, чем больше общая площадь квартиры, тем выше ее цена;
r(Y; X5) = -0,07<0, следовательно, между переменными (Y; X5) наблюдается обратная корреляционная зависимость, чем выше этаж, тем ниже цена за квартиру.
Следует отметить, что положительная корреляция между признаками означает, что при возрастании одной случайной величины другая имеет тенденцию в среднем возрастать. Если признаки связаны отрицательной корреляцией (например, Y и X1), это означает, что при возрастании факторного признака (X1) величина результирующего признака имеет тенденцию к убыванию.
Для оценки значимости коэффициента корреляции применяется t-критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:
Табличное значение сравнивается с расчетными значениями. Табличное значение определяется с помощью функции СТЬЮДРАСПОБР (категория функций - статистические) с вероятностью, равной 0.05 (p = 1-0.9) и степенью свободы n-2 (где n – число наблюдений).
Таблица 4
Оценка статистической значимости коэффициента корреляции
Значение коэффициента корреляции |
Расчетное значение t-критерия Стьюдента |
Табличное значение t-критерия Стьюдента |
Вывод о значимости фактора |
r(Y;X1) =-0,011 |
0,069 |
2.024 |
незначимый |
r(Y;X3) = 0,892 |
12,181 |
значимый | |
r(Y;X5) =-0,071 |
0,441 |
незначимый |
Вывод: Статистически наиболее значимая зависимость наблюдается между ценой квартиры и общей площадью квартиры (Y;X3) .
2. Построение
поля корреляции результативног
Для построения поля корреляции используется инструмент построения точечной диаграммы Excel. В результате получается поле корреляции цены квартиры (тыс. долл.) и общей площади квартиры (кв.м.) (Рис. 1).
Рисунок 1. Поле корреляции цены и общей площади квартиры.
Корреляционное поле позволяет дать наглядную графическую интерпретацию коэффициента корреляции. Коэффициент корреляции между Y и X3 , r(Y; X3) = 0,89>0 то есть имеет место положительная корреляция (с увеличением X3 значения Y имеют тенденцию к возрастанию). Это соответствует на графике (рис. 1) тому, что экспериментальные значения группируются около прямой линии, имеющей положительный наклон. Если r(Y;Х) = 1 или r(Y;Х) = -1, то между случайными величинами Х и Y существует линейная функциональная зависимость. В этом случае говорят о полной корреляции. В рассматриваемом случае. В данном же случае присутствует некоторый разброс точек на графике, что подтверждает отличие коэффициент корреляции между Y и X3 от 1.
3. Расчет параметров линейной парной регрессии для каждого фактора Х.
Линейная модель имеет следующий вид: . Дня оценки параметров уравнения используется метод наименьших квадратов (МНК). Согласно принципу метода наименьших квадратов, оценки и находятся путем минимизации суммы квадратов:
По всем возможным значениям и при заданных (наблюдаемых) значениях .
В результате формулы для вычисления параметров регрессионного уравнения выглядят следующим образом:
,
При этом уравнение линейной парной регрессии для одного из факторов показывает влияние только этого фактора на результирующий признак, исключая влияние остальных.
Для расчета параметров линейной парной регрессии можно воспользоваться инструментом Регрессия, входящим в настойку Анализ данных. В диалоговом окне Регрессия в поле Входной интервал Y вводится адрес диапазона ячеек, которые представляет зависимую переменную Y, то есть стоимость квартир. В поле Входной интервал Х для каждого из факторных признаков вводим адреса диапазона ячеек, которые содержат значения независимых переменных (город области, жилая площадь квартиры, число комнат в квартире). При это необходимо установить флажок Метки в первой строке (так как вводились и заголовки столбцов). Далее выполняется поочередно вычисления параметров парной регрессии для каждого фактора Х.
Таблица 5
Результаты регрессионного анализа для факторного признака X1
Регрессионная статистика | |
Множественный R |
0,011259267 |
R-квадрат |
0,000126771 |
Нормированный R-квадрат |
-0,026185682 |
Стандартная ошибка |
58,03645994 |
Наблюдения |
40 |
Дисперсионный анализ | ||||||||
df |
SS |
MS |
F |
Значимость F | ||||
Регрессия |
1 |
16,22784091 |
16,22784091 |
0,004817913 |
0,945026312 | |||
Остаток |
38 |
127992,7659 |
3368,230682 |
|||||
Итого |
39 |
128008,9938 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |||||
Y-пересечение |
101,8136364 |
12,37341483 |
8,228418568 |
5,7273E–10 | ||||
X1 |
–1,28030303 |
18,44519779 |
-0,069411185 |
0,945026312 |
Вывод: , , то есть уравнение линейной парной регрессии для фактора Х1 имеет вид: Y = 101,814 – 1,280·X1.
Параметр называется коэффициентом регрессии. Его величина показывает среднее изменение результата Y с изменением фактора X на 1 единицу. Для факторного признака X1 , следовательно, цена квартиры в Подольске будет стоить на 1,280 тыс. долл. меньше, чем в Люберцах.
Следует отметить, что в данном случае коэффициенту так же можно придать экономический смысл – его значение показывает значение Y при X1 = 0, то есть стоимость квартиры в Люберцах.
Таблица 6
Результаты регрессионного анализа для факторного признака X3