Автор работы: Пользователь скрыл имя, 02 Мая 2014 в 22:59, курсовая работа
Цель работы : Провести анализ зависимости между типом автомобиля и его ценой под воздействием различных характеризующих его факторов.
Данные для исследования…………………… ...............................................................3
Глава 1. Изучение зависимости функции от переменных 7
1.1. Облака точек 8
1.2. Построение моделей, описывающих данную зависимость 9
1.3. Исследование факторов на мультиколлинеарность…………………….
Глава 2. Исследование остатков модели
2.1. График остатков
2.2. Нормальное распределение .
2.3. Постоянство дисперсии
2.4. Некоррелированность
Глава 3. Расчет доверительного интервала для коэффициентов регрессии 19
Заключение 20
Выполнила: |
студентка гр. ЭУ-10-1 |
Широкова Д. Г. |
Проверила: |
Ст. пр. |
Иткина А. Я. |
Оглавление
Данные для исследования
|
200 000 |
1991 |
2693А |
тд/ |
250 000 |
Есть |
|||||||||||||||||||
|
680 000 |
1992 |
2693А |
тд |
311 000 |
Есть |
|||||||||||||||||||
|
1 799 000 |
2013 |
2993А |
и |
1 111 |
Есть |
|||||||||||||||||||
|
1 899 000 |
2013 |
2993А |
и |
1 111 |
Есть |
|||||||||||||||||||
|
1 680 000 |
2013 |
2993М |
и |
1 310 |
Есть |
|||||||||||||||||||
|
1 850 000 |
2013 |
2993А |
и |
151 |
Есть |
|||||||||||||||||||
|
1 380 000 |
2008 |
2693А |
и |
65 000 |
Есть |
|||||||||||||||||||
|
1 730 000 |
2013 |
2693А |
и |
1 300 |
Есть |
|||||||||||||||||||
|
1 480 299 |
2010 |
2693А |
и |
31 000 |
Есть |
|||||||||||||||||||
|
1 820 000 |
2012 |
2693А |
и |
1 450 |
Есть |
|||||||||||||||||||
|
1 000 000 |
2006 |
2693А |
и |
97 000 |
Есть |
|||||||||||||||||||
|
1 510 000 |
2009 |
2693А |
и |
74 000 |
Есть |
|||||||||||||||||||
|
1 530 000 |
2010 |
2693А |
и |
17 000 |
Есть |
|||||||||||||||||||
|
1 210 000 |
2008 |
2693А |
и |
90 000 |
Есть |
|||||||||||||||||||
|
1 230 000 |
2008 |
2693А |
и |
84 000 |
Есть |
|||||||||||||||||||
|
1 350 000 |
2007 |
2693А |
и |
90 000 |
Есть |
|||||||||||||||||||
|
1 680 000 |
2010 |
2693А |
и |
39 000 |
Есть |
|||||||||||||||||||
|
1 900 000 |
2012 |
2693А |
и |
1 300 |
Есть |
|||||||||||||||||||
|
995 000 |
2005 |
2693А |
и |
97 000 |
Есть |
|||||||||||||||||||
|
1 060 000 |
2006 |
2693А |
и |
174 000 |
Есть |
|||||||||||||||||||
|
1 920 000 |
2013 |
2693А |
и |
1 111 |
Есть |
|||||||||||||||||||
|
1 280 000 |
2008 |
2693А |
и |
107 000 |
Есть |
|||||||||||||||||||
|
1 779 000 |
2012 |
2693А |
и |
1 100 |
Есть |
|||||||||||||||||||
|
500 000 |
1998 |
2693А |
и/ |
240 000 |
Есть |
|||||||||||||||||||
|
1 599 000 |
2010 |
2693А |
и |
45 000 |
Есть |
|||||||||||||||||||
|
1 897 000 |
2013 |
2693А |
и |
2 960 |
Есть |
|||||||||||||||||||
|
930 000 |
2005 |
2693А |
и |
160 000 |
Есть |
|||||||||||||||||||
|
1 330 000 |
2009 |
2693А |
и |
82 000 |
Есть |
|||||||||||||||||||
|
1 460 000 |
2010 |
2693А |
и |
61 000 |
Есть |
|||||||||||||||||||
|
820 000 |
2003 |
2693А |
и |
153 000 |
Есть |
|||||||||||||||||||
|
1 549 000 |
2010 |
2693А |
и |
62 000 |
Нет |
|||||||||||||||||||
|
1 449 000 |
2010 |
2693А |
и |
48 000 |
Нет |
|||||||||||||||||||
|
1 449 900 |
2010 |
2693А |
и |
57 000 |
Нет |
|||||||||||||||||||
|
880 000 |
2004 |
2693А |
и |
183 000 |
Есть |
|||||||||||||||||||
|
1 459 000 |
2009 |
2693А |
и |
33 000 |
Есть |
|||||||||||||||||||
|
1 380 000 |
2008 |
2693А |
и |
60 000 |
Есть |
|||||||||||||||||||
|
1 799 999 |
2013 |
2693А |
и |
1 111 |
Есть |
|||||||||||||||||||
|
1 565 000 |
2009 |
2693А |
и |
39 000 |
Есть |
|||||||||||||||||||
|
1 890 000 |
2012 |
2693А |
и |
1 011 |
Есть |
|||||||||||||||||||
|
1 300 000 |
2008 |
2693А |
и |
120 000 |
Есть |
Размерность
МОДЕЛЬ |
ШТ |
ЦЕНА |
РУБ |
ГОД |
ГОД |
ДВИГАТЕЛЬ |
Л |
ТИП |
- |
ПРОБЕГ |
КМ |
КУЗОВ |
- |
- Исследовать зависимость функции от переменных
MODEL№ |
PRICE |
DATE |
MOTOR |
TYPE |
RUN |
BODY | |
1 |
200 000 |
1991 |
|
0 |
250 000 |
1 | |
2 |
680 000 |
1992 |
2693 |
0 |
311 000 |
1 | |
3 |
1 799 000 |
2013 |
2993 |
1 |
1 111 |
1 | |
4 |
1 899 000 |
2013 |
2993 |
1 |
1 111 |
1 | |
5 |
1 680 000 |
2013 |
2993 |
1 |
1 310 |
1 | |
6 |
1 850 000 |
2013 |
2993 |
1 |
151 |
1 | |
7 |
1 380 000 |
2008 |
2693 |
1 |
65 000 |
1 | |
8 |
1 730 000 |
2013 |
2693 |
1 |
1 300 |
1 | |
9 |
1 480 299 |
2010 |
2693 |
1 |
31 000 |
0 | |
10 |
1 820 000 |
2012 |
2693 |
1 |
1 450 |
1 | |
11 |
1 000 000 |
2006 |
2693 |
1 |
97 000 |
1 | |
12 |
1 510 000 |
2009 |
2693 |
1 |
74 000 |
1 | |
13 |
1 530 000 |
2010 |
2693 |
1 |
17 000 |
1 | |
14 |
1 210 000 |
2008 |
2693 |
1 |
90 000 |
1 | |
15 |
1 230 000 |
2008 |
2693 |
1 |
84 000 |
1 | |
16 |
1 350 000 |
2007 |
2693 |
1 |
90 000 |
1 | |
17 |
1 680 000 |
2010 |
2693 |
1 |
39 000 |
1 | |
18 |
1 900 000 |
2012 |
2693 |
1 |
1 300 |
1 | |
19 |
995 000 |
2005 |
2693 |
1 |
97 000 |
1 | |
20 |
1 060 000 |
2006 |
2693 |
1 |
174 000 |
1 | |
21 |
1 920 000 |
2013 |
2693 |
1 |
1 111 |
1 | |
22 |
1 280 000 |
2008 |
2693 |
1 |
107 000 |
1 | |
23 |
1 779 000 |
2012 |
2693 |
1 |
1 100 |
1 | |
24 |
500 000 |
1998 |
2693 |
1 |
240 000 |
1 | |
25 |
1 599 000 |
2010 |
2693 |
1 |
45 000 |
1 | |
26 |
1 897 000 |
2013 |
2693 |
1 |
2 960 |
1 | |
27 |
930 000 |
2005 |
2693 |
1 |
160 000 |
1 | |
28 |
1 330 000 |
2009 |
2693 |
1 |
82 000 |
0 | |
29 |
1 460 000 |
2010 |
2693 |
1 |
61 000 |
1 | |
30 |
820 000 |
2003 |
2693 |
1 |
153 000 |
1 | |
31 |
1 549 000 |
2010 |
2693 |
1 |
62 000 |
1 | |
32 |
1 449 000 |
2010 |
2693 |
1 |
48 000 |
1 | |
33 |
1 449 900 |
2010 |
2693 |
1 |
57 000 |
1 | |
34 |
880 000 |
2004 |
2693 |
1 |
183 000 |
1 | |
35 |
1 459 000 |
2009 |
2693 |
1 |
33 000 |
1 | |
36 |
1 380 000 |
2008 |
2693 |
1 |
60 000 |
1 | |
37 |
1 799 999 |
2013 |
2693 |
1 |
1 111 |
1 | |
38 |
1 565 000 |
2009 |
2693 |
1 |
39 000 |
1 | |
39 |
1 890 000 |
2012 |
2693 |
1 |
1 011 |
1 | |
40 |
1 300 000 |
2008 |
2693 |
1 |
120 000 |
1 |
Линейная модель
Парабола
Гипербола
Косинус
R2 |
Adj.R2 |
S.E. of regression |
Sum squared resid |
Akaike |
Schwarz | |
Линейная |
0.946811 |
0.938989 |
101861.5 |
3.53Е+11 |
26.03810 |
26.29143 |
Парабола |
0.946899 |
0.939090 |
101777.6 |
3.52Е+11 |
26.03645 |
26.28978 |
Гипербола |
0.946632 |
0.938784 |
102032.7 |
3.54Е+11 |
26.04146 |
26.29479 |
Косинус |
0.880930 |
0.863420 |
152405.5 |
7.90E+11 |
26.84396 |
27.09729 |
Данная модель в целом качественная, поскольку в ней значение prob(F-statistic) меньше уровня значимости α=0,05, на котором мы проверяем гипотезу о незначимости модели, а значит, гипотеза отклоняется.
Данная модель также в целом качественная, поскольку в ней значение prob(F-statistic) меньше уровня значимости α=0,05, на котором мы проверяем гипотезу о незначимости модели, а значит, гипотеза отклоняется.
На уровне 0,1 незначимы TYPE и MOTOR.
Исключили MOTOR (2.1):
Исключили TYPE (2.2):
:
Модель в целом значима, и все переменные на уровне значимости 0.1 значимы.
Сравним модели:
Остаточная сумма квадратов |
Коэффициент детерминации |
Стандартная ошибка регрессии |
Критерий Акаике |
Критерий Шварца | |
1.1 |
1.81Е+11 |
0.942512 |
101513.9 |
25.96582 |
26.09248 |
2.2 |
8.32Е+11 |
0.874509 |
147997.0 |
26.69648 |
26.78092 |
- Исследовать остатки наилучшей модели
2.1 График остатков;
постоянство мат. ожидания (и его равенство нулю):
2.2 Нормальное распределение:
а) гистограмма;
б) моменты ( асимметрия и эксцесс);
в) критерий Жарка-Бера;
Чтобы проверить гипотезу о его постоянстве используем статистику Жарка-Берра. Данная статистика проверяет гипотезу о нормальном распределении остатков модели, а нормальное распределение обладает нулевым мат.ожиданием. Поскольку probability меньше α (α=0,05), то мы отклоняем гипотезу о нормальном распределении. Посмотрим на значения асимметрии и эксцесса. Поскольку Skewness (асимметрия) равно 0,190888, то распределение правостороннее. Значение эксцесса (kurtosis)=2,154 (около 3). Мы можем принять гипотезу на уровне значимости 0,05.
а) критерий Уайта;
б) критерий Фишера;
Критерий Уайта в анализе no cross определяется по значению статистики χ2 (Obs R-squared). При этом для рассмотрения выдвигается гипотеза о гомоскедастичности остатков. В проведенном тесте значение ошибки для критерия Уайта =0,000974. Поэтому на уровне значимости α=0,05 мы отвергнем гипотезу и сделаем вывод о гетероскедастичности остатков.
Критерий Фишера проверяет ту же гипотезу, что и критерий Уайта, но имеет иную систему расчета. Для принятия гипотезы о гомоскедастичности остатков, prob(F-statistic) должна быть больше заданного уровня значимости α. В нашем случае для α=0,05 гипотеза будет отвергнута и сделан вывод о гетероскедастичности остатков.
2.4 Некоррелированность:
а) коррелограмма и Q-критерий Льюнга-Бокса;
б) критерий Дарбина-Уотсона;
Расчет статистики Льюинга-Бокса проверяет гипотезу о том, что автокорреляция n-го порядка равна нулю или, говоря другим языком, для каждого уровня расчета автокорреляция остатков отсутствует. Чтобы принять гипотезу, необходимо, чтобы Prob(Q-stat) была больше заданного уровня значимости α. В таком случае, для α=0,05 автокорреляция остатков всех уровней отсутствует.
b1 |
b1–t*S1 |
-782798,6 - 2,042*114897 |
-1017418,274 |
b1+t*S1 |
-782798,6 + 2,042*114897 |
-548178,926 | |
b2 |
b2–t*S2 |
25,38788- 2,042*1,244484 |
22,846643672 |
b2+t*S2 |
25,38788+2,042*1,244484 |
27, 929116328 | |
b3 |
b3–t*S3 |
-1*10^8-2,042*4936234 |
-110079789,828 |
b3+t*S3 |
-1*10^8+ 2,042*4936234 |
-89920210,172 |