Автор работы: Пользователь скрыл имя, 19 Декабря 2012 в 17:27, лабораторная работа
Цель работы: рассчитать парную регрессию и корреляцию, используя исходные данные.
Практические указания:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F - критерия Фишера и l – критерия Стьюдента.
4.Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющим 107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6.На одном графике отложить исходные данные и теоретическую прямую.
Министерство образования и науки Российской Федерации
ФГБУ ВПО
Уфимский государственный авиационный технический университет
Кафедра Экономики
предпринимательства
Лабораторная работа №2
по дисциплине
Статистика
Выполнил:
(ФИО)
Проверил:
Уфа 2012
Цель работы: рассчитать парную регрессию и корреляцию, используя исходные данные.
Практические указания:
F - критерия Фишера и l – критерия Стьюдента.
Исходные данные:
Номер региона |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб, х |
Среднедневная заработная плата, руб, у |
1 |
67 |
139 |
2 |
73 |
152 |
3 |
76 |
159 |
4 |
78 |
133 |
5 |
79 |
154 |
6 |
82 |
148 |
7 |
87 |
134 |
8 |
87 |
162 |
9 |
88 |
158 |
10 |
89 |
162 |
11 |
106 |
195 |
12 |
115 |
173 |
Уравнение линейной регрессии : у=а+bх+
Построение линейной регрессии сводится к оценке ее параметров.
Воспользуемся формулами:
,
,
b |
0,920430553 |
a |
76,9764852 |
где = - ковариация признаков х и у, = -дисперсия признака x и
Ковариация - числовая
характеристика совместного
Рассчитанные значения
ху |
х^2 |
У^2 |
Xсред |
Усред |
ХУсред |
Х^2сред |
cov(х,у) |
10374 |
6084 |
17689 |
85,58333 |
155,75 |
13484 |
7492,25 |
154,3958 |
12136 |
6724 |
21904 |
Y^2сред |
||||
11658 |
7569 |
17956 |
24531,42 |
||||
12166 |
6241 |
23716 |
|||||
14418 |
7921 |
26244 |
|||||
20670 |
11236 |
38025 |
|||||
9313 |
4489 |
19321 |
|||||
13904 |
7744 |
24964 |
|||||
11096 |
5329 |
23104 |
|||||
14094 |
7569 |
26244 |
|||||
12084 |
5776 |
25281 |
|||||
19895 |
13225 |
29929 |
|||||
161808 |
89907 |
294377 |
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии (-1≤ ≤1)
Линейный коэффициент парной корреляции | |||
=0,721025
Если Rxy > 0,7 - связь между изучаемыми показателями сильная, можно проводить анализ линейной модели
Если 0,3 < Rxy < 0,7 - связь между показателями умеренная, можно использовать нелинейную модель при отсутствии Rxy > 0,7
Если Rxy < 0,3 - связь слабая, модель строить нельзя
Следовательно связь между изучаемыми показателями сильная.
Дисперсия - характеристика случайной величины, определяемая как мат. ожидание квадрата отклонения случайной величины от ее математического ожидания. Мат. ожидание - сумма произведения значений случайной величины на соответствующие вероятности.
- общая дисперсия
аналогично для х.
дисперсия |
167,7430556 |
273,3541667 |
Оценку качества построенной модели даст коэффициент детерминации
Коэф.детерминации | |||
0,519877 |
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических
Допустимая ошибка аппроксимации не должна превышать 10%
Средняя ошибка аппроксимации 5,752052 | ||||
F - критерия Фишера и l – критерия Стьюдента.
Проводим
оценку значимости как линейного
уравнения регрессии в целом,
так и отдельных его
Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Оценка значимости уравнения
регрессии в целом производится на основе F-критерия
Фишера, которому предшествует дисперсионный анализ.
В математической статистике дисперсионный анализ
рассматривается как самостоятельный
инструмент статистического анализа.
В эконометрике он применяется как вспомогательное
средство для изучения качества регрессионной
модели. Согласно основной идее дисперсионного анализа, общая
сумма квадратов отклонений переменной
(y) от среднего значения (yср.) раскладывается
на две части – «объясненную»и «
где - общая сумма квадратов отклонений,
- сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений), - остаточная сумма квадратов отклонений, характеризующая влияние изученных в модели факторов.
Вычисления:
теорет.значение у | ||||||
148,7701 |
||||||
152,4518 |
||||||
157,0539 |
||||||
149,6905 |
||||||
158,8948 |
||||||
174,5421 |
||||||
138,6453 |
||||||
157,9744 |
||||||
144,1679 |
||||||
157,0539 |
||||||
146,9292 |
||||||
Сумма 182,826 |
||||||
(У-Теор.знач)/У |
(Теор.знач-Усред)^2 |
(y-Усред)^2 |
(у-теор зн)^2 | |||
0,118571942 |
48,71944641 |
517,5625 |
248,6950545 | |||
0,030079666 |
10,87818578 |
60,0625 |
19,81843883 | |||
0,172044353 |
1,700268085 |
473,0625 |
531,4843009 | |||
0,027983774 |
36,71755405 |
3,0625 |
18,57180006 | |||
0,019167874 |
9,889794641 |
39,0625 |
9,642239787 | |||
0,104912186 |
353,1439163 |
1540,5625 |
418,5246993 | |||
0,002551567 |
292,5696595 |
280,5625 |
0,125789228 | |||
0,000162191 |
4,947838961 |
5,0625 |
0,0006567 | |||
0,051526871 |
134,1446803 |
14,0625 |
61,3415469 | |||
0,030531214 |
1,700268085 |
39,0625 |
24,46347705 | |||
0,075916936 |
77,80638556 |
10,5625 |
145,7040387 | |||
0,056797681 |
733,1097087 |
297,5625 |
96,55025159 | |||
Сумма0,690246254 |
1705,327706 |
3280,25 |
1574,922294 |
Вычисленная дисперсия на одну степень свободы:
S^2факт |
1705,328 |
S^2общ |
298,2045 |
S^2ост |
157,4922 |
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера. Фактическое значение F -критерия Фишера сравнивается с табличным значением Fтабл. (α, k1, k2) при заданном уровне значимости α и степенях свободы k1= m и k2=n-m-1. При этом, если фактическое значение F-критерия больше табличного Fфакт > Fтеор, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:
Эта формула в общем виде может выглядеть так:
Величина критерия Фишера тесно связана с коэффициентов детерминации, чтобы определить, при каких значениях R2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор - делаем вывод о статистической значимостиуравнения регрессии. Величина F-критерия связана с коэффициентом детерминации R2xy (r2xy) и ее можно рассчитать по следующей формуле:
Вычисления: 10,82801 - критерий Фишера
F-критерий Фишера |
10,82801173 |
Табличный |
4,96 |
Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента
Для оценки статистической значимости параметров регрессии и корреляции рассчитываются t – критерий Стьюдента и доверительные интервалы каждого из показателей. Оценка значимости коэффициента регрессии и корреляции с помощью t- критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки.
Mb |
0,279715587 |
Ma |
24,21156138 |
Mr(xy) |
0,21911701 |
Определим стандартные ошибки: