Автор работы: Пользователь скрыл имя, 20 Марта 2013 в 22:01, контрольная работа
1. Рассчитайте параметры уравнения линейной регрессии.
2. Оцените тесноту связи с помощью показателей корреляции и
детерминации.
3. Определите среднюю ошибку аппроксимации. Сделайте вывод.
4. Оцените статистическую надежность регрессионного моделирования с
помощью F-критерия Фишера и t-критерия Стьюдента.
5. Оцените полученные результаты, оформите выводы.
ВАРИАНТ 4
1. Рассчитайте параметры уравнения линейной регрессии.
2. Оцените тесноту связи с помощью показателей корреляции и
детерминации.
3. Определите среднюю
ошибку аппроксимации.
4. Оцените статистическую
надежность регрессионного
помощью F-критерия Фишера и t-критерия Стьюдента.
5. Оцените полученные результаты, оформите выводы.
ТАБЛИЦА 4
район |
Средняя заработная плата и выплаты соц.характера, тыс.руб.,у |
Прожиточный минимум в среднем на душу населения, тыс.руб., х |
Брянская область |
615 |
289 |
Владимирская область |
727 |
338 |
Ивановская область |
584 |
287 |
Калужская область |
753 |
324 |
Костромская область |
707 |
307 |
Орловская область |
657 |
304 |
Рязанская область |
654 |
307 |
Смоленская область |
693 |
290 |
Тверская область |
704 |
314 |
Тульская область |
780 |
304 |
Ярославская область |
830 |
341 |
Респ. Марий Эл |
554 |
364 |
Респ. Мордовия |
560 |
342 |
Чувашская Респ. |
545 |
310 |
Кировская область |
672 |
411 |
Нижегородская область |
796 |
304 |
Fтабл.=4,60 (a=0,05) |
=85,89 |
=31,28 |
Решение
1.
а) Вводим данные в таблицу (Excel)- столбцы №, х, у:
район |
x |
y |
x2 |
y2 |
x • y | |
Брянская область |
289 |
615 |
83521 |
378225 |
177735 | |
Владимирская область |
338 |
727 |
114244 |
528529 |
245726 | |
Ивановская область |
287 |
584 |
82369 |
341056 |
167608 | |
Калужская область |
324 |
753 |
104976 |
567009 |
243972 | |
Костромская область |
307 |
707 |
94249 |
499849 |
217049 | |
Орловская область |
304 |
657 |
92416 |
431649 |
199728 | |
Рязанская область |
307 |
654 |
94249 |
427716 |
200778 | |
Смоленская область |
290 |
693 |
84100 |
480249 |
200970 | |
Тверская область |
314 |
704 |
98596 |
495616 |
221056 | |
Тульская область |
304 |
780 |
92416 |
608400 |
237120 | |
Ярославская область |
341 |
830 |
116281 |
688900 |
283030 | |
Респ. Марий Эл |
364 |
554 |
132496 |
306916 |
201656 | |
Респ. Мордовия |
342 |
560 |
116964 |
313600 |
191520 | |
Чувашская Респ. |
310 |
545 |
96100 |
297025 |
168950 | |
Кировская область |
411 |
672 |
168921 |
451584 |
276192 | |
Нижегородская область |
304 |
796 |
92416 |
633616 |
241984 | |
итого |
5136 |
10831 |
1664314 |
7449939 |
3475074 | |
Среднее |
321 |
676,94 |
217192,13 | |||
31,28 |
85,89 |
|||||
978,63 |
7376,81 |
б) Рассчитываем параметры уравнения y=a+bx с помощью статистической
функции ЛИНЕЙН. Получаем следующую статистику:
b |
-0,11 |
711,32 |
а |
0,73 |
236,48 |
||
R |
0,152 |
91,75 |
S |
F |
0,0213 |
500,04 |
Ч.с.с |
179,61 |
8417,81 |
Записываем
уравнение парной линейной регрессии:
y = -0.11 x + 711.32
Вывод: экономический смысл уравнения: с увеличением средней
заработной платы и выплат социального характера х на 1 руб.-
прожиточный минимум в среднем на душу населения у снижается в
среднем на 0,11 руб.
2.
а) Рассчитываем коэффициент корреляции:
* по формуле:
*
с помощью статистической
Связь между переменными прямая, средняя, близкая к сильной, т.е.
величина прожиточного минимума в среднем на душу населения в
значительной мере зависит от средней заработной платы и выплат
социального характера.
б) Величина коэффициента детерминации получена с помощью функции
ЛИНЕЙН R2=r2xy=0,152, то есть в 15% случаев изменения прожиточного
минимума на душу населения приводят к изменению заработной платы и
выплат соц. Характера. Другими словами- точность подбора уравнения
регрессии 15%-низка.
3. Для определения средней ошибки аппроксимации рассчитываем
столбцы ух, у-ух, Ai.
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
у-ух |
Ai | |
289 |
615 |
680.36 |
3836.25 |
4272.55 |
1024 |
0.11 |
- 65,36 |
- 10,6 | |
338 |
727 |
675.12 |
2506.25 |
2691.87 |
289 |
0.0714 |
51,88 |
7,1 | |
287 |
584 |
680.58 |
8637.38 |
9327.5 |
1156 |
0.17 |
- 96,58 |
- 16,5 | |
324 |
753 |
676.62 |
5785.5 |
5834.49 |
9 |
0.1 |
76,38 |
10,1 | |
307 |
707 |
678.44 |
903.75 |
815.85 |
196 |
0.0404 |
28,56 |
4 | |
304 |
657 |
678.76 |
397.5 |
473.42 |
289 |
0.0331 |
- 21,76 |
- 3,3 | |
307 |
654 |
678.44 |
526.13 |
597.16 |
196 |
0.0374 |
- 24,44 |
- 3,7 | |
290 |
693 |
680.26 |
258 |
162.37 |
961 |
0.0184 |
12,74 |
1,8 | |
314 |
704 |
677.69 |
732.38 |
692.36 |
49 |
0.0374 |
26,31 |
3,7 | |
304 |
780 |
678.76 |
10621.88 |
10249.9 |
289 |
0.13 |
101,24 |
13 | |
341 |
830 |
674.8 |
23428.13 |
24088.45 |
400 |
0.19 |
155,2 |
18,7 | |
364 |
554 |
672.33 |
15113.63 |
14002.49 |
1849 |
0.21 |
- 118,33 |
- 21,4 | |
342 |
560 |
674.69 |
13674.38 |
13153.42 |
441 |
0.2 |
- 114,69 |
- 20,5 | |
310 |
545 |
678.12 |
17407.5 |
17719.77 |
121 |
0.24 |
- 133,12 |
- 24,4 | |
411 |
672 |
667.3 |
24.38 |
22.11 |
8100 |
0.007 |
4,7 |
0,7 | |
304 |
796 |
678.76 |
14175.88 |
13745.63 |
289 |
0.15 |
117,24 |
14,7 | |
5136 |
10831 |
10831 |
118028.94 |
117849.33 |
15658 |
1.74 |
Ошибка аппроксимации
в пределах 5%-7% свидетельствует
о хорошем
подборе уравнения
регрессии к исходным
данным.
4. Оценка статистической значимости
а) по критерию Фишера:
1. Выдвигаем нулевую гипотезу о статистической незначимости
параметров регрессии и показателя корреляции a=b=r=0;
2. Фактическое значение критерия получено из функции ЛИНЕЙН-
F=0,0213;
3.
Для определения табличного
рассчитываем коэффициенты k1=m=1 и k2=n-m-1=500,04, Fтабл = 4.6.
4.
Сравниваем фактическое и
т.е. нулевую гипотезу отклоняем и делаем вывод о статистической
значимости и надежности полученной модели.
б) по критерию Стьюдента:
1.
. Выдвигаем нулевую гипотезу
о статистически незначимом
показателе от нуля: a=b=r=0;
2. Табличное значение t-критерия зависит от числа степеней свободы и
заданного уровня значимости а. Уровень значимости- это вероятность
отвергнуть правильную гипотезу при условии, что она верна. Для числа
степеней свободы 500,04 и уровня значимости а=0,05 t =2,14
3.
Фактические значения t-
параметра модели. С этой целью сначала определяются случайные ошибки
параметров m m m
Где
n- число наблюдений, m- число независимых переменных.
Рассчитаем фактические значения t-критерия:
4.
Сравниваем фактические
Нулевую гипотезу отклоняем, параметры a, b, r - не случайно отличаются
от нуля и являются статистически значимыми и надежными.
5. Вывод: Рассчитав показатели 16-ти объектов, оценив качество
построенной модели: по коэффициенту корреляции rxy>0 связь между
переменными прямая, средняя, близко к сильной, таким образом в
просматриваемых объектах заработная плата и выплаты социального
характера зависят от среднего прожиточного минимума на душу
населения, по r2=0,152- доля процента низка. По средней ошибке
аппроксимации %, видно, что качество модели не превышает допустимого
предела, что говорит о хорошем качестве модели.
Оценив значимость модели по критерию Фишера:
1 шаг. Выдвигаем нулевую гипотезу о статистической незначимости
параметров регрессии и показателя корреляции a=b=r=0;
2 шаг. Фактическое значение критерия получено из функции ЛИНЕЙН-
F=0,0213;
3 шаг. Для определения табличного значения рассчитываем критерия
рассчитываем коэффициенты k1=m=1 и k2=n-m-1=500,04, Fтабл = 4.6.
4 шаг. Сравниваем фактическое и табличное значение критерия
Fфакт>Fтабл, т.е. нулевую гипотезу отклоняем и делаем вывод о
статистической значимости и надежности полученной модели. Такую
модель можно использовать для прогнозирования.
Оценив качество модели по критерию Стьюдента:
1 шаг. Выдвигаем нулевую гипотезу о статистически незначимом отличии
показателе от нуля: a=b=r=0;
2 шаг. Табличное значение t-критерия зависит от числа степеней свободы и
заданного уровня значимости а. Уровень значимости- это вероятность
отвергнуть правильную гипотезу при условии, что она верна. Для числа
степеней свободы 500,04 и уровня значимости а=0,05 t =2,14
3 шаг. Фактические значения t-критерия рассчитываются отдельно для
каждого параметра модели. С этой целью сначала определяются
случайные ошибки параметров m m m
4 шаг. Сравниваем фактические значения t-критерия с табличным
значением:
Нулевую гипотезу отклоняем, параметры a, b, r - не случайно отличаются
от нуля и являются статистически значимыми и надежными.
Основная литература:
статистика, 2002, с. 90..176.
Начальный курс. Учебное пособие. – 2-е изд., испр. – М.: Дело, 2001,
с. 43..124.
Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.:
Финансы и статистика, 2002, с. 49..105.
Дополнительная литература:
эконометрики. – М.: ЮНИТИ, 1998.
2. Эддоус М., Стэнсфилд Р. Методы принятия решения. – М.: ЮНИТИ,
1997.