Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа
Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .
ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ
Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F – критерия Фишера статистическую надежность результатов регрессионного моделирования.
7. По значениям характеристик, рассчитанных в пп. 4,5,6, выберите лучшее уравнение регрессии и дайте его обоснование.
8. Рассчитайте прогнозное значение заработной платы y , если прогнозное значение среднедушевого прожиточного минимума x увеличится на 10 % от его среднего значения.
9. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости α = 0,05.
10. Оцените полученные результаты, сделайте выводы.
Номер региона |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x |
Среднедневная заработная плата, руб., y |
1 |
81 |
124 |
2 |
77 |
131 |
3 |
85 |
146 |
4 |
79 |
139 |
5 |
93 |
143 |
6 |
100 |
159 |
7 |
72 |
135 |
8 |
90 |
152 |
9 |
71 |
127 |
10 |
89 |
154 |
11 |
82 |
127 |
12 |
111 |
162 |
Цель работы - овладеть навыками определения параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel.
Рисунок 1 - Поле корреляции
Линейная модель парной регрессии и корреляции: ŷ = a0 + a1∙ x.
Таблица 1 Расчет показателей парной линейной регрессии и корреляции
№ |
x |
y |
xy |
x2 |
y2 |
ŷ |
(y-ŷ)² |
A |
1 |
81 |
124 |
10044 |
6561 |
15376 |
137,005 |
10,488 |
81 |
2 |
77 |
131 |
10087 |
5929 |
17161 |
133,216 |
1,692 |
77 |
3 |
85 |
146 |
12410 |
7225 |
21316 |
140,794 |
3,566 |
85 |
4 |
79 |
139 |
10981 |
6241 |
19321 |
135,111 |
2,798 |
79 |
5 |
93 |
143 |
13299 |
8649 |
20449 |
148,372 |
3,757 |
93 |
6 |
100 |
159 |
15900 |
10000 |
25281 |
155,002 |
2,514 |
100 |
7 |
72 |
135 |
9720 |
5184 |
18225 |
128,480 |
4,830 |
72 |
8 |
90 |
152 |
13680 |
8100 |
23104 |
145,530 |
4,256 |
90 |
9 |
71 |
127 |
9017 |
5041 |
16129 |
127,533 |
0,419 |
71 |
10 |
89 |
154 |
13706 |
7921 |
23716 |
144,583 |
6,115 |
89 |
11 |
82 |
127 |
10414 |
6724 |
16129 |
137,952 |
8,624 |
82 |
12 |
111 |
162 |
17982 |
12321 |
26244 |
165,422 |
2,112 |
111 |
Итого |
1030 |
1699 |
147240 |
89896 |
242451 |
1699 |
51,171 |
1030 |
Среднее значение |
85,833 |
141,58 |
12270 |
7491,333 |
20204,25 |
141,583 |
4,264 |
85,8333 |
Решим систему по формуле:
Система нормальных уравнений составит:
12 ∙ a0 + a1∙ 1030 = 1699
a0 ∙ 1030 + a1∙ 89896 = 147240
Параметры уравнения определяются по следующим формулам:
a0 = y - a1 ∙ x; a1 = (y ∙ x)/(x2 - (x)2)
Получим: a1 = 0,947; a0 = 60,279.
Уравнение линейной регрессии имеет вид: ŷ = 60,279 + 0,947 ∙ x.
Величина коэффициента регрессии a1 = 0,947 означает, что с ростом среднедушевого прожиточного минимума в день одного трудоспособного на 1 руб. среднедневная заработная плата увеличится в среднем на 0,947 руб.
Линейный коэффициент парной корреляции: rxy = σx/σy.
Показатель тесноты связи = 0,838. (коэффициент корреляции > 0,7, значит связь сильная (выше средней)).
Коэффициент детерминации: r2xy = 1- σ2ост./σ2y = 0,702.
Таким образом, вариация величины среднедневной заработной платы на 70,2% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 29,8% от вариации приходится влияние факторов, не включенных в модель. Коэффициент характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака.
Средняя ошибка аппроксимации характеризует качество модели:
Ā = 1/n ∙ ∑|(y - ŷ)/y| = 4,264 %
Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.
С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования:
F факт. = r2xy∙ (n - 2)/(1- r2xy)
Fфакт = 23,579; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.
Степенная модель парной регрессии и корреляции: ŷ = a0 ∙ x a1.
Таблица 2 Расчет показателей парной степенной модели линейной регрессии и корреляции
№ |
x |
y |
X=lnx |
Y=lny |
XY |
X2 |
Y2 |
ŷ=ea0 * Xa1 |
(y-ŷ)2 |
A |
1 |
81 |
124 |
4,3944 |
4,8203 |
21,182 |
19,311 |
23,235 |
136,98802 |
168,68 |
10,4742 |
2 |
77 |
131 |
4,3438 |
4,8752 |
21,176 |
18,868 |
23,767 |
133,00727 |
4,0291 |
1,5323 |
3 |
85 |
146 |
4,4427 |
4,9836 |
22,140 |
19,737 |
24,836 |
140,88746 |
26,138 |
3,5017 |
4 |
79 |
139 |
4,3694 |
4,9345 |
21,560 |
19,092 |
24,349 |
135,00817 |
15,934 |
2,8718 |
5 |
93 |
143 |
4,5326 |
4,9628 |
22,494 |
20,544 |
24,629 |
148,4633 |
29,848 |
3,8205 |
6 |
100 |
159 |
4,6052 |
5,0689 |
23,343 |
21,207 |
25,693 |
154,8714 |
17,044 |
2,5965 |
7 |
72 |
135 |
4,2767 |
4,9053 |
20,978 |
18,289 |
24,061 |
127,90768 |
50,300 |
5,2536 |
8 |
90 |
152 |
4,4998 |
5,0239 |
22,606 |
20,248 |
25,239 |
145,65554 |
40,252 |
4,1740 |
9 |
71 |
127 |
4,2627 |
4,8442 |
20,649 |
18,170 |
23,466 |
126,87021 |
0,0168 |
0,1022 |
10 |
89 |
154 |
4,4886 |
5,0370 |
22,609 |
20,147 |
25,370 |
144,71096 |
86,286 |
6,0318 |
11 |
82 |
127 |
4,4067 |
4,8442 |
21,347 |
19,419 |
23,466 |
137,97028 |
120,34 |
8,6380 |
12 |
111 |
162 |
4,7095 |
5,0876 |
23,960 |
22,179 |
25,883 |
164,57463 |
6,6288 |
1,5893 |
Итого |
1030 |
1699 |
53,332 |
59,387 |
264,04 |
237,216 |
293,99 |
1696,9150 |
565,51 |
50,586 |
Среднее значение |
85,83 |
141,58 |
4,4443 |
4,9489 |
22,004 |
19,768 |
24,500 |
141,40959 |
47,126 |
4,2155 |
Параметры уравнения определяются по следующим формулам:
a0 = Y - a1 ∙ X; a1 = (Y∙ X - X∙ Y)/(X2 - (X)2)
Получим: a1 = 0,582; a0 = 2,361.
Уравнение степенной модели регрессии имеет вид: ŷ = 2,361 ∙ x 0,582.
Индекс корреляции: rxy = √ 1 -σ2ост/σ2y.
Показатель тесноты связи = 0,838. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь хорошая.
σ2y - общая дисперсия результативного признака = 158,410.
σ2ост - остаточная дисперсия = 47,126.
Коэффициент детерминации = 0,703
Таким образом, вариация величины среднедневной заработной платы на 70,3% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 29,7% от вариации приходится влияние факторов, не включенных в модель.
Средняя ошибка аппроксимации: Ā = 1/n ∙ ∑|y - ŷ|/y ∙ 100% = 4,216 %
Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.
С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 23,614; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.
Экспоненциальная модель парной регрессии и корреляции: ŷ = ea0 +x ∙a1.
Таблица 3 Расчет показателей экспоненциальной нелинейной регрессии и корреляции
№ |
x |
y |
X=x |
Y=lny |
XY |
X2 |
Y2 |
ŷ=ea0+a1x |
(y-ŷ)2 |
A |
1 |
81 |
124 |
81 |
4,8203 |
390,4428 |
6561 |
23,2351 |
136,6150 |
159,139 |
10,173 |
2 |
77 |
131 |
77 |
4,8752 |
375,3902 |
5929 |
23,7675 |
133,0686 |
4,2791 |
1,5791 |
3 |
85 |
146 |
85 |
4,9836 |
423,6066 |
7225 |
24,8363 |
140,2560 |
32,9936 |
3,9343 |
4 |
79 |
139 |
79 |
4,9345 |
389,8234 |
6241 |
24,3490 |
134,8302 |
17,3876 |
2,9999 |
5 |
93 |
143 |
93 |
4,9628 |
461,5446 |
8649 |
24,6298 |
147,8316 |
23,3443 |
3,3787 |
6 |
100 |
159 |
100 |
5,0689 |
506,8904 |
10000 |
25,6938 |
154,7952 |
17,6806 |
2,6446 |
7 |
72 |
135 |
72 |
4,9053 |
353,1798 |
5184 |
24,0617 |
128,7647 |
38,8786 |
4,6187 |
8 |
90 |
152 |
90 |
5,0239 |
452,1492 |
8100 |
25,2394 |
144,9439 |
49,7879 |
4,6421 |
9 |
71 |
127 |
71 |
4,8442 |
343,9373 |
5041 |
23,4661 |
127,9208 |
0,8479 |
0,7250 |
10 |
89 |
154 |
89 |
5,0370 |
448,2888 |
7921 |
25,3709 |
143,9940 |
100,120 |
6,4974 |
11 |
82 |
127 |
82 |
4,8442 |
397,2233 |
6724 |
23,4661 |
137,5163 |
110,592 |
8,2806 |
12 |
111 |
162 |
111 |
5,0876 |
564,7232 |
12321 |
25,8836 |
166,4066 |
19,4177 |
2,7201 |
Итого |
1030 |
1699 |
1030 |
59,3874 |
5107,1996 |
89896 |
293,999 |
1696,942 |
574,469 |
52,193 |
Среднее значение |
85,83 |
141,58 |
85,83 |
4,9489 |
425,6000 |
7491,3 |
24,5000 |
141,4119 |
47,8725 |
4,3495 |
Параметры уравнения: a1 = 0,007; a0 = 4,385.
Уравнение экспоненциальной регрессии имеет вид: ŷ = e 4,385+x ∙ 0,007.
Величина коэффициента эластичности = 0,564 означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного на 1%, среднедневная заработная плата увеличится на 0,564%.
Индекс корреляции: rxy = √ 1 - ∑(y - ŷ)2 /∑(y -ȳ)2
Показатель тесноты связи = 0,835. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь сильная.
Коэффициент детерминации = 0,698.
Таким образом, вариация величины среднедневной заработной платы на 69,8% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 30,2% от вариации приходится влияние факторов, не включенных в модель.
Средняя ошибка аппроксимации: Ā = ∑|(y - ŷx)|/y ∙ 100% = 4,350 %
Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.
С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 23,090; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.
Полулогарифмическая модель парной регрессии и корреляции: ŷ = a0 +ln x ∙a1.
Таблица 4 Расчет показателей парной полулогарифмической регрессии и корреляции
№ |
x |
y |
X=lnx |
Y=y |
XY |
X2 |
Y2 |
ŷ=a0+a1lnx |
A |
(y-ŷ)2 |
1 |
81 |
124 |
4,3944 |
124 |
544,912 |
19,311 |
15376 |
137,403 |
10,809 |
179,64 |
2 |
77 |
131 |
4,3438 |
131 |
569,039 |
18,869 |
17161 |
133,160 |
1,649 |
4,667 |
3 |
85 |
146 |
4,4427 |
146 |
648,627 |
19,737 |
21316 |
141,441 |
3,122 |
20,78 |
4 |
79 |
139 |
4,3694 |
139 |
607,353 |
19,092 |
19321 |
135,309 |
2,656 |
13,627 |
5 |
93 |
143 |
4,5326 |
143 |
648,162 |
20,544 |
20449 |
148,977 |
4,180 |
35,72 |
6 |
100 |
159 |
4,6052 |
159 |
732,222 |
21,208 |
25281 |
155,056 |
2,480 |
15,55 |
7 |
72 |
135 |
4,2767 |
135 |
577,350 |
18,290 |
18225 |
127,536 |
5,529 |
55,71 |
8 |
90 |
152 |
4,4998 |
152 |
683,971 |
20,248 |
23104 |
146,230 |
3,796 |
33,29 |
9 |
71 |
127 |
4,2627 |
127 |
541,360 |
18,170 |
16129 |
126,364 |
0,501 |
0,404 |
10 |
89 |
154 |
4,4886 |
154 |
691,250 |
20,148 |
23716 |
145,294 |
5,653 |
75,800 |
11 |
82 |
127 |
4,4067 |
127 |
559,653 |
19,419 |
16129 |
138,431 |
9,001 |
130,66 |
12 |
111 |
162 |
4,7095 |
162 |
762,944 |
22,180 |
26244 |
163,799 |
1,111 |
3,237 |
Итого |
1030 |
1699 |
53,332 |
1699 |
7566,84 |
237,216 |
242451 |
1699,000 |
50,487 |
569,11 |
Среднее значение |
85,83 |
141,5 |
4,4443 |
141,5 |
630,570 |
19,768 |
20204,2 |
141,583 |
4,207 |
47,42 |