Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа

Краткое описание

Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

Прикрепленные файлы: 1 файл

teoria.doc

— 601.50 Кб (Скачать документ)

ПАРНАЯ РЕГРЕССИЯ И  КОРРЕЛЯЦИЯ

Задача 1. По территориям региона приводятся данные за 200X г.

Требуется:

1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.

3. Оцените тесноту связи с помощью показателей корреляции, детерминации.

4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

5. Оцените с помощью средней ошибки аппроксимации качество уравнений.

6. Оцените с помощью F – критерия Фишера статистическую надежность результатов регрессионного моделирования.

7. По значениям характеристик, рассчитанных в пп. 4,5,6, выберите лучшее уравнение регрессии и дайте его обоснование.

8. Рассчитайте прогнозное значение заработной платы y , если прогнозное значение среднедушевого прожиточного минимума x увеличится на 10 % от его среднего значения.

9. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости α = 0,05.

10. Оцените полученные результаты, сделайте выводы.

Номер

региона

Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x

Среднедневная заработная плата, руб., y

1

81

124

2

77

131

3

85

146

4

79

139

5

93

143

6

100

159

7

72

135

8

90

152

9

71

127

10

89

154

11

82

127

12

111

162


Цель работы - овладеть навыками определения параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel.

 

Рисунок 1 - Поле корреляции

Линейная модель парной регрессии и корреляции: ŷ = a0 + a1∙ x.

Таблица 1 Расчет показателей  парной линейной регрессии и корреляции

x

y

xy

x2

y2

ŷ

(y-ŷ)²

A

1

81

124

10044

6561

15376

137,005

10,488

81

2

77

131

10087

5929

17161

133,216

1,692

77

3

85

146

12410

7225

21316

140,794

3,566

85

4

79

139

10981

6241

19321

135,111

2,798

79

5

93

143

13299

8649

20449

148,372

3,757

93

6

100

159

15900

10000

25281

155,002

2,514

100

7

72

135

9720

5184

18225

128,480

4,830

72

8

90

152

13680

8100

23104

145,530

4,256

90

9

71

127

9017

5041

16129

127,533

0,419

71

10

89

154

13706

7921

23716

144,583

6,115

89

11

82

127

10414

6724

16129

137,952

8,624

82

12

111

162

17982

12321

26244

165,422

2,112

111

Итого

1030

1699

147240

89896

242451

1699

51,171

1030

Среднее значение

85,833

141,58

12270

7491,333

20204,25

141,583

4,264

85,8333


 

Решим систему по формуле:

Система нормальных уравнений  составит:

12 ∙ a0 + a1∙ 1030 = 1699

a0 ∙ 1030 + a1∙ 89896 =  147240

Параметры уравнения  определяются  по следующим формулам:

a0 = y - a1 ∙ x; a1 = (y ∙ x)/(x2 - (x)2)

Получим: a1 = 0,947; a0 = 60,279.

Уравнение линейной регрессии  имеет вид: ŷ = 60,279 + 0,947 ∙ x.

Величина коэффициента регрессии a1 = 0,947 означает, что с ростом среднедушевого прожиточного минимума в день одного трудоспособного на 1 руб. среднедневная заработная плата увеличится в среднем на 0,947 руб.

Линейный коэффициент  парной корреляции: rxy = σxy.

Показатель тесноты  связи = 0,838. (коэффициент корреляции > 0,7, значит связь сильная (выше средней)).

Коэффициент детерминации: r2xy = 1- σ2ост.2y = 0,702.

Таким образом, вариация величины среднедневной заработной платы на 70,2% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 29,8% от вариации приходится влияние факторов, не включенных в модель. Коэффициент характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака.

Средняя ошибка аппроксимации характеризует качество модели:

Ā = 1/n ∙ ∑|(y - ŷ)/y| = 4,264 %

Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования:

F факт. = r2xy∙ (n - 2)/(1- r2xy)

Fфакт = 23,579; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.

 

Степенная модель парной регрессии и корреляции: ŷ = a0 ∙ x a1.

Таблица 2 Расчет показателей парной степенной модели линейной регрессии и корреляции

x

y

X=lnx

Y=lny

XY

X2

Y2

ŷ=ea0 * Xa1

(y-ŷ)2

A

1

81

124

4,3944

4,8203

21,182

19,311

23,235

136,98802

168,68

10,4742

2

77

131

4,3438

4,8752

21,176

18,868

23,767

133,00727

4,0291

1,5323

3

85

146

4,4427

4,9836

22,140

19,737

24,836

140,88746

26,138

3,5017

4

79

139

4,3694

4,9345

21,560

19,092

24,349

135,00817

15,934

2,8718

5

93

143

4,5326

4,9628

22,494

20,544

24,629

148,4633

29,848

3,8205

6

100

159

4,6052

5,0689

23,343

21,207

25,693

154,8714

17,044

2,5965

7

72

135

4,2767

4,9053

20,978

18,289

24,061

127,90768

50,300

5,2536

8

90

152

4,4998

5,0239

22,606

20,248

25,239

145,65554

40,252

4,1740

9

71

127

4,2627

4,8442

20,649

18,170

23,466

126,87021

0,0168

0,1022

10

89

154

4,4886

5,0370

22,609

20,147

25,370

144,71096

86,286

6,0318

11

82

127

4,4067

4,8442

21,347

19,419

23,466

137,97028

120,34

8,6380

12

111

162

4,7095

5,0876

23,960

22,179

25,883

164,57463

6,6288

1,5893

Итого

1030

1699

53,332

59,387

264,04

237,216

293,99

1696,9150

565,51

50,586

Среднее

значение

85,83

141,58

4,4443

4,9489

22,004

19,768

24,500

141,40959

47,126

4,2155


 

Параметры уравнения определяются по следующим формулам:

a0 = Y - a1 ∙ X; a1 = (Y∙ X - X∙ Y)/(X2 - (X)2)

Получим: a1 = 0,582; a0 = 2,361.

Уравнение степенной модели регрессии имеет вид: ŷ = 2,361 ∙ x 0,582.

Индекс корреляции: rxy = √ 1 -σ2ост2y.

Показатель тесноты  связи = 0,838. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь хорошая.

σ2y - общая дисперсия результативного признака  = 158,410.

σ2ост - остаточная дисперсия = 47,126.

Коэффициент детерминации = 0,703

Таким образом, вариация величины среднедневной заработной платы на 70,3% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 29,7% от вариации приходится влияние факторов, не включенных в модель.

Средняя ошибка аппроксимации: Ā = 1/n ∙ ∑|y - ŷ|/y ∙ 100% = 4,216 %

Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 23,614; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.

 

Экспоненциальная  модель парной регрессии и корреляции: ŷ = ea0 +x ∙a1.

Таблица 3 Расчет показателей экспоненциальной нелинейной регрессии и корреляции

x

y

X=x

Y=lny

XY

X2

Y2

ŷ=ea0+a1x

(y-ŷ)2

A

1

81

124

81

4,8203

390,4428

6561

23,2351

136,6150

159,139

10,173

2

77

131

77

4,8752

375,3902

5929

23,7675

133,0686

4,2791

1,5791

3

85

146

85

4,9836

423,6066

7225

24,8363

140,2560

32,9936

3,9343

4

79

139

79

4,9345

389,8234

6241

24,3490

134,8302

17,3876

2,9999

5

93

143

93

4,9628

461,5446

8649

24,6298

147,8316

23,3443

3,3787

6

100

159

100

5,0689

506,8904

10000

25,6938

154,7952

17,6806

2,6446

7

72

135

72

4,9053

353,1798

5184

24,0617

128,7647

38,8786

4,6187

8

90

152

90

5,0239

452,1492

8100

25,2394

144,9439

49,7879

4,6421

9

71

127

71

4,8442

343,9373

5041

23,4661

127,9208

0,8479

0,7250

10

89

154

89

5,0370

448,2888

7921

25,3709

143,9940

100,120

6,4974

11

82

127

82

4,8442

397,2233

6724

23,4661

137,5163

110,592

8,2806

12

111

162

111

5,0876

564,7232

12321

25,8836

166,4066

19,4177

2,7201

Итого

1030

1699

1030

59,3874

5107,1996

89896

293,999

1696,942

574,469

52,193

Среднее значение

85,83

141,58

85,83

4,9489

425,6000

7491,3

24,5000

141,4119

47,8725

4,3495


 

Параметры уравнения: a1 = 0,007; a0 = 4,385.

Уравнение экспоненциальной регрессии имеет вид: ŷ = e 4,385+x ∙ 0,007.

Величина коэффициента эластичности = 0,564 означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного на 1%, среднедневная заработная плата увеличится на 0,564%.

Индекс корреляции: rxy = √ 1 - ∑(y - ŷ)2 /∑(y -ȳ)2

Показатель тесноты  связи = 0,835. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь сильная.

Коэффициент детерминации = 0,698.

Таким образом, вариация величины среднедневной заработной платы на 69,8% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 30,2% от вариации приходится  влияние факторов, не включенных в модель.

Средняя ошибка аппроксимации: Ā = ∑|(y - ŷx)|/y ∙ 100% = 4,350 %

Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 23,090; Fтабл = 4,96. Так как Fфакт > Fтабл, уравнение регрессии значимо, статистически надежно.

Полулогарифмическая модель парной регрессии и корреляции: ŷ = a0 +ln x ∙a1.

Таблица 4 Расчет показателей парной полулогарифмической регрессии и корреляции

x

y

X=lnx

Y=y

XY

X2

Y2

ŷ=a0+a1lnx

A

(y-ŷ)2

1

81

124

4,3944

124

544,912

19,311

15376

137,403

10,809

179,64

2

77

131

4,3438

131

569,039

18,869

17161

133,160

1,649

4,667

3

85

146

4,4427

146

648,627

19,737

21316

141,441

3,122

20,78

4

79

139

4,3694

139

607,353

19,092

19321

135,309

2,656

13,627

5

93

143

4,5326

143

648,162

20,544

20449

148,977

4,180

35,72

6

100

159

4,6052

159

732,222

21,208

25281

155,056

2,480

15,55

7

72

135

4,2767

135

577,350

18,290

18225

127,536

5,529

55,71

8

90

152

4,4998

152

683,971

20,248

23104

146,230

3,796

33,29

9

71

127

4,2627

127

541,360

18,170

16129

126,364

0,501

0,404

10

89

154

4,4886

154

691,250

20,148

23716

145,294

5,653

75,800

11

82

127

4,4067

127

559,653

19,419

16129

138,431

9,001

130,66

12

111

162

4,7095

162

762,944

22,180

26244

163,799

1,111

3,237

Итого

1030

1699

53,332

1699

7566,84

237,216

242451

1699,000

50,487

569,11

Среднее значение

85,83

141,5

4,4443

141,5

630,570

19,768

20204,2

141,583

4,207

47,42

Информация о работе Парная регрессия и корреляция