Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа

Краткое описание

Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

Прикрепленные файлы: 1 файл

teoria.doc

— 601.50 Кб (Скачать документ)

 

Параметры уравнения: a1 = 83,776; a0 = -230,745.

Уравнение полулогарифмической модели имеет вид:

ŷ = -230,745 + ln x ∙ 83,776.

Величина коэффициента эластичности = 0,589 означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного на 1%, среднедневная заработная плата увеличится на 0, 589%.

Индекс корреляции: rxy = 0,837. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь сильная.

Коэффициент детерминации = 0,701. Таким образом, вариация величины среднедневной заработной платы на 70,1% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 29,9% от вариации приходится  влияние факторов, не включенных в модель.

Средняя ошибка аппроксимации: Ā = 4,207 %. Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 23,401 Fтабл = 4,96. Так как Fфакт >  Fтабл, уравнение регрессии значимо, статистически надежно.

 

Обратная модель парной нелинейной регрессии и корреляции: ŷ = 1/(a0 + x ∙a1).

Таблица 5 Расчет показателей обратной парной нелинейной регрессии и корреляции

x

y

X=x

Y=1/y

XY

X2

Y2

ŷ=1/(a0+a1x)

(y-ŷ)2

A

1

81

124

81

0,0081

0,6532

6561

0,00007

136,2349

149,69

9,866

2

77

131

77

0,0076

0,5878

5929

0,00006

132,9150

3,6672

1,461

3

85

146

85

0,0068

0,5822

7225

0,00005

139,7249

39,377

4,298

4

79

139

79

0,0072

0,5683

6241

0,00005

134,5545

19,762

3,198

5

93

143

93

0,0070

0,6503

8649

0,00005

147,2702

18,234

2,986

6

100

159

100

0,0063

0,6289

10000

0,00004

154,5741

19,589

2,783

7

72

135

72

0,0074

0,5333

5184

0,00005

128,9860

36,168

4,454

8

90

152

90

0,0066

0,5921

8100

0,00004

144,3471

58,566

5,034

9

71

127

71

0,0079

0,5591

5041

0,00006

128,2279

1,5076

0,966

10

89

154

89

0,0065

0,5779

7921

0,00004

143,3984

112,39

6,884

11

82

127

82

0,0079

0,6457

6724

0,00006

137,0909

101,82

7,945

12

111

162

111

0,0062

0,6852

12321

0,00004

167,6389

31,797

3,480

Итого

1030

1699

1030

0,0854

7,2641

89896

0,00061

1694,9626

592,58

53,36

Среднее значение

85,83

141,5

85,83

0,0071

0,6053

7491,3

0,00005

141,2469

49,382

4,446


 

Параметры уравнения: a1 = - 0,00005; a0 = 0,011.

Уравнение обратной модели регрессии имеет вид: ŷ = 1/(0,011 - x ∙ 0,00005).

Величина коэффициента эластичности = 0,553 означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного на 1%, среднедневная заработная плата увеличится на 0, 553%.

Индекс корреляции: rxy = 0,830. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь сильная.

Коэффициент детерминации = 0,688. Таким образом, вариация величины среднедневной заработной платы на 68,8% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 31,2% от вариации приходится  влияние факторов, не включенных в модель.

Средняя ошибка аппроксимации: Ā = 4,446%. Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 22,078; Fтабл = 4,96. Так как Fфакт >  Fтабл, уравнение регрессии значимо, статистически надежно.

 

Гиперболическая модель парной регрессии и корреляции: ŷ = 1/(a0 + x ∙a1).

Таблица 6 Расчет показателей гиперболической нелинейной регрессии и корреляции

x

y

X=1/x

Y=y

XY

X2

Y2

ŷ=a0+a1∙1/x

(y-ŷ)2

A

1

81

124

0,0123

124

1,530

0,00015

15376

137,899

193,19

11,20

2

77

131

0,0129

131

1,701

0,00017

17161

133,263

5,121

1,727

3

85

146

0,0117

146

1,717

0,00014

21316

142,099

15,216

2,672

4

79

139

0,0126

139

1,759

0,00016

19321

135,640

11,291

2,417

5

93

143

0,0107

143

1,537

0,00012

20449

149,415

41,156

4,486

6

100

159

0,0100

159

1,590

0,00010

25281

154,857

17,167

2,606

7

72

135

0,0138

135

1,875

0,00019

18225

126,743

68,175

6,116

8

90

152

0,0111

152

1,688

0,00012

23104

146,824

26,789

3,405

9

71

127

0,0140

127

1,788

0,00020

16129

125,329

2,792

1,316

10

89

154

0,0112

154

1,730

0,00013

23716

145,922

65,259

5,246

11

82

127

0,0122

127

1,548

0,00015

16129

138,988

143,70

9,439

12

111

162

0,0090

162

1,459

0,00008

26244

162,021

0,000

0,013

Итого

1030

1699

0,1420

1699

19,92

0,00171

242451

1699,000

589,86

50,65

Среднее значение

85,83

141,5

0,0118

141,5

1,660

0,00014

20204,2

141,583

49,155

4,221


 

Параметры уравнения: a1 = -7229,170; a0 = 227,148.

Уравнение гиперболической модели регрессии имеет вид:

ŷ = 1/(227,148 - x ∙ 7229,170).

Величина коэффициента эластичности = 0,589 означает, что при увеличении среднедушевого прожиточного минимума в день одного трудоспособного на 1%, среднедневная заработная плата увеличится на 0,589%.

Индекс корреляции: rxy = 0,830. Так как коэффициент корреляции > 0,7, между исследуемыми факторами связь сильная.

Коэффициент детерминации = 0,690. Таким образом, вариация величины среднедневной заработной платы на 69,0% зависит от вариации уровня среднедушевого прожиточного минимума, а на остальные 31,0% от вариации приходится  влияние факторов, не включенных в модель.

Средняя ошибка аппроксимации: Ā = 4,221 %. Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

С помощью F−критерия Фишера оценим статистическую надежность результатов регрессионного моделирования: F факт. = 22,226; Fтабл = 4,96. Так как Fфакт >  Fтабл, уравнение регрессии значимо, статистически надежно.

Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одной таблице.

Таблица 7 Сводная таблица результатов

Модель / параметры

F кр

rxy

Ā

Э

Линейная

0,702

23,579

0,838

4,264

0,574

Степенная

0,703

23,614

0,838

4,216

0,582

Экспоненциальная

0,698

23,09

0,835

4,35

0,564

Полулогарифмическая

0,701

23,401

0,837

4,207

0,589

Обратная

0,688

22,078

0,830

4,450

0,530

Гиперболическая

0,690

22,226

0,830

4,221

0,589


 

Предпочтение можно отдать степенной функции, для которой значения коэффициентов корреляции и детерминации и F-критериев Фишера наибольшие.

Если прогнозное значение среднедушевого прожиточного минимума увеличится на 10 % от его среднего значения (94,42 рублей), прогнозное значение заработной платы = 2,367.

Интервал прогноза: -15,4818 ≤ ŷ р≤ 20,216

Оценим точность прогноза, рассчитав ошибку прогноза и его  доверительный интервал для уровня значимости α = 0,05

Стандартная ошибка прогноза:

M rxy = √ (1 - r2xy)/ (n - 2) =  0,055.

Для оценки статистической значимости коэффициентов регрессии  и корреляции рассчитывается t- критерий Стьюдента:

ta0 = a0/ma0; ta1 = a1/ma1;   trxy = rxy/ M rxy; t факт = S ост/ σ2∙√n

ta0 = 0,140, ta1 = 2,987; trxy = 15,367.

Таким образом,  t a0 < t табл. (2,2281), значит, коэффициент не значим; ta1, trxy > t табл  - коэффициенты значимы.

Доверительный интервал для уровня значимости α = 0,05:

γa0 = a0 ± ∆ a0; γa1 = a1 ± ∆ a1; ∆ a0 = ma0 ∙ tтабл; ∆ a1 = ma1 ∙ tтабл;

Получим -35,271 ≤ a0≤ 39,993;         0,148 ≤ a1≤ 1,017.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

Задача 2. По 10 предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов  x1 (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих x2 (%)

Требуется:

1. Построить линейную модель множественной регрессии.

2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3. Найти коэффициент множественной детерминации.

4. С помощью F -критерия Фишера и коэффициента детерминации R2yx1x2 оценить статистическую надежность уравнения регрессии.

5. Найти также интервальные оценки параметров a1, a2 и показать значимость уравнения регрессии.

6. Оценить качество уравнения через среднюю ошибку аппроксимации.

7. Определить частные коэффициенты эластичности, β-коэффициенты и Δ-коэффициенты. Проанализировать, какой из факторных признаков оказывает наибольшее влияние на результативный признак.

8. Определить доверительный интервал прогноза.

9. Проверить результаты с помощью инструментов анализа данных Регрессия и Корреляция ППП Excel.

Таблица 8 Исходные данные для корреляционно-регрессионного анализа

Номер предприятия

y

x1

x2

1

9

6,3

21

2

11

6,4

22

3

11

7

24

4

12

7,5

25

5

12

7,9

28

6

13

8,2

30

7

13

8

30

8

13

8,6

31

9

14

9,5

33

10

14

9

36


Цель работы – овладеть методикой построения линейных моделей  множественной регрессии, оценки их существенности и значимости, расчетом показателей множественной регрессии и корреляции.

Таблица 9 Расчет параметров уравнения множественной регрессии

x1

x2

y

x12

x1x2

yx1

x22

yx2

ŷ

1

6,3

21

9

39,69

132,3

56,7

441

189

10,064

2

6,4

22

11

40,96

140,8

70,4

484

242

10,288

3

7

24

11

49

168

77

576

264

11,007

4

7,5

25

12

56,25

187,5

90

625

300

11,500

5

7,9

28

12

62,41

221,2

94,8

784

336

12,240

6

8,2

30

13

67,24

246

106,6

900

390

12,756

7

8

30

13

64

240

104

900

390

12,621

8

8,6

31

13

73,96

266,6

111,8

961

403

13,183

9

9,5

33

14

90,25

313,5

133

1089

462

14,103

10

9

36

14

81

324

126

1296

504

14,236

Итого:

78,4

280

122

624,76

2239,9

970,3

8056

3480

122

Среднее значение

7,84

28

12,2

62,476

223,99

97,03

805,6

348

12,2

Информация о работе Парная регрессия и корреляция