Построение модели множественной линейной регрессии, оценка параметров модели

Автор работы: Пользователь скрыл имя, 27 Декабря 2012 в 03:11, практическая работа

Краткое описание

Цель работы – построение модели множественной линейной регрессии влияния уровня интенсификации на эффективность производства продукции сельского хозяйства.
Работа выполнялась в программе STATISTICA.
В процессе работы использовались следующие методы: дисперсионный анализ, корреляционно-регрессионный анализ (метод наименьших квадратов), графический метод.
В результате исследования была построена модель множественной линейной регрессии, параметры оценены на достоверность, оценена коллинеарность факторов, проведена гребневая регрессия, модель оценена на гетероскедастичность остатков.

Прикрепленные файлы: 1 файл

Ekonometrika (2).docx

— 2.31 Мб (Скачать документ)

 

Российский  государственный аграрный университет  –

МСХА имени  К.А. Тимирязева

(ФГБОУ ВПО  РГАУ – МСХА имени К.А. Тимирязева)

 

 

 

УТВЕРЖДАЮ

 

Заведующий кафедрой статистики и эконометрики

К.э.н., доцент

__________________Уколова А.В.

«____»____________ _________г.


 

 

 

 

 

ОТЧЕТ

О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ  РАБОТЕ

 

 

ПОСТРОЕНИЕ  МОДЕЛИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ, ОЦЕНКА ПАРАМЕТРОВ МОДЕЛИ.

 

 

 

 

 

 

 

 

 

 

Научный руководитель

К.э.н., доцент  ___________________________ А.В. Уколова

подпись, дата

 

 

 

 

 

 

МОСКВА - 2012 г.

 

 

СПИСОК ИСПОЛНИТЕЛЕЙ

 

Исполнители темы: 

 

Студентка 402 группы УФФ_________________________Шишкина  Е.А.

подпись, дата

 

Студентка 402 группы УФФ________________________Нем  В.О.

подпись, дата

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

РЕФЕРАТ

 

Объектом  исследования являются крупные и средние организации Воронежской области.

Цель  работы – построение модели множественной линейной регрессии влияния уровня интенсификации на эффективность производства продукции сельского хозяйства.

Работа  выполнялась в программе STATISTICA.

В процессе работы использовались следующие методы: дисперсионный анализ, корреляционно-регрессионный анализ (метод наименьших квадратов), графический метод.

В результате исследования была построена модель множественной линейной регрессии, параметры оценены на достоверность, оценена коллинеарность факторов, проведена  гребневая регрессия, модель оценена  на гетероскедастичность остатков.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

СОДЕРЖАНИЕ:

 

ОПРЕДЕЛЕНИЯ 5

ВВЕДЕНИЕ 9

ОСНОВНАЯ ЧАСТЬ 13

1.Оценка распределения хозяйств по изучаемым признакам 13

2. Построние  множественной регрессии 22

3.Оценка влияние коллинеарности факторов на основе коэффициентов корреляции  между независимыми переменными 24

4.Оценка параметров уравнения  множественной регрессии методом Ридж – регрессии (гребневой) 26

5.Исследование  модели регрессии на гетероскедатичность остатков. 32

ЗАКЛЮЧЕНИЕ 36

СПИСОК  ИПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 37

 

 

 

ОПРЕДЕЛЕНИЯ

В настоящем  отчете о научно исследовательской  работе применяют следующие термины  с соответствующими определениями  и пояснениями:

Корреляционно-регрессионный анализ — классический метод стохастического моделирования хозяйственной деятельности. Он изучает взаимосвязи показателей хозяйственной деятельности, когда зависимость между ними не является строго функциональной и искажена влиянием посторонних, случайных факторов.

Данный  метод содержит две свои составляющие части — корреляционный анализ и регрессионный анализ.

Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. 

Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.

Корреля́ция  — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми).

При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Некоторые виды коэффициентов корреляции могут  быть положительными или отрицательными. В первом случае предполагается, что  мы можем определить только наличие  или отсутствие связи, а во втором — также и ее направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. 

Положительная корреляция — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной.

Регрессия представляет собой модель, где среднее значение зависимой (объясняющей) переменной рассматривается как функция одной независимой (объясняющей) переменной , т.е. это модель вида

.

Множественная регрессия представляет собой модель, где среднее значение зависимой (объясняющей) переменной рассматривается как функция нескольких  независимых (объясняющих) переменных , т.е. это модель вида

.

Толерантность - позволяет исключить из модели неинформативные переменные. Толерантность переменной определяется как 1 минус квадрат коэффициента множественной корреляции этой переменной со всеми остальными независимыми переменными, входящими в уравнение регрессии.

Дисперсионный анализ – это статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Ридж-регрессия  или гребневая регрессия - это один из методов понижения размерности. Часто его применяют для борьбы с переизбыточностью данных, когда независимые переменные коррелируют друг с другом,т.е. имеет место мультиколлинеарность.

Мультиколлинеарность - тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат, которая затрудняет оценивание регрессионных параметров. Наличие мультиколлинеарности факторов может  означать, что некоторые факторы  будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).

Метод наименьших квадратов— один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным. Метод основан на минимизации суммы квадратов остатков регрессии.

Необходимо отметить, что собственно методом наименьших квадратов можно  назвать метод решения задачи в любой области, если решение  заключается или удовлетворяет  некоторому критерию минимизации суммы  квадратов некоторых функций  от искомых переменных. Поэтому метод  наименьших квадратов может применяться  также для приближённого представления (аппроксимации) заданной функции другими (более простыми) функциями, при нахождении совокупности величин, удовлетворяющих  уравнениям или ограничениям, количество которых превышает количество этих величин и т. д.

Тест Уайта  — универсальная процедура тестирования гетероскедастичности случайных ошибок линейной регрессионной модели, не налагающая особых ограничений на структуру гетероскедастичности, предложенная Уайтом в 1980 г. Тест является асимптотическим.

    Гетероскедастичность остатков  – это свойство остатков, которое  заключается в том, что их  дисперсии или разбросы для  каждого фиксированного Х являются  неоднородными или неодинаковыми.

Для обнаружения  гетероскедастичности остатков используется визуальный анализ графика зависимости  Y от Х, линии тренда и остатков.    При малом объёме выборки для оценки гетероскедастичности используют тест Гольдфельда-Квандта, разработанный в 1965г. М.Г. Гольдфельд и Р.Э. Квандт.

Наличие гетероскедастичности случайных  ошибок приводит к неэффективности оценок, полученных с помощью метода наименьших квадратов.

Гомоскедастичность  остатков – для каждого значения фактора остатки имеют одинаковую дисперсию.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Общее назначение множественной регрессии  состоит  в анализе связи между несколькими  независимыми переменными и зависимой  переменной.

Множественная линейная регрессия является обобщением парной линейной регрессии на несколько  объясняющих переменных. При выполнении предпосылок Гаусса-Маркова оценки параметров уравнения множественной  линейной регрессии, полученные методом  наименьших квадратов, обладают свойствами несмещенности, эффективности и  состоятельности. Статистическая значимость коэффициентов и качество подбора  уравнения проверяются с помощью  распределений Стьюдента и Фишера. Коэффициент при объясняющей  переменной показывает, на сколько  единиц изменится зависимая переменная, если объясняющая вырастет на одну единицу при фиксированном значении остальных объясняющих переменных. В случае множественной регрессии  дополнительно предполагается отсутствие мультиколлинеарности объясняющих  переменных.

 

В данной работе рассматривается модель множественной  линейной регрессии, где на результативный показатель (выручку) оказывают влияние  показатели, отражающие уровень интенсификации производства (численность работников и амортизация в расчете на 100 га сельскохозяйственных угодий).

Исходными данными для анализа служат данные по крупным и средним организациям Воронежской области по 7 варианту за 2008 год о выручке от реализации продукции растениеводства и  животноводства, амортизации в растениеводстве  и животноводстве, среднегодовой  численности работников, занятых  в сельском хозяйстве и площади  с.-х. угодий (табл. 1).

 

Таблица 1. Исходные данные

Среднегодовая численность работников с.-.х. организации, чел.

Выручка от реализации продукии растениеводства, тыс. руб.

Выручка т реализации продукци животноводства ,тыс. руб.

Площадь с.-х. угодий

Амортизация в растениеводстве,тыс .руб.

Амортизация в животноводстве,тыс .руб.

1

15

5779

0

1835

643

0

2

19

7163

46

2734

456

0

3

19

4948

0

295

365

0

4

19

2303

0

661

123

0

5

21

1114

0

3061

54

0

6

22

6877

0

2821

14

0

7

23

1863

0

1040

17

0

8

24

0

2003

2523

0

77

9

25

1657

3586

1173

5

46

10

25

6010

0

2309

207

0

11

21

6907

0

1199

123

0

12

26

7920

0

2199

1821

0

13

24

10078

0

1800

718

0

14

11

7718

0

2028

154

0

15

29

8919

0

3143

26

0

16

30

0

9243

843

0

624

17

33

0

2741

261

56

23

18

34

5302

0

4016

0

0

19

34

6008

539

810

476

47

20

36

1508110

0

43873

77327

0

21

38

14796

0

1097

1346

0

22

40

2415

1213

859

247

6

23

40

10583

345

2093

415

21

24

41

0

4191

5528

0

630

25

42

8571

0

245

0

0

26

40

5953

311

2201

636

19

27

42

6597

0

1362

125

0

28

41

5695

0

3298

1518

0

29

47

12855

719

2412

1493

118

30

34

26273

0

3742

1223

0

31

52

11116

4948

1935

607

769

32

52

30614

1

5564

980

10

33

43

16250

2368

2901

915

50

34

55

56696

0

3729

5007

0

35

51

17405

0

3967

691

0

36

58

3232

0

15597

3663

0

37

59

27607

0

3331

8382

0

38

46

14060

2100

1421

539

27

39

58

1420

6170

828

0

0

40

61

21959

0

9886

14311

0

41

35

77159

0

3521

3254

0

42

59

32243

0

3015

300

0

43

58

52954

0

3939

4009

0

44

64

3070

8146

1013

285

397

45

67

18030

0

5524

6988

0

46

67

33000

0

5950

358

0

47

62

20433

856

6571

830

21

48

68

18946

0

13397

10590

0

49

65

35223

0

4700

890

0

50

67

11106

0

708

108

0

51

58

8101

11167

1625

1614

598

52

60

32754

0

3155

554

0

53

61

12595

12470

2993

226

46

54

68

4805

2282

5540

0

7

55

71

33270

0

16555

10865

0

56

57

34059

3404

2867

2077

352

57

74

3690

15544

2449

309

67

58

76

45564

3509

7526

4304

27

59

75

7361

0

379

104

0

60

78

92395

0

8403

5200

0

61

57

35564

6664

5443

747

0

62

76

11236

1860

2923

278

17

63

76

41736

36545

5681

3940

2055

64

77

9391

7666

4422

148

389

65

80

12568

9179

3256

221

963

66

83

9031

0

564

106

0

67

80

21491

0

9379

683

0

68

59

24557

0

5053

1958

0

69

75

17903

357

3872

159

39

70

78

67866

304

5787

7677

47

71

81

38302

4990

5578

2224

483

72

70

16148

8085

4248

237

99

73

80

20399

9465

3475

556

143

74

82

21122

1757

4087

276

67

75

84

17500

4494

7964

1652

256

76

89

34965

0

15601

11172

0

77

78

34418

14133

6500

1828

210

78

88

21932

7520

3525

224

91

79

81

65051

5557

5673

4186

104

80

84

56400

12447

4872

1895

1195

81

88

17386

7985

2308

169

384

82

83

23815

4522

5969

1613

442

83

91

34846

0

6202

3540

0

84

92

78120

0

28355

20506

532

85

81

50191

0

5247

6112

0

86

91

34472

0

4619

2026

0

87

91

17759

5543

6977

1050

90

88

95

27022

18885

3443

4157

166

89

80

5466

0

10296

13846

0

90

87

25618

5007

8125

1313

188

91

94

26416

0

2747

0

0

92

94

23355

7814

4605

1146

304

93

84

15768

15295

4689

3149

158

94

93

72754

0

8407

5534

0

95

95

3893

13835

3926

128

527

96

93

28862

11926

3953

270

16

97

96

6025

9746

4258

557

360


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ОСНОВНАЯ ЧАСТЬ

    1. Оценка распределения хозяйств по изучаемым признакам

 

Условие: имеются данные по крупным и средним организациям Воронежской области по 7 варианту за 2008 год о выручке от реализации продукции животноводства и растениеводства, амортизации животноводства и растениеводства, среднегодовой численности работников занятых в с/х и площади с/х угодий (табл.1).

Требуется: Построить модель множественной линейной регрессии, учитывающей влияние уровня интенсивности производства на его эффективность.

 

Решение:

  1. В качестве показателя отражающего достигнутый уровень производства и реализации продукции возьмем выручку в расчете на 100 га с/х угодий (зависимая переменная у).
  2. В качестве показателя отражающего уровень интенсификации производства берем численность работников в расчете на 100 га (х1) и амортизации в расчете на 100 га (х2).

Тогда модель множественной регрессии имеет  вид:

3)Рассчитаем показатели на 100 га с.-х.

 

Таблица 2. Расчет показателей на 100 га с.-х. угодий

Выручка от реализации продукции с.-х. на 100 га с.-х. угодий ,тыс.руб

Среднегодовая численность работников на 100 га с.-х. угодий, чел

Амортизация по отраслям с.-х. на 100 га с.-х. угодий, тыс. руб

1

314,9318801

0,817438692

35,04087193

2

263,6795903

0,694952451

16,67885881

3

1677,288136

6,440677966

123,7288136

4

348,4114977

2,874432678

18,60816944

5

36,39333551

0,68605031

1,764129369

6

243,7788018

0,779865296

0,496277916

7

179,1346154

2,211538462

1,634615385

8

79,38961554

0,951248514

3,051922315

9

446,973572

2,131287298

4,347826087

10

260,285838

1,082719792

8,964919879

11

576,0633862

1,75145955

10,25854879

12

360,1637108

1,182355616

82,81036835

13

559,8888889

1,333333333

39,88888889

14

380,5719921

0,542406312

7,593688363

15

283,7734648

0,922685332

0,827235126

16

1096,441281

3,558718861

74,02135231

17

1050,191571

12,64367816

30,26819923

18

132,0219124

0,846613546

0

19

808,2716049

4,197530864

64,56790123

20

3437,444442

0,082055022

176,2519089

21

1348,769371

3,463992707

122,698268

22

422,3515716

4,656577416

29,45285215

23

522,1213569

1,911132346

20,83134257

24

75,81403763

0,741678726

11,39652677

25

3498,367347

17,14285714

0

26

284,59791

1,817355747

29,75920036

27

484,3612335

3,083700441

9,177679883

28

172,6804124

1,243177683

46,02789569

29

562,7694859

1,948590381

66,79104478

30

702,1111705

0,908605024

32,68305719

31

830,1808786

2,687338501

71,11111111

32

550,2336449

0,934579439

17,79295471

33

641,778697

1,482247501

33,26439159

34

1520,407616

1,474926254

134,2719228

35

438,7446433

1,285606252

17,41870431

36

20,72193371

0,371866385

23,48528563

37

828,7901531

1,771239868

251,6361453

38

1137,227305

3,237156932

39,83110486

39

916,6666667

7,004830918

0

40

222,122193

0,61703419

144,760267

41

2191,39449

0,994035785

92,41692701

42

1069,419569

1,956882255

9,950248756

43

1344,351358

1,472454938

101,7771008

44

1107,206318

6,31786772

67,32477789

45

326,3939175

1,212889211

126,5025344

46

554,6218487

1,12605042

6,016806723

47

323,9841729

0,943539796

12,95084462

48

141,4197208

0,507576323

79,04754796

49

749,4255319

1,382978723

18,93617021

50

1568,644068

9,463276836

15,25423729

51

1185,723077

3,569230769

136,1230769

52

1038,161648

1,901743265

17,55942948

53

837,4540595

2,038088874

9,087871701

54

127,9241877

1,227436823

0,126353791

55

200,9664754

0,428873452

65,62971912

56

1306,696896

1,988140914

84,72270666

57

785,3817885

3,021641486

15,35320539

58

652,0462397

1,00983258

57,54716981

59

1942,216359

19,78891821

27,44063325

60

1099,547781

0,928239914

61,88266095

61

775,8221569

1,047216608

13,72404924

62

448,032843

2,600068423

10,09237085

63

1377,944024

1,337792642

105,5271959

64

385,7304387

1,741293532

12,14382632

65

667,9054054

2,457002457

36,36363636

66

1601,241135

14,71631206

18,79432624

67

229,1395671

0,8529694

7,28222625

68

485,9885217

1,167623194

38,74925787

69

471,5909091

1,936983471

5,113636364

70

1177,985139

1,347848626

133,4715742

71

776,1204733

1,452133381

48,52993905

72

570,4566855

1,647834275

7,90960452

73

859,3956835

2,302158273

20,11510791

74

559,7993638

2,006361634

8,39246391

75

276,1677549

1,054746359

23,95781015

76

224,1202487

0,570476252

71,61079418

77

746,9384615

1,2

31,35384615

78

835,5177305

2,496453901

8,936170213

79

1244,63247

1,42781597

75,62136436

80

1413,115764

1,724137931

63,42364532

81

1099,263432

3,812824957

23,96013865

82

474,7361367

1,390517675

34,42787737

83

561,8510158

1,467268623

57,07836182

84

275,5069653

0,324457768

74,19502733

85

956,5656566

1,54373928

116,4856108

86

746,3087248

1,970123403

43,86230786

87

333,9830873

1,30428551

16,33940089

88

1333,343015

2,759221609

125,5591054

89

53,08857809

0,777000777

134,4794095

90

376,9230769

1,070769231

18,47384615

91

961,63087

3,421914816

0

92

676,8512486

2,041259501

31,48751357

93

662,4653444

1,791426743

70,52676477

94

865,3978827

1,106221006

65,8260973

95

451,5537443

2,419765665

16,68364748

96

1031,823931

2,352643562

7,235011384

97

370,3851574

2,254579615

21,53593236

Информация о работе Построение модели множественной линейной регрессии, оценка параметров модели