Лабораторная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 19 Декабря 2012 в 17:27, лабораторная работа

Краткое описание

Цель работы: рассчитать парную регрессию и корреляцию, используя исходные данные.
Практические указания:
1.Построить линейное уравнение парной регрессии у по х.
2.Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F - критерия Фишера и l – критерия Стьюдента.
4.Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющим 107% от среднего уровня.
5.Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6.На одном графике отложить исходные данные и теоретическую прямую.

Прикрепленные файлы: 1 файл

лаба 2 стат.docx

— 156.72 Кб (Скачать документ)

Министерство образования и науки Российской Федерации

ФГБУ ВПО

Уфимский  государственный авиационный технический университет

 

 

 

Кафедра Экономики 

предпринимательства

 

 

 

 

 

Лабораторная  работа №2

по дисциплине

Статистика

 

 

 

 

Выполнил:

      (ФИО)             

Проверил:

 

 

 

 

 

 

Уфа 2012

 

 

 

 

 

 

 

Цель работы: рассчитать парную регрессию  и  корреляцию, используя исходные данные.

 

Практические указания:

  1. Построить линейное уравнение парной регрессии у по х.
  2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
  3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью

      F - критерия Фишера и l – критерия Стьюдента.

  1. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимума х, составляющим 107% от  среднего уровня.
  2. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
  3. На одном графике отложить исходные данные и теоретическую прямую.

 

Исходные данные:

 

Номер региона

Среднедушевой прожиточный  минимум в день одного трудоспособного, руб, х

Среднедневная заработная плата, руб, у

1

67

139

2

73

152

3

76

159

4

78

133

5

79

154

6

82

148

7

87

134

8

87

162

9

88

158

10

89

162

11

106

195

12

115

173


 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Построить линейное уравнение парной регрессии у по х.

 

Уравнение линейной регрессии : у=а+bх+

 

Построение линейной регрессии сводится к оценке ее параметров.

 

Воспользуемся формулами:

 

,

,

b

0,920430553

a

76,9764852


 

где = - ковариация признаков х и у, = -дисперсия признака  x и

 

 

 

     Ковариация - числовая  характеристика совместного распределения  двух случайных величин, равная  мат. ожиданию произведения отклонений  этих случайных величин от  их математического отклонения.

 

 

 

 

 

 

Рассчитанные значения

 

ху

х^2

У^2

Xсред

Усред

ХУсред

Х^2сред

cov(х,у)

10374

6084

17689

85,58333

155,75

13484

7492,25

154,3958

12136

6724

21904

     

Y^2сред

 

11658

7569

17956

     

24531,42

 

12166

6241

23716

         

14418

7921

26244

         

20670

11236

38025

         

9313

4489

19321

         

13904

7744

24964

         

11096

5329

23104

         

14094

7569

26244

         

12084

5776

25281

         

19895

13225

29929

         

161808

89907

294377

         

 

 

  1. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.

 

Тесноту связи  изучаемых явлений оценивает  линейный коэффициент парной корреляции для линейной регрессии (-1≤ ≤1)

Линейный коэффициент парной корреляции

       

=0,721025

Если Rxy > 0,7 - связь между изучаемыми показателями сильная, можно проводить анализ линейной модели

Если 0,3 < Rxy < 0,7 - связь между показателями умеренная, можно использовать нелинейную модель при отсутствии Rxy > 0,7

Если Rxy < 0,3 - связь слабая, модель строить нельзя 

 

Следовательно связь между изучаемыми показателями сильная.

 

Дисперсия  - характеристика случайной величины, определяемая как мат. ожидание квадрата отклонения случайной величины от ее математического ожидания. Мат. ожидание  - сумма произведения значений случайной величины на соответствующие вероятности.

- общая дисперсия результативного  признака у. 

аналогично для х.

                                                                              

 

дисперсия

167,7430556

273,3541667

   

 

Оценку качества построенной модели даст коэффициент детерминации

 

Коэф.детерминации

 

0,519877

   

 

Средняя ошибка аппроксимации  -  среднее отклонение расчетных значений от фактических

 

Допустимая ошибка аппроксимации  не должна превышать 10%

 

 

Средняя ошибка аппроксимации     5,752052

   
         
         

  1. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью

      F - критерия Фишера и l – критерия Стьюдента.

Проводим  оценку значимости как линейного  уравнения регрессии в целом, так и отдельных его параметров.

Проверить значимость уравнения регрессии  - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих  переменных (одной или нескольких) для описания зависимой переменной.

Оценка значимости уравнения  регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической  статистике  дисперсионный  анализ  рассматривается  как самостоятельный  инструмент  статистического  анализа. В эконометрике он применяется как вспомогательное средство для изучения  качества регрессионной модели. Согласно основной идее дисперсионного анализа, общая сумма квадратов  отклонений  переменной (y) от среднего значения  (yср.)  раскладывается на две части – «объясненную»и «необъясненную»:

где - общая сумма квадратов отклонений,

  - сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений), - остаточная сумма квадратов отклонений, характеризующая влияние изученных в модели факторов.

Вычисления:

 

теорет.значение у

148,7701

 

152,4518

 

157,0539

 

149,6905

 

158,8948

 

174,5421

 

138,6453

 

157,9744

 

144,1679

 

157,0539

 

146,9292

 

Сумма 182,826

 

(У-Теор.знач)/У

(Теор.знач-Усред)^2

(y-Усред)^2

(у-теор зн)^2

0,118571942

48,71944641

 

517,5625

248,6950545

0,030079666

10,87818578

 

60,0625

19,81843883

0,172044353

1,700268085

 

473,0625

531,4843009

0,027983774

36,71755405

 

3,0625

18,57180006

0,019167874

9,889794641

 

39,0625

9,642239787

0,104912186

353,1439163

 

1540,5625

418,5246993

0,002551567

292,5696595

 

280,5625

0,125789228

0,000162191

4,947838961

 

5,0625

0,0006567

0,051526871

134,1446803

 

14,0625

61,3415469

0,030531214

1,700268085

 

39,0625

24,46347705

0,075916936

77,80638556

 

10,5625

145,7040387

0,056797681

733,1097087

 

297,5625

96,55025159

 Сумма0,690246254

1705,327706

 

3280,25

1574,922294


 

Вычисленная дисперсия на одну степень свободы:

S^2факт

1705,328

 

S^2общ

298,2045

 

S^2ост

157,4922


Определение  дисперсии  на  одну  степень  свободы  приводит  дисперсии к  сравнимому  виду.  Сопоставляя  факторную  и  остаточную  дисперсии  в расчете на одну степень свободы, получим величину  F-критерия Фишера. Фактическое  значение  F -критерия  Фишера  сравнивается  с табличным значением Fтабл. (α, k1, k2)  при заданном уровне значимости α и степенях свободы k1= m и k2=n-m-1.  При  этом,  если  фактическое  значение  F-критерия  больше  табличного Fфакт > Fтеор, то  признается статистическая  значимость уравнения в целом. Для парной линейной регрессии m=1 , поэтому:

Эта формула в общем виде может  выглядеть так:

Величина критерия Фишера тесно связана с коэффициентов  детерминации, чтобы определить, при  каких значениях Rуравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор - делаем вывод о статистической значимостиуравнения регрессии. Величина F-критерия связана с коэффициентом детерминации R2xy (r2xy) и ее можно рассчитать по следующей формуле:

Вычисления: 10,82801  - критерий Фишера

 

F-критерий Фишера

10,82801173

Табличный

4,96


Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента

Для оценки статистической значимости параметров регрессии и корреляции рассчитываются t – критерий Стьюдента и доверительные интервалы каждого из показателей. Оценка значимости коэффициента регрессии и корреляции с помощью t- критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки.

Mb

0,279715587

Ma

24,21156138

Mr(xy)

0,21911701


Определим стандартные ошибки:

Информация о работе Лабораторная работа по "Статистике"