Общая теория статистики

Автор работы: Пользователь скрыл имя, 22 Января 2013 в 19:38, контрольная работа

Краткое описание

1. Пользуясь теорией случайных чисел, выписать данные для 30 предприятий по факторному и результативному признаку согласно варианту.
2. Выполнить группировку, характеризующую зависимость результативного признака (y) от факторного (x). Построить ряд распределения с равными интервалами по x. Определить центры показателя распределения, показатели вариации, ассиметрии и эксцесса. Изобразить ряд на графике, отметить точки (средние) и сделать выводы о характере распределения.
3. Используя раннее выполненную группировку, проверить правило сложения дисперсий. Рассчитать коэффициент детерминации.
4. Выявить факты наличия связи между x и y. Определить степень тесноты связи с помощью линейного коэффициента корреляции (rxy). Составить уравнение регрессии.

Прикрепленные файлы: 1 файл

Контрольная работа по статистике.docx

— 81.32 Кб (Скачать документ)

Частота (частота повторения) – число повторений отдельного варианта значений признака, обозначается f , а сумма частот, равная объему исследуемой совокупности, обозначается .

Таблица дополняется графой, в которой подсчитывается накопленные частоты S, которые показывают, какое число единиц совокупности имеет значение признака не больше, чем данное значение

Величину интервала определяем по формуле американского статистика Стерджесса: h=, где

n- общее число единиц совокупности, в n=30 (по условию задания)

1+3,322 lg

R=- размах колебаний (варьирования) признака.

R=86,0-70=16%

h===2,66

 

Удельный вес технико-обоснованных норм, % (x)

Число предприятий, частота  интервала, f

Накопленные частоты

Середина интервала, %

* f, %

70,0-72,66

5

5

71,3

356,65

72,66-75,32

4

9

73,99

295,96

75,32-77,98

6

15

76,55

459,9

77,98-80,64

7

22

79,31

555,17

80,64-83,3

3

25

81,8

245,4

83,3-86,0

5

30

84,65

423,25

Итого:

30

   

2336,33


 

Для характеристики среднего значения признака в вариационном ряду применяется: средняя арифметическая, медиана и мода.

Средняя арифметическая представляет собой частное от деления суммы значений всех наблюдений на количество наблюдений. Она показывает наиболее часто встречающиеся, наиболее вероятное значение анализируемой величины. Для интервального ряда распределения определяется по формуле:

=

- середина соответствующего интервала значения признака.

==77,9%

Мода – наиболее часто встречающееся значение признака. В интервальном ряду определяется модальный интервал (имеет наибольшую частоту). Значение моды определяется по формуле:

=,

- нижняя граница модального интервала,

i-величина интервала

- частота модального интервала

-частота интервала,  предшествующего модальному,

-частота интервала, следующего за модальным.

 

Модальный интервал – четвертый (77,98-80,64), т.к. он имеет наибольшую частоту (7).

= 78,51≈79%

Медиана- величина которая делит численность упорядоченного вариационного ряда на две равные части: одна часть значения признака меньше, чем средний вариант, а другой – больше. Медиана соответствует варианту, стоящему в середине ранжированного ряда  Положение медианы определяется ее номером:

 

n- число единиц совокупности.

Медианным является интервал, в котором сумма накопленных  частот превысит тот половину общего числа наблюдений, т.е 15. Численное значение медианы определяется по формуле:

 

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариация признака. Она возникает в результате того, что индивидуальное значение признака складываются под совокупным влиянием разнообразных средств (условий), которые по-разному сочетаются в каждом отдельном случае.

Для характеристики размера вариации признака используют абсолютные и относительные показатели. К абсолютным показателям относятся: размах колебаний (вариации), среднее линейное отклонение, среднее квадратичное отклонение, дисперсии. К относительным показателям вариации относятся: коэффициенты вариации, коэффициенты осцилляции, относительное линейное отклонение и др. Относительные показатели вычисляются как отклонение абсолютных показателей вариации к средней арифметической и медиане.

  1. Вариационный размах колебаний – разница между максимальным и минимальным значениями признака , является мерой разброса данных.

%

Размах вариации (размах колебаний) – важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения и не учитывает, как расположены внутри интервала другие значения, что ограничивает область его применения. Для более точной характеристики используются другие показатели.

  1. Среднее линейное отклонение вычисляют для того чтобы участь различия всех едениц совокупности. Эта величина определяется как средняя арифметическая из абсолютных значений отклонений от средней. Так как сумма отклонений значений признака от средней величины равна нулю, то все отклонения берутся по модулю.

 

Формула среднего линейного отклонения (простая):

Формула среднего линейного отклонения (взвешенная) :

 

 

 

  1. Среднее квадратичное отклонение.

Среднее квадратичное отклонение может быть простым и взвешенным.

 

 

Среднее квадратичное отклонение как и среднее линейное отклонение показывает на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения что и признак. Среднее квадратичное отклонение всегда больше среднего линейного отклонения .

  1. Дисперсия – представляет собой квадрат среднего квадратичного отклонения. Она полно характеризует меру рассеивания измеренных значений вокруг средней арифметической. Чем меньше дисперсия , тем теснее группируются данные вокруг центра рассеивания.

Формулы дисперсий простой и взвешенной:

 

 

Составим таблицу для расчета  этих показателей :

Вспомогательная таблица для расчета абсолютных показателей вариации

Удельный вес технико-обоснованных норм, % (x)

Середина интервала, %

Число предприятий, частота  интервала, f

 

 

 

 

70,0-72,66

71,33

5

6,57

32,85

43,16

215,8

72,66-75,32

73,99

4

3,91

15,64

15,29

61,16

75,32-77,98

76,65

6

1,25

7,5

1,56

9,36

77,98-80,64

79,31

7

1,41

9,87

1,99

13,93

80,64-83,3

81,8

3

3,9

11,7

15,21

45,63

83,3-86,0

84,65

5

6,75

33,75

45,56

227,8

Итого:

 

30

 

111,31

 

573,68


 

 

4,37%==4,4%

 

 

Для характеристики формы распределения  применяются ранговые характеристики. Это варианты, занимающие определенное место в вариационном ряду (десятое, двадцатое и т.д.). они получили название: квантилей или градиентов. Квантили имеют свои названия: квартили, децили, перцентили. Квартили (Q) – значение признака, которые делят ранжированный ряд на 4 части. Различают нижний и верхний квартили. Если отношение объемов подгрупп составляет ¼ и ¾ , то имеем нижний квартиль (), если оно составляет ¾ и  ¼  -  верхний квартиль (). Различают три квартиля: первый, второй, третий (). Второй квартиль () является медианой. Расчет квартилей аналогичен вычислению медианы.

 

 

-нижняя граница интервала,

i -интервал ряда распределения

, - суммы частот всех интервалов предшествующих квартильным

,- частоты квартильных интервалов.

Вычислим первую, вторую и третью квартили:

 

 

 

Вторая квартиль должна совпадать с медианой интервального вариационного ряда (77,9).

Относительные показатели, наиболее часто из которых используются коэффициент вариации – его применяют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Если оно не превышает 33%, то совокупность считается однородной.

 

 

Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней:

 

 

 

Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:

 

 

Относительное квартильное отклонение рекомендуется для рядов распределения с открытыми интервалами:

 

 

Симметричным является распределение, в котором частоты двух любых  вариантов , равноотстоящих по обе стороны от центра распределения, равны между собой.

Асимметрия и  эксцесс позволяют оценить отклонение заданного распределения от распределения Гаусса (нормального распределения), для которого эти величины равны нулю.

Асимметрия (третий центральный момент) характеризует симметричность распределения относительно средней арифметической. Ее значения могут быть положительными и отрицательными, что отвечает соответствующей «геометрии» распределения. В частности при средняя арифметическая x сдвинута влево относительно моды и в этом случае имеем левостороннюю симметрию. При – наоборот, асимметрия правосторонняя.

Рассчитываем относительный показатель асимметрии:

==

Так как показатель асимметрии 0, то асимметрия левосторонняя

Рассчитаем среднюю квадратическую ошибку показателя асимметрии:

==

Асимметрия несущественна, т.к. выполняется  неравенство  <3

=0,5

Эксцесс характеризует остроту  вершины полигона частот или гистограммы. Обычно, если эксцесс положителен, то вершина заострена, если отрицателен, то вершина закруглена. Эксцесс нормального  распределения равен нулю. Чем  больше значение эксцесса, тем острее вершина графика.

 

 

 

 

Показатель эксцесса:

= - 3= – 3

Таблица для расчета показателя эксцесса:

Удельный вес технико-обоснованных норм, %

Число предприятий,

Середина интервала, , %

 

70,0-72,66

5

71,33

9487,37

72,66-75,32

4

73,99

934,90

75,32-77,98

6

76,65

14,65

77,98-80,64

7

79,31

27,67

80,64-83,3

3

81,8

694,03

80,3-86,0

5

84,65

10379,7

Итого:

30

 

21538,32


 

Т.к величина эксцесса отрицательна , то распределение плосковершинное. Рассчитываем среднеквадратическую ошибку эксцесса:

 

Вывод: произведя группировку 30 предприятий по удельному весу технико-обоснованных норм, мы получили 6 групп предприятий. Среднее значение удельного веса технико-обоснованных норм на этих предприятиях составляет , а индивидуальные значения изменяются от . Наиболее часто встречающееся значение удельного веса технико-обоснованный норм (мода) . Варианту, стоящему в середине ранжированного ряда соответствует (медиана). Размах вариации составляет . В среднем каждое значение признака отклоняется от среднего значения по группе на . (по среднему линейному отклонению), на . по среднему квадратическому отклонению.

Совокупность данных можно  считать однородной, т.к. коэффициент  вариации принимает значение меньше 33%. Распределение предприятий по факторному признаку имеет правостороннюю ассиметрию, и она несущественна.

Распределение предприятий  по удельному весу технико-обоснованных норм является плосковершинным, т.к. показатель эксцесса принимает отрицательное  значение.

3. Используя ранее выполненную группировку проверить правило сложения дисперсий. Рассчитать коэффициент детерминации.

Общая дисперсия, которая  возникает под влиянием всех факторов, равна сумме дисперсий, которые  появляются как под влиянием факторного признака, положенного в основу группировки, так и под влиянием других факторов.

Благодаря правилу сложения дисперсий можно определить, какая  часть общей дисперсии находится  под влиянием факторного признака, положенного в основу группировки.

Общая дисперсия характеризует вариацию результативного признака(ср.выработка на одного рабочего) под влиянием всех факторов, формирующих уровень признака у единиц совокупности данных. Она определяется по формуле:

=

- общая средняя арифметическая для всей изучаемой совокупности

 

№ предприятия

 

X

 

Y

 

1

76,6

8,0

0,0256

3

80,5

7,9

0,0036

4

77,4

8,1

0,0676

5

82,2

8,3

0,2116

7

83,5

8,2

0,1296

9

85,0

8,0

0,0256

10

84,6

7,9

0,0036

11

84,5

7,6

0,0576

13

80,2

7,6

0,0576

15

79,9

7,8

0,0016

16

79,8

8,0

0,0256

17

79,9

8,1

0,0676

19

77,0

8,4

0,3136

21

75,0

8,3

0,2116

23

83,2

8,6

0,5776

25

86,0

8,6

0,5776

26

82,9

7,2

0,4096

27

70,0

7,5

0,1156

29

75,0

7,3

0,2916

31

76,0

7,5

0,1156

33

76,8

7,6

0,0576

35

73,4

7,6

0,0576

37

70,9

7,2

0,4096

39

70,7

8,0

0,0256

41

76,0

7,5

0,1156

43

76,8

7,6

0,0576

45

73,4

7,6

0,0576

47

70,9

7,2

0,4096

49

70,7

8,0

0,0256

50

79,0

8,1

0,0676

Итого:

2337,8

235,3

4,574

Информация о работе Общая теория статистики