Сводка и группировка статистических данных

Автор работы: Пользователь скрыл имя, 13 Апреля 2014 в 23:28, контрольная работа

Краткое описание

Статистическая сводка представляет собой научно организованную обработку материалов наблюдения, которая включает в себя группировку данных, расчет производственных показателей, составление таблиц.

Содержание

ТЕМА 1. «Сводка и группировка статистических данных.»………..с 3.



ТЕМА 2. «Статистическое изучение взаимосвязи социально-
экономических явлений.» ……………………………………….с 11.



ТЕМА 3. «Статистические показатели.» ……………………….с 16



ТЕМА 4. «Ряды динамики.» …………………………………….с 19



ТЕМА 5. «Экономические индексы.» …………………………с 22

Прикрепленные файлы: 1 файл

Контрольная по статистике.docx

— 228.29 Кб (Скачать документ)

МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РФ

ДЕПАРТАМЕНТ НАУЧНО-ТЕХНОЛОГИЧЕСКОЙ ПОЛИТИКИ И ОБРАЗОВАНИЯ

ФГОУ ВПО КОСТРОМСКАЯ ГСХА

 

 

 

Кафедра экономической кибернетики

 

 

 

КОНТРОЛЬНАЯ РАБОТА

 

 

 

 

по дисциплине «СТАТИСТИКА»

 

 

 

Выполнила студентка:

Заочного обучения по спец.

«Бух. Учет, анализ и аудит»

Лобановская Ирина

Владимировна

Шифр:11153

Курс:2

Группа:6

 

Проверила:

доцент Клинкина Л.В.

 

 

 

 

 

 

 

 

 

 

КОСТРОМА 2012

 

 

 

Содержание

 

 

 

ТЕМА 1. «Сводка и группировка статистических данных.»………..с 3.

 

 

 

ТЕМА 2. «Статистическое изучение взаимосвязи социально-

экономических явлений.» ……………………………………….с 11.

 

 

 

ТЕМА 3. «Статистические показатели.» ……………………….с 16

 

 

 

ТЕМА 4. «Ряды динамики.» …………………………………….с 19

 

 

 

ТЕМА 5. «Экономические индексы.» …………………………с 22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ТЕМА 1. «Сводка и группировка статистических данных.»

 

 

Задание:

На основании данных статистического наблюдения, приведенных в таблице 16,

 

постройте ранжированный, интервальный и кумулятивный ряды распределения

 

сельскохозяйственных предприятий по факторному признаку, изобразите их

графически.

Проведите сводку данных. Посредством метода группировок определите зависимость

результативного признака в сельскохозяйственных предприятиях от факторного.

 

Постройте таблицы и графики зависимости. Сделайте выводы.

 

 

Статистическая сводка представляет собой научно организованную обработку материалов наблюдения, которая включает в себя группировку данных, расчет производственных показателей, составление таблиц.

Статистическая группировка - это расчленение общей совокупности на однородные группы по одному или нескольким существенным признакам. Результаты группировки статистического наблюдения оформляются в виде статистических рядов распределения.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по варьирующему признаку. Он характеризует состояние исследуемого явления, позволяет судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого явления. Удобнее всего ряды распределения анализировать с помощью их графического изображения, позволяющего судить о форме распределения.

     

 

Таблица 1 Данные статистического наблюдения

Качество почв, баллы

Продолжительность уборки оз. пш-цы, дней

Уд. вес  сортовых посадок картофеля, %

Внесение удобрений

Посевная площадь, га

Урожайность, ц /га

органичес-ких под картофель, т/га

кг действующего вещества на 1га посева

озимой пшени-цы

карто-феля

льна

овощей открыто-го грунта

озимой пшеницы

льносо-ломы

карто-феля

овощей открыто-го грунта

1

68

14

95

85

116

310

150

40

100

21

23,2

260

161

2

80

9

81

83

156

400

80

105

50

29

33,4

220

183

3

55

14

60

60

108

250

106

98

59

20

12,6

120

149

4

45

24

66

65

84

480

94

75

54

15

15,9

130

119

5

87

9

79

84

270

400

120

57

70

36

15,4

230

230

6

88

11

90

86

260

350

110

100

60

35

17,8

290

201

7

90

9

90

90

280

450

90

75

52

38

13,3

300

278

8

78

13

100

87

134

370

120

120

70

25

38,8

290

219

9

65

18

56

45

113

290

80

100

30

21

21,8

110

180

10

70

14

60

65

115

300

100

80

50

21

18,8

130

185

11

64

23

86

80

97

400

100

108

48

18

11,4

210

139

12

60

13

55

45

157

500

90

150

40

29

21,1

110

129

13

50

24

60

70

81

260

56

218

30

15

23,4

140

41

14

63

20

58

60

103

300

110

250

50

19

20,1

120

132

15

66

13

94

82

115

300

110

153

90

20

33,9

250

160

16

88

9

77

85

300

310

170

131

40

42

13,4

270

290

17

48

14

49

40

124

340

140

50

60

25

10,7

100

160

18

80

11

78

84

280

410

70

100

48

38

4,8

240

231

19

94

8

100

90

320

340

116

150

54

46

25,4

310

316

20

76

10

70

75

250

420

98

150

44

32

15,8

160

213

21

50

17

68

80

97

160

150

100

65

18

24,5

200

138

22

64

23

86

80

97

400

100

64

48

18

8,8

210

139

23

80

10

80

80

140

300

100

87

60

28

36,3

210

180

24

86

10

78

83

260

300

120

100

70

35

37,2

220

230

25

70

15

65

64

115

200

110

55

60

22

21,6

130

180

26

77

13

95

85

130

300

100

53

80

26

30,2

290

210

27

80

9

78

80

290

310

160

62

40

42

20,2

280

290

28

90

8

90

90

280

300

100

38

56

38

27

290

270

29

75

10

70

76

255

220

50

50

40

33

15,3

165

210

30

66

15

90

80

100

250

80

200

60

20

24,3

240

150


 

N+1

Факторный признак

Результативный признак

6.

Продолжительность уборки озимой пшеницы  

Урожайность озимой пшеницы




 

 

 

 

 

 

 

РЕШЕНИЕ:

 

1.Построение ранжированного ряда распределения.

 

Ряд распределения – это группировка, в которой для характеристики групп применяется только один показатель – численность групп.

 

Ранжированный ряд распределения предполагает расположение всех вариантов ряда в порядке возрастания изучаемого признака.

 

Для проведения сортировки в ТП Excel нам нужно:

 

1.Выделить всю  таблицу.

 

2.Открыть вкладку Данные.

 

3.В диалоговом окне выбирать  столбец С.

   4.Нажать ОК.

 

После этого вся таблица преобразуется. Так как у нас факторный признак продолжительность уборки, мы ориентируемся именно по этому столбцу в таблице. Следовательно, после проделанных нами действий, вся таблица отсортируется по факторному признаку в порядке возрастания.

 

Для графического изображения ранжированного ряда распределения необходимо построить точечную диаграмму. Для ее построения нужно проделать следующие действия:

 

В отсортированной таблице выделяем столбец С вместе с заголовком.

Открываем вкладку Вставка и выбираем Точечная диаграмма.

 

После чего получаем диаграмму ранжированного ряда распределения.

 

 

 

 

 

 

 

 

Из диаграммы видно, что признак изменяется плавно,

значит можно разбить предприятия на 3    группы

 

с низкой, средней и высокой производительностью.

 

Построение интервального ряда распределения предприятий по изучаемому признаку предполагает определение числа групп (интервалов).

Для расчета числа групп воспользуемся следующей формулой: , где N – oбщее число единиц изучаемой совокупности. Получаем:


n=2*1,477=2,954=3

Расчет равного интервала

Наименование показателя

Значение

Максимальное значение признака

24

Минимальное значение признака

8

Число групп

3

Округленное значение шага

5,333

Округленное значение шага

5,3


Интервальный ряд распределения строится в виде групповой таблицы, в сказуемом которой показывается число единиц в каждой группе (частота) или их удельный вес в общей численности единиц совокупности (частость).

Кумулята (кривая сумм) используется для изображения вариационных рядов,  изображает ряд накопленных частот.

Кумулятивный ряд - это ряд, в котором подсчитываются накопленные частоты, он показывает, сколько единиц совокупности имеют значение признака не больше, чем данное значение, и вычисляется путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

     

Интервальный и кумулятивный ряды распределения 

     

 предприятий по продолжительности  уборки оз. Пшеницы

Группы предприятий по продолжительности уборки оз. Пшеницы, дней

Число предприятий (частота)

Удельный вес предприятий в группе в общей численности,% (частота)

Накопленная величина

 

Нижняя граница группы

Верхняя граница группы

 

1

8

13,3

17

56,7%

17

 

2

13,4

18,7

8

26,7%

25

 

3

18,8

24,1

5

16,7%

30

 
     

30

100%

   

Для графического изображения интервального ряда распределения выделяем номера групп и число предприятий в таблице, нажимаем вкладку Вставка- Гистограмма.

Кумулятивный ряд распределения предприятий

Где по оси У показана накопительная частота, а по оси Х продолжительность уборки.

Сводка статистических данных.

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме.

Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам.

Статистическая таблица содержит два элемента: подлежащее и сказуемое.

Подлежащее – объект, характеризующийся цифрами. Обычно подлежащее дается в левой части, в наименовании срок.

Сказуемое - это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц. Сказуемое формирует верхние заголовки.

Сводные показатели.

Для нахождения урожайности нам необходимо умножить урожайность  каждого предприятия на его посевную площадь, после чего найти общую сумму.

№ группы

Число предприятий в группе

Продолжительность уборки оз. Пшеницы

Посевная площадь

Валовый сбор

1                               8-12

17

123

4510

163610

2                             12-16

8

138

3120

73260

3                                16-24

5

149

2290

40170

ИТОГО:

30

 

9920

277040

   

410

   

На основе проведенной сводки данных рассчитывается таблица, содержащая средние характеристики анализируемой совокупности.

Подлежащее таблицы- группы предприятий по урожайности, ц; сказуемое таблицы- средняя продолжительность уборки оз. Пшеницы; средняя посевная площадь; средняя урожайность.

Для нахождения средних характеристик нам нужно найти среднее значение каждого признака у всех предприятий по отдельности. Для этого используем функцию СРЗНАЧ.

 

Средние характеристики групп

 
       

№ группы

Средняя продолжительность уборки

Средняя посевная площадь, га

Средняя урожайность, ц

1                                 8-13,3

10,3

352

33,6

2                               13,4-18,7

15,125

262,5

21,28

3                                   18,8-24,1

22,8

368

17,0

В среднем по совокупности

13,7

327,4

27,9


На основании полученных данных строим диаграмму показывающую зависимость урожайности оз. Пшеницы от продолжительности уборки. Для этого выделяем соответствующие столбцы ,открываем вкладку Вставка и выбираем точечную диаграмму.

ВЫВОД: Чем быстрее происходит уборка, тем выше мы получаем урожай. Можно предположить наличие обратной связи между рассматриваемыми параметрами.

ТЕМА 2. «Статистическое изучение взаимосвязи социально-экономических явлений.»

Задание:

На основании исходных данных задания 1, проведите

 

корреляционно-регресссионный анализ зависимости между

рассматриваемыми признаками, выполнив следующее:

 

1)постройте точечный график экспериментальных  данных,

 

опишите формулу и направление связи;

 

2)оцените тесноту связи с помощью  коэффициента корреляции;

3)определите параметры линейного  уравнения связи;

 

4)выполните проверку на адекватность  полученного уравнения

корреляционно-регрессионной зависимости по критериям

 

Фишера, Стьюдента и средней ошибке аппроксимации;

 

5)по построенному уравнению связи  выполните прогноз

 

результативного признака, увеличив среднее значение факторного в 1,5 раз;

6)проанализируйте влияние изменения  факторного признака на

результативный, рассчитав коэффициент эластичности.

 

РЕШЕНИЕ:

Построение точечного графика экспериментальных данных – это наиболее простой и наглядный способ определения формы и направления связи в случае парной корреляции.

Для построения точечного графика надо выделить столбцы урожайности оз. Пшеницы и продолжительность уборки; открыть вкладку Вставка, выбрать Диаграмма и нажать Точечная.

Анализируя полученный график ,можно заметить, что прослеживается обратная

зависимость между продолжительностью уборки оз. Пшеницы и её урожайностью, что и было установлено в ходе проведения аналитической группировки в первом задании.

 

Оценка тесноты связи между признаками осуществляется с помощью линейного коэффициента корреляции (r), который изменяется в пределах от -1 до 1. Чем ближе коэффициент корреляции по модулю к единице, тем сильнее связь между признаками. Для расчета коэффициента корреляции мы используем функцию КОРРЕЛ(), в качестве аргумента которой используются ссылки на столбцы урожайности оз. Пшеницы и продолжительность уборки. Коэффициент корреляции получается            r=-0.84061, что свидетельствует о наличие сильной связи, а отрицательный знак свидетельствует о наличие обратной связи между параметрами.

 

3. Линейная зависимость может выражаться уравнением прямой линии: или , где - (результативный признак); -(факторный признак); , - параметры уравнения.

 

 

ŷ  - урожайность оз. Пшеницы

   

х  - продолжительность уборки оз. Пшеницы

аₒ, а₁ - параметры уравнения

   


Нахождение коэффициентов регрессии осуществляется с помощью пункта меню Сервис – Анализ данных – Регрессия

Получаем результат в вид

ВЫВОД ИТОГОВ

               
                 

Регрессионная статистика

             

Множественный R

0,840606

             

R-квадрат

0,7066184

             

Нормированный R-квадрат

0,6961405

             

Стандартная ошибка

4,9404755

             

Наблюдения

30

             
                 

Дисперсионный анализ

             
 

df

SS

MS

F

Значимость F

     

Регрессия

1

1646,067644

1646,067644

67,4388528

6,13935E-09

     

Остаток

28

683,4323557

24,40829842

         

Итого

29

2329,5

           
                 
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

48,38789

2,698746568

17,92976444

6,97795E-17

42,859

5851

53,916022

42,8597585

53,916022

Переменная X 1

-1,528382

0,186113076

-8,21211622

6,13935E-09

-1,909617569

-1,14714686

-1,90961757

-1,14714686

                 

Соответствие расчетных показателей

Адрес ячейки

Обозначение показателя

Наименование показателя в общепринятой те

минологии

С56

r

Коэффициент корреляции

С57

 

Rˆ=rˆ


Коэффициент детерминации

F64

 

Расчет значения критерия Фишера

C69

аₒ

Свободный член в регрессионной модели

C70

а₁

Коэффициент модели, стоящий перед переменной х

E69

Расчет значения

критерия Стьюдента для параметра аₒ

E70

Расчет значения критерия Стьюдента для параметра  а₁

     

 

Таким образом, в ходе вычислений получили регрессионную модель

следующего вида:     ŷ=48,38789-1,52838х

 

4.Проверка полученной модели на адекватность осуществляется в несколько этапов.

     1.Адекватность  модели по критерию Фишера:

Модель адекватна, если

Для определения адекватности модели по критерию Фишера используем формулу

FРАСПОБР(а;k1;k2)  где а=0,05 (допустимая погрешность модели)

                                         k1=1 (число факторных признаков в  модели)

                                         k2=m-(k1+1)=30-(1+1)=28  (m-число экспериментальных данных).


   

Следовательно, построенная модель по критерию Фишера адекватна.

      2. Значимость коэффициентов модели по критерию Стьюдента осуществляется по следующему условию: коэффициент значим, если  .

Критическое значение Стьюдента определяется по формуле: СТЬЮДРАСПОБР(α;k), где α=0,05 (допустимая погрешность модели), k=m-n=30-2=28 (m - число экспериментальных данных, n – число коэффициентов регрессии в модели ( , )).

Получаем:

Вывод: все коэффициенты значимы.

 Оценка качества модели  по  средней ошибке аппроксимации, проводится по следующей формуле:

где фактическое значение результативного признака, - значение результативного признака, рассчитанного по полученной модели, m – число наблюдений.

Для нахождения                       используем функцию ABS, в которой из урожайности вычитаем               и делим полученное число на урожайность для каждого предприятия соответственно. После чего находим общую сумму                      .

Далее подставляем найденные значения в формулу:

 

Получили среднюю ошибку аппроксимации равную 16,23%.

5.Для прогнозирования  урожайности оз. Пшеницы используем  полученную ранее модель

ŷ=48,38789-1,52838х. Найдем среднюю продолжительность уборки оз. Пшеницы. Для этого в таблице выделим соответствующий столбец и выберем функцию СРЗНАЧ. Получаем 13,67 дней. Зная все данные, мы подставляем их в уравнение, увеличив среднюю продолжительность уборки в 1,5 раз. Получаем:

Вывод: Так, если среднюю продолжительность уборки увеличить в 1,5 раза, то средняя урожайность снизится с 27,5 ц/га до 17,05 ц/га.

6. Вычислим коэффициенты  эластичности по формуле                                   где - коэффициент регрессионного уравнения, - среднее значение факторного признака по всей совокупности, - среднее значение результативного признака по всей совокупности.

 Получаем:

ВЫВОД:    Таким образом, если мы увеличим продолжительность уборки оз. Пшеницы на 1% , то урожайность снизится на 0,76%.

   

 

ТЕМА 3. «Статистические показатели.»

 

Задание:

На основании данных, приведенных в таблице ниже, рассчитать следующие статистические показатели:

1)Относительная величина координации  объемов производства объединения  за август.

 

2)Средняя величина: себестоимость  транспортных работ объединения  за август;

   

процент выполнения плана по объему работ объединения в сентябре.

     

3)Показатель вариации: дисперсия  себестоимости за сентябрь;

     

коэффициент вариации объема транспортных работ за август

     

 

 

 

Таблица статистических данных.

   
           

Номер предприятия

Август

Сентябрь

Объем работ, т/км

Себестоимость, 1 т/км, руб

Общая сумма затрат, руб

Себестоимость, 1 т/км, руб

План по объему работ, т/км

1

124800

8,23

1690584

7,73

1896759

2

51000

7,53

603612

8,28

75870

3

180300

8,97

2389254

7,61

280395

4

63000

7,64

790860

8,97

107100

5

95376

8,35

1088370

8,34

153486


 

РЕШЕНИЕ:

  1. Координация объемов производства объединения за август.

Координации – характеризуют соотношение отдельных частей одного целого, одна из которых принимается за базу сравнения.

 

Для нахождения координации объемов производства объединения за август, берем из графы объема работ наибольшее значение и сравниваем с ним остальные. Наибольший объем работ был у 3 предприятия, следовательно, все другие будем сравнивать с ним. Получаем:

 Коэффициенты координации:


1-го предприятия 


2-го предприятия 


4-го предприятия 

 

5-го предприятия


 

 

2.Средняя величина.

Средняя величина представляет собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Она отражает типичные черты и уровень этого признака в расчете на единицу совокупности.

1.Средняя величина себестоимости транспортных работ вычисляется по формуле:


 

Находим сумму произведений объема работ на себестоимость с помощью функции СУММПРОИЗВ. Получается значение 4306610,77 т/км, руб. Затем находим сумму объема работ с помощью функции СУММ. Получаем значение 40,72 т/км.

Подставляем полученные значения в формулу:


 

 

Получили, что средняя себестоимость объема транспортных работ объединения за август равна 8,37 руб.

 

2.Чтобы найти процент выполнения  плана по объему работ вычисляем  по формуле:


 

 

Нам не известен фактический объем. Вычисляем его по формуле:


 

Найдем фактический объем для каждого предприятия. После чего рассчитаем суммы фактического объема и по плану. Получили:

Фактический = 824314,4   По плану = 2513610

 

Имея все необходимые данные, мы можем вычислить процент выполнения плана по объему работ объединения за сентябрь, подставив значение в первую формулу:


 

Следовательно, процент выполнения плана по объему работ объединения за сентябрь равен 32,79%.

 

 

3. Вариация - это различия в значениях признака у единиц совокупности

1. Дисперсия - это средний квадрат отклонений индивидуальных значений от своей средней величины. Она не имеет единиц измерения.

Дисперсию себестоимости за сентябрь вычисляем по взвешенной формуле

Получили значение дисперсии, равное 3,18E-16

 

 

  1. Коэффициент вариации – это относительный показатель вариации, который наиболее часто используется в практических расчетах.

Коэффициент вариации объема транспортных работ за август вычисляем по формуле:


 


Где

 


Информация о работе Сводка и группировка статистических данных