Вариационные ряды

Автор работы: Пользователь скрыл имя, 10 Мая 2014 в 22:19, курс лекций

Краткое описание

Статистическое наблюдение – это первый этап любого статистического исследования и заключается в сборе данных о массовых явлениях путем регистрации их признаков (источник первичной информации). По документам отчетности можно провести и единовременные выборочные обследования (см. выборочные и генеральные совокупности).
На втором этапе статистического исследования на основе первичной информации выступает сводка – большей частью неформализованная, содержательная процедура обработки первичных материалов наблюдений с целью получения итоговых или упорядоченных числовых характеристик изучаемой статистической совокупности. Ее важным моментом является группировка.

Прикрепленные файлы: 1 файл

Тема 1Вариационные ряды.doc

— 139.00 Кб (Скачать документ)

Итак, исходная информация в виде СС представлена в табл. 3.Для нас – это СС, то есть множество значений с именем Y.

1) Сначала необходимо  найти максимальное и минимальное  значение среди элементов исходной  статистической совокупности: ymax = 15,0 млн. руб., ymin = 5,1 млн. руб. Тогда размах выборки R = ymax - ymin = 15,0 – 5,1 = 9,9 (млн. руб.). Значит все значения элементов множества Y расположены в данном диапазоне, который необходимо разделить на необходимое количество интервалов, что и составляет сущность  формирования вариантов будущего ВР.

2) Определение приблизительного числа интервалов (вариантов ВР):

n = 1 + 3,22 ∙ lg N = 1 + 3,22 ∙ lg 50 = 1  + 3,22 ∙ 1,69 ≈ 6,44 ≈ 6 (интервалов)

Для построения ВР примем решение ограничить число интервалов пятью интервалами (n=5).

3) Оценим величину шага h, разделив размах выборки на число шагов: h = R / n = 9,9 млн. руб. / 5 = 1,98 млн. руб. Это при условии, что формировать интервалы (варианты интервального ВР) начнем с минимального значения 5,1 млн. руб. Возможен более удобный вариант, если начнем формировать интервалы не с минимального значения 5,1 млн. руб, а со значения 5,0 млн. руб. Тогда R = 15,0 – 5,0 = 10,0 (млн. руб.) и h = R / n = 10.0 млн. руб./ 5 = 2 млн. руб.

Итак, в качестве нижней границы мы принимаем значение 5,0 млн. руб. вместо 5,1 млн. руб., тогда величина интервала будет равна 2 млн. руб. Так удобнее для счета, да и значение одного из элементов 5,1 млн. руб. не теряется: оно будет принадлежать первому интервалу от 5 + 2 = 7 млн. руб.

4) Заполняем рабочую  таблицу (см. табл. 4) – будущий интервальный  ВР с постоянным шагом. Также введем дополнительно по отношению к табл. 2 дискретного вариационного ряда дополнительную графу для фиксирования середин сформированных интервалов.

Замечание. При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и как нижняя граница другого интервала), единица исходной СС (из табл. 3), обладающая этим значением, относят к той группе, где эта величина выступает в роли верхней границы. 

5) Определяем номер модального  интервала и значение модальной (максимальной) частоты fm. Модальным интервалом будет тот, которому принадлежит наибольшее число попаданий исследуемой случайной величины (размер капитала того или иного обследованного МП города). В нашем случае в качестве модального будет выступать второй интервал, частота попаданий в котором максимальная. Следовательно fm = f2, модальный интервал имеет номер i=2.

                                                                                                                Таблица 4

Интервальный вариационный ряд. Результаты отображения вида (1)

Номера

интервалов

Начало – конец интервалов 

Среднее

интервальное

значение

Частота

попаданий в

интервалы

Значение

частоты

Значения

накопленной

частоты

        I

   xiн -  xiв

       xiср

   счет   

       fi

          qi

        1

        2

        3

        4

        5 = n

   5  -    7

   7  -    9

  9 -   11

  11 -   13

  13 -   15

        6

        8

      10

      12

     14

/////////

////////////////

///////////

////////

//////

       9

     16

     11

       8

      6

         9

        25

       36

        44

        50

 

∑fi = 50

 

 

Интервальный вариационный ряд с постоянным шагом построен: исходная СС в виде множества Y, представленное данными табл. 3, отображено в более компактное множество Х  в виде табл. 4. Это и есть искомый интервальный ВР с постоянным шагом. Визуализируем его в виде двух графиков, один из которых построим в координатах (х, f) – гистограмму (см. рис. 1), а дрй цели угой в координатах (х, q) – кумуляту (см. рис. 2).

Сначала построим гистограмму. Студентам рекомендуется при этом использовать место в конспектах так, чтобы его максимально использовать. Для этого необходимо определиться с ценой деления (графики при этом рекомендуется делать без линейки, от руки). Так, в случае построения гистограммы по горизонтальной оси абцисс следует сделать так, чтобы весь график со всеми вариантами уместился от 5 до 15-ти (млн. руб.), тогда как для отображения частоты попадания в тот или иной вариант на вертикальтной оси ординат достаточно ограничиться числом 15; чуть выше – и 16 будет (см. пятую графу табл. 4).

Значение наиболее часто встречающегося значения в исходной СС, то есть мода Мо, графо-аналитически путем графически в координатах (х, f) определяется так, как это показано на рис. 1 сплошными линиями внутри столбика гистограммы, принадлежащему модальному интервалу (перпендикуляр к оси абцисс строится из пересечения прямых). Здесь мода получается равной где-то  8,0 млн. руб. (как на графике), а на самом деле она должна быть где-то между 8,1 – 8,3 млн. руб. (с учетом специфики рисования графиков в windows).

 

     


             

 

             

               15

 

               12

 

                 9


                 6

 

                 3 

             

 

                                                           

                                                  Мо ≈ 8             

                                   5          7          9          11        13        15

      

Рис. 1. Гистограмма, отражающая зависимость частот от вариантов

 

Значение медианы также можно определить графо-аналитическим путем по графику кумуляты в координатах (х, q) – см. рис. 2. График накопленных частот строится так. В начале первого интервала  [5 – 7] еще не накоплено ничего (в точке 5 млн. руб. на оси абцисс должен быть нуль), зато к концу первого интервала накопилось 9 попаданий случайной величины – объемов ОФ попавших в этот интервал МП и т.д.


 

 

          

               50

              

               40


              

               30

              

               20


 

               10            

 

              


 

                                                          Mе ≈ 9

                                   5          7          9         11         13       15

Рис. 2. Кумулята, отражающая зависимость накопленных частот от вариантов

 

 

Поскольку из определения медианы следует, что она делит исходную совокупность на две равные части, разделим всю сумму частот ∑ fi. Пополам и получим:             (∑ fi./ 2) = 50 / 2 = 25 (штук, величина безразмерная). Затем – спроецируем это значение на график кумуляты (по стрелке, параллельной оси абцисс, с точки пересечения проекции и кумуляты опустим к горизонтальной оси перпендикуляр) – и получим приближенное значение медианы так, как это показано на рис. 2.

Таким образом, графо-аналитическим путем были определены приближенные значения новых структурных средних построенного нами вариационного ряда, значение которых может быть уточнено строго аналитическим способом по формулам (5) и (6) - соответственно. Начало модального интервала = 7, размер шага = 2, модальная частота fm= 16. Тогда частота интервала, предшествующему модальному, fm- 1 = 9, а частота, последующего за модальным интервалом  fm+1 = 11, qm-1 = 9,  как и следует из табл. 4.

 

 

                                      fm  -  fm - 1

Мо = xmн + h ∙————————————.                                                                  (5)

                        (fm  -  fm – 1) +  (fm  -  fm + 1)

 

По формуле (5) получим:

 

                             16  - 9

Мо = 7 + 2 ∙ ————————— = 8,16 ≈ 8,2 (млн. руб.).      

                      (16 -  9) +  (16 - 11)

 

Значение медианы вычислим по формуле (6):

 

                        ( ∑ fi / 2) – qm- 1

Ме = xmн + h ∙———————  =                                                                                  (6)

                                    fm  

                    (50 / 2) – 9                    25  -  9

= 7  + 2 ∙ —————— = 7  + 2∙ ———— = 9,0 (млн. руб.).

                            16                              16

 

Если сравнить результаты, полученные графо-аналитическим и аналитическим способами, то по части величины моды вместо 8,1 – 8,3 получили 8,8 млн. руб., по части медианы – точно 9,0 млн. руб. хоть тем, хоть другим способом.

Чтобы лучше уяснить физический смысл медианы, приведем здесь еще раз содержание табл. 3 и выделим шрифтом те значения элементов исходной СС, значения которых будут меньше или равны величине медианы = 9,0 млн. руб.

 

  9.4     8.0     6.3     10.0     15.0     8.2     7.3     9.2     5.8     8.7

  5.2   13.2     8.1       7.5     11.8   14.6     8.5     7.8   10.5     6.0

  5.1     6.8     8.3       7.7       7.9     9.0   10.1     8.0   12.0   14.0

  8.2     9.8   13.5     12.4       5.5     7.9     9.2   10.8   12.1   12.4

12.9   12.6     6.7       9.7       8.3   10.8   15.0     7.0   13.0     9.5

 

Заштриховнных значений получилось из 50-ти ровно половина – 25 штук, как и следовало ожидать. В этом и есть смысл медианы, делящей всю исходную совокупность пополам: половина обследованных МП города имеют капитал до 9 млн. руб. включительно, вторая половина (оставшиеся 25 МП) имеют размер основных фондов более 9 млн. руб.

Попутно заметим, что такую структурную среднюю как медиана, можно так или иначе увидеть, то есть убедиться, что она реально существует, тогда как величину моды (наиболее часто встречающегося значения в исходной СС) увидеть можно далеко не всегда. Да, в исходной СС значения отдельных ее элементов 8,2 млн. руб. встречаются даже дважды. Но это – округленное до десятых долей, тогда как количественный показатель 8,17 млн. руб., полученный теоретически, не встречается в исходной таблице ни разу. Однако он объективно существует, независимо от нас, как некоторое обобщение, абстракция. Хотя, конечно, капиталы в 8,2 млн. руб. весьма близки к нему.

После того, как структурные средние – мода и медиана определены нами даже альтернативными методами, необходимо оценить среднее значение полученного ВР.

 

Оценка среднего взвешенного вариационного ряда

 

Поскольку каждый вариант согласно табл. 4 проявляет себя с неодинаковыми  частотами, примени формулу для вычисления среднего взвешенного вида (2). В качестве вариантов будем использовать их средние значения  xiср:

 

             ∑ xiср ∙ fi      6∙ 9 + 8∙ 16 + 10 ∙ 11 + 12∙ 8 + 14∙ 6          472

хсрв = ———— =   ——————————————— =   ——— = 9,44 (млн. руб.).                                                                                      

               ∑ fi                                     50                                         50

 

Располагая значениями моды, медианы и среднего взвешенного, можно аналитически оценить степень асимметрии распределения случайной величины – объема основных фондов выбранных для анализа малых предприятий города..

 

Оценка степени асимметрии распределения

 

Оценка степени асимметрии распределения определяется по нестрогому неравенству следующего вида:

 

│ Мо  -  хсрв │ ≤  3 ∙  Ме  -  хсрв │.                                                                                 (7)

 

Если нестрогое неравенство вида (7) выполняется, распределение ОФ МП как случайной величины является умеренно асимметричным, если не выполняется – асимметрия распределения считается повышенной. Тога, согласно условию (7),

 

│ 8,17  -  9,44 │ ≤  3 ∙ │ 9,00  -  9,44│,

 

           1,27          ≤             1,32:

 

Нестрогое неравенство вида (7) выполняется. Следовательно. Распределение ОФ МП (в млн. руб.) в исходной статистической совокупности является умеренно-асимметричным.

Информация о работе Вариационные ряды