Автор работы: Пользователь скрыл имя, 10 Мая 2014 в 22:19, курс лекций
Статистическое наблюдение – это первый этап любого статистического исследования и заключается в сборе данных о массовых явлениях путем регистрации их признаков (источник первичной информации). По документам отчетности можно провести и единовременные выборочные обследования (см. выборочные и генеральные совокупности).
На втором этапе статистического исследования на основе первичной информации выступает сводка – большей частью неформализованная, содержательная процедура обработки первичных материалов наблюдений с целью получения итоговых или упорядоченных числовых характеристик изучаемой статистической совокупности. Ее важным моментом является группировка.
Итак, исходная информация в виде СС представлена в табл. 3.Для нас – это СС, то есть множество значений с именем Y.
1) Сначала необходимо
найти максимальное и
2) Определение приблизительного числа интервалов (вариантов ВР):
n = 1 + 3,22 ∙ lg N = 1 + 3,22 ∙ lg 50 = 1 + 3,22 ∙ 1,69 ≈ 6,44 ≈ 6 (интервалов)
Для построения ВР примем решение ограничить число интервалов пятью интервалами (n=5).
3) Оценим величину шага h, разделив размах выборки на число шагов: h = R / n = 9,9 млн. руб. / 5 = 1,98 млн. руб. Это при условии, что формировать интервалы (варианты интервального ВР) начнем с минимального значения 5,1 млн. руб. Возможен более удобный вариант, если начнем формировать интервалы не с минимального значения 5,1 млн. руб, а со значения 5,0 млн. руб. Тогда R = 15,0 – 5,0 = 10,0 (млн. руб.) и h = R / n = 10.0 млн. руб./ 5 = 2 млн. руб.
Итак, в качестве нижней границы мы принимаем значение 5,0 млн. руб. вместо 5,1 млн. руб., тогда величина интервала будет равна 2 млн. руб. Так удобнее для счета, да и значение одного из элементов 5,1 млн. руб. не теряется: оно будет принадлежать первому интервалу от 5 + 2 = 7 млн. руб.
4) Заполняем рабочую таблицу (см. табл. 4) – будущий интервальный ВР с постоянным шагом. Также введем дополнительно по отношению к табл. 2 дискретного вариационного ряда дополнительную графу для фиксирования середин сформированных интервалов.
Замечание. При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и как нижняя граница другого интервала), единица исходной СС (из табл. 3), обладающая этим значением, относят к той группе, где эта величина выступает в роли верхней границы.
5) Определяем номер модального интервала и значение модальной (максимальной) частоты fm. Модальным интервалом будет тот, которому принадлежит наибольшее число попаданий исследуемой случайной величины (размер капитала того или иного обследованного МП города). В нашем случае в качестве модального будет выступать второй интервал, частота попаданий в котором максимальная. Следовательно fm = f2, модальный интервал имеет номер i=2.
Интервальный вариационный ряд. Результаты отображения вида (1)
Номера интервалов |
Начало – конец интервалов |
Среднее интервальное значение |
Частота попаданий в интервалы |
Значение частоты |
Значения накопленной частоты |
I |
xiн - xiв |
xiср |
счет |
fi |
qi |
1 2 3 4 5 = n |
5 - 7 7 - 9 9 - 11 11 - 13 13 - 15 |
6 8 10 12 14 |
///////// //////////////// /////////// //////// ////// |
9 16 11 8 6 |
9 25 36 44 50 |
∑fi = 50 |
Интервальный вариационный ряд с постоянным шагом построен: исходная СС в виде множества Y, представленное данными табл. 3, отображено в более компактное множество Х в виде табл. 4. Это и есть искомый интервальный ВР с постоянным шагом. Визуализируем его в виде двух графиков, один из которых построим в координатах (х, f) – гистограмму (см. рис. 1), а дрй цели угой в координатах (х, q) – кумуляту (см. рис. 2).
Сначала построим гистограмму. Студентам рекомендуется при этом использовать место в конспектах так, чтобы его максимально использовать. Для этого необходимо определиться с ценой деления (графики при этом рекомендуется делать без линейки, от руки). Так, в случае построения гистограммы по горизонтальной оси абцисс следует сделать так, чтобы весь график со всеми вариантами уместился от 5 до 15-ти (млн. руб.), тогда как для отображения частоты попадания в тот или иной вариант на вертикальтной оси ординат достаточно ограничиться числом 15; чуть выше – и 16 будет (см. пятую графу табл. 4).
Значение наиболее часто встречающегося значения в исходной СС, то есть мода Мо, графо-аналитически путем графически в координатах (х, f) определяется так, как это показано на рис. 1 сплошными линиями внутри столбика гистограммы, принадлежащему модальному интервалу (перпендикуляр к оси абцисс строится из пересечения прямых). Здесь мода получается равной где-то 8,0 млн. руб. (как на графике), а на самом деле она должна быть где-то между 8,1 – 8,3 млн. руб. (с учетом специфики рисования графиков в windows).
15
12
9
6
3
Рис. 1. Гистограмма, отражающая зависимость частот от вариантов
Значение медианы также можно определить графо-аналитическим путем по графику кумуляты в координатах (х, q) – см. рис. 2. График накопленных частот строится так. В начале первого интервала [5 – 7] еще не накоплено ничего (в точке 5 млн. руб. на оси абцисс должен быть нуль), зато к концу первого интервала накопилось 9 попаданий случайной величины – объемов ОФ попавших в этот интервал МП и т.д.
50
40
30
20
10
5 7 9 11 13 15
Рис. 2. Кумулята, отражающая зависимость накопленных частот от вариантов
Поскольку из определения медианы следует, что она делит исходную совокупность на две равные части, разделим всю сумму частот ∑ fi. Пополам и получим: (∑ fi./ 2) = 50 / 2 = 25 (штук, величина безразмерная). Затем – спроецируем это значение на график кумуляты (по стрелке, параллельной оси абцисс, с точки пересечения проекции и кумуляты опустим к горизонтальной оси перпендикуляр) – и получим приближенное значение медианы так, как это показано на рис. 2.
Таким образом, графо-аналитическим путем были определены приближенные значения новых структурных средних построенного нами вариационного ряда, значение которых может быть уточнено строго аналитическим способом по формулам (5) и (6) - соответственно. Начало модального интервала = 7, размер шага = 2, модальная частота fm= 16. Тогда частота интервала, предшествующему модальному, fm- 1 = 9, а частота, последующего за модальным интервалом fm+1 = 11, qm-1 = 9, как и следует из табл. 4.
fm - fm - 1
Мо = xmн + h ∙————————————.
(fm - fm – 1) + (fm - fm + 1)
По формуле (5) получим:
16 - 9
Мо = 7 + 2 ∙ ————————— = 8,16 ≈ 8,2 (млн. руб.).
(16 - 9) + (16 - 11)
Значение медианы вычислим по формуле (6):
( ∑ fi / 2) – qm- 1
Ме = xmн + h ∙——————— =
fm
(50 / 2) – 9 25 - 9
= 7 + 2 ∙ —————— = 7 + 2∙ ———— = 9,0 (млн. руб.).
16
Если сравнить результаты, полученные графо-аналитическим и аналитическим способами, то по части величины моды вместо 8,1 – 8,3 получили 8,8 млн. руб., по части медианы – точно 9,0 млн. руб. хоть тем, хоть другим способом.
Чтобы лучше уяснить физический смысл медианы, приведем здесь еще раз содержание табл. 3 и выделим шрифтом те значения элементов исходной СС, значения которых будут меньше или равны величине медианы = 9,0 млн. руб.
9.4 8.0 6.3 10.0 15.0 8.2 7.3 9.2 5.8 8.7
5.2 13.2 8.1 7.5 11.8 14.6 8.5 7.8 10.5 6.0
5.1 6.8 8.3 7.7 7.9 9.0 10.1 8.0 12.0 14.0
8.2 9.8 13.5 12.4 5.5 7.9 9.2 10.8 12.1 12.4
12.9 12.6 6.7 9.7 8.3 10.8 15.0 7.0 13.0 9.5
Заштриховнных значений получилось из 50-ти ровно половина – 25 штук, как и следовало ожидать. В этом и есть смысл медианы, делящей всю исходную совокупность пополам: половина обследованных МП города имеют капитал до 9 млн. руб. включительно, вторая половина (оставшиеся 25 МП) имеют размер основных фондов более 9 млн. руб.
Попутно заметим, что такую структурную среднюю как медиана, можно так или иначе увидеть, то есть убедиться, что она реально существует, тогда как величину моды (наиболее часто встречающегося значения в исходной СС) увидеть можно далеко не всегда. Да, в исходной СС значения отдельных ее элементов 8,2 млн. руб. встречаются даже дважды. Но это – округленное до десятых долей, тогда как количественный показатель 8,17 млн. руб., полученный теоретически, не встречается в исходной таблице ни разу. Однако он объективно существует, независимо от нас, как некоторое обобщение, абстракция. Хотя, конечно, капиталы в 8,2 млн. руб. весьма близки к нему.
После того, как структурные средние – мода и медиана определены нами даже альтернативными методами, необходимо оценить среднее значение полученного ВР.
Оценка среднего взвешенного вариационного ряда
Поскольку каждый вариант согласно табл. 4 проявляет себя с неодинаковыми частотами, примени формулу для вычисления среднего взвешенного вида (2). В качестве вариантов будем использовать их средние значения xiср:
∑ xiср ∙ fi 6∙ 9 + 8∙ 16 + 10 ∙ 11 + 12∙ 8 + 14∙ 6 472
хсрв = ———— = ———————————————
= ——— = 9,44 (млн. руб.).
∑ fi
Располагая значениями моды, медианы и среднего взвешенного, можно аналитически оценить степень асимметрии распределения случайной величины – объема основных фондов выбранных для анализа малых предприятий города..
Оценка степени асимметрии распределения
Оценка степени асимметрии распределения определяется по нестрогому неравенству следующего вида:
│ Мо - хсрв │ ≤ 3 ∙ Ме - хсрв │.
Если нестрогое неравенство вида (7) выполняется, распределение ОФ МП как случайной величины является умеренно асимметричным, если не выполняется – асимметрия распределения считается повышенной. Тога, согласно условию (7),
│ 8,17 - 9,44 │ ≤ 3 ∙ │ 9,00 - 9,44│,
1,27 ≤ 1,32:
Нестрогое неравенство вида (7) выполняется. Следовательно. Распределение ОФ МП (в млн. руб.) в исходной статистической совокупности является умеренно-асимметричным.