Автор работы: Пользователь скрыл имя, 19 Июня 2013 в 08:32, контрольная работа
В соответствии с основными тремя задачами, решаемыми с использованием группировок, принято выделять три основных видов группировок: типологические, структурные, аналитические. Типологические группировки обеспечивают разграничение массовых явлений на качественно однородные совокупности. Группировки, применяемые для изучения структуры массовых явлений, называются структурными. Группировки, предназначенные для изучения взаимосвязей и зависимостей между явлениями и процессами, называются аналитическими. Аналитические группировки строятся по факторному признаку (явлению). Например, изучая взаимосвязь между производительностью труда и себестоимостью продукции предприятия, следует сгруппировать по уровню производительности труда.
1 Сводка и группировка материалов статистического
наблюдения……………………………………………………………3
2 Абсолютные и относительные средние величины……………....5
3 Статистические распределения и их основные характеристики..10
Список литературы………………………………………
Рис.1. Структура выпуска продукции по металлургическому комбинату.
Тема 3. Статистические распределения и их основные характеристики.
Упорядоченное распределение единиц совокупности по определенному варьирующему признаку представляет собой ряд распределения.
Первым этапом статистического изучения вариации количественного признака является построение вариационного ряда, который в зависимости от характера представления варьирующего признака может быть: а) интервальным; б) дискретным. Если же признак атрибутивный или альтернативный, то, соответственно, строятся атрибутивный или альтернативный ряды распределения.
Графически вариационный ряд изображают в виде полигона и гистограммы. Они дают представление о характере и форме распределения варьирующих признаков в совокупности, при этом в случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения.
Для анализа вариационных рядов используется три группы показателей:
Структурные характеристики ряда распределения. К ним относятся медиана (),мода (), квартили (), децили () и перцентили () распределения.
Медиана – это величина варьирующего признака, которая делит ряд распределения на две равные части, т.е. медиана соответствует варианте, стоящей в середине ряда.
Медиана определяется в зависимости от вида ряда распределения:
где n - объем совокупности.
где нижняя граница модального интервала,
величина модального интервала,
частота (в ряду с равными интервалами) или плотность распределения (в ряду с неравными интервалами) соответственно модального, домодального и послемодального интервалов.
Графически медиана определяется по кумуляте распределения.
Мода - наиболее часто встречающийся признак в совокупности. Определяется:
,
где - нижняя граница модального интервала; - величина модального интервала;- частота модального интервала;- частота интервала, предшествующего модальному;- частота интервала, следующего за модальным.
Графически мода определяется на основе полигона распределения (для дискретного вариационного ряда) или гистограммы распределения (для интервального вариационного ряда)
Значения признака, делящие совокупность на четыре равные части, называются квартилями и обозначаются буквой Q с подписным значком номера квартиля, - ясно, что Q2 совпадает с медианой, т.е. Q2 = = М е. Первый (Q1) и третий (Q3) квартили определяются по следующим формулам:
;,
где хQ1,хQ3- нижняя граница, соответственно, первого и третьего квартильных интервалов; hQ1, hQ3- величина соответствующего первого и третьего квартильных интервалов; fQ1, fQ3 - частота соотвествующих квартильных интервалов;- накопленная частота до первого квартильного интервала;- накопленная частота до третьего квартильного интервала.
Децили – варианты, делящие ряд распределения на десять равных частей. Вычисляются они по той же схеме, что и медиана, и квартили:; и т.д
Значения признака, делящее ряд на сто частей, называются перцентилями, и их расчет выполняется аналогично исчислению децилей и квартилей.
Количественная оценка степени колеблемости признака в совокупности измеряется с помощью показателей вариации. Различают абсолютные и относительные показатели вариации.
Абсолютные показатели вариации:
1. Размах вариации: ,
где , - соответственно, наибольшее и наименьшее значение варьирующего признака.
2. Среднее линейное отклонение:
- простое;
3. Дисперсия:
- простая; - взвешенная.
4. Среднее квадратическое отклонение:
- простое; - взвешенное.
Среднее квадратическое отклонение и среднее линейное отклонение – это обобщающие характеристики размеров вариации признака в совокупности, они выражаются в тех же единицах измерения, что и сам признак.
При сравнительно простых значениях признака используется упрощенный способ расчета дисперсии и среднего квадратического отклонения – метод разности средних: ; .
Относительные показатели вариации:
Виды дисперсий и их взаимосвязь. При проведении группировки изучаемой совокупности по факторному признаку (х) вариацию результативного признака ( у) можно оценить с помощью 3-х видов дисперсии:
Общая дисперсия характеризует вариацию результативного признака под влиянием всех факторов, вызывающих эту вариацию и вычисляется по формуле: или ,
где - средняя по всей совокупности; - частоты, если по у построен вариационный ряд.
Межгрупповая дисперсия отражает вариацию результативного признака под воздействием фактора, положенного в основу группировки: ,
где- средняя результативного признака по каждой i-ой группе;- частота появления признака в i-ой группе;; k -число групп.
Средняя из внутригрупповых дисперсий показывает вариацию результативного признака под воздействием всех факторов, кроме группировочного: ; ,
где - внутригрупповая дисперсия или дисперсия i-ой группе;.
Между видами дисперсий существует взаимосвязь, называемая правилом сложения дисперсий: = + .
Это правило используется в статистике для определения степени тесноты связи между изучаемыми признаками.
Показатели формы
Для сравнительного анализа степени асимметрии нескольких распределений рассчитывается показатель асимметрии (АS):
или
Наиболее
широко (как показатель асимметрии)
применяется отношение
Если > 0,то это указывает на наличие правосторонней асимметрии, а при , - левосторонней. Чем больше абсолютная величина коэффициента, тем больше степень скошенности распределения.
Оценка существенности AS проводится на основе средней квадратической ошибки коэффициента ():.
Если , асимметрия распределения существенна и распределение признака в генеральной совокупности несимметрично. В противном случае асимметрия несущественна, и ее наличие может быть вызвано случайными факторами.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности): ,
где m4 – центральный момент четвертого порядка; m4 = .
Эксцесс у высоковершинных распределений положительный, а у низковершинных – отрицательный. Появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.
Для оценки существенности коэффициента эксцесса используется его средняя квадратическая ошибка ():.
Если , то значение коэффициента эксцесса существенно или статистически значимо.
Статистическая проверка гипотез состоит в выявлении согласованности между эмпирическими и гипотетическими (теоретическими) характеристиками. Это могут быть гипотезы о согласованности величины средней, дисперсии, характера распределения, формы и тесноты связи между переменными. Гипотезы принимают, если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок.
Проверка гипотезы о равенстве средних величин и дисперсий двух совокупностей. Выдвигается нулевая гипотеза | Н0 | о том, что две средние - и - существенно отклоняются друг от друга при условии примерного равенства дисперсий двух сравниваемых совокупностей.
Рассчитывается:или ;
По таблицам t-распределения (приложение 1) находим теоретическое значение критерия (tα) по принятому уровню статистической достоверности (α) и числу степеней свободы: m = n – 2,- если tP > tα , то средние существенно отклоняются друг от друга, т.е. нулевая гипотеза не отвергается.
Дополнительно может быть проверена гипотеза о равенстве дисперсий для этих совокупностей. Для этой цели используется критерий Фишера-Снедекора или F-критерий.
Вводим Н0 : или альтернативную гипотезу Н1:.
F-критерий строится таким образом, чтобы в числителе стояла большая дисперсия, т.е., .
По таблицам F-распределения критические значения критерия или его теоретическое значение () определяют по заданному уровню значимости (α) и числам степеней свободы сравниваемых дисперсий (m1 = n1 – 1; m2 = n2 – 1) (приложение 2).
Если <, то Н0 принимается, а если >, то Н0 отвергается, а принимается альтернативная, т.е. Н1 - гипотеза.
Проверка статистических
гипотез о законах
Для проверки близости теоретического и эмпирического распределений используются критерии согласия, в частности:
где f – эмпирические частоты (или частости);- теоретические частоты (или частости).
Для нормального закона распределения:;; - определяется по специальной таблице.
По таблицам -распределения в зависимости от принятой вероятности (Р) и числа степеней свободы m ( m = k – 3, где k - число групп) находим,и если<, то гипотеза о близости эмпирического распределения к нормальному не отвергается.
где Д – максимальное значение разности между накопленными эмпирическими и теоретическими частотами; n - сумма эмпирических частот.
По таблице вероятностей λ - критерия, определяется вероятность, с которой можно утверждать, случайный или неслучайный характер имеют отклонения фактических частот от теоретических.
Кроме критериев согласия используются также коэффициенты асимметрии и эксцесса. Для нормального закона распределения коэффициенты асимметрии и эксцесса близки к нулю. Распределение можно считать нормальным, если показатели асимметрии и эксцесса не превышают своих двукратных средних квадратических отклоненийи . Для редко встречающихся явлений характерно распределение Пуассона. Его называют “законом малых чисел”. Теоретические частоты распределения Пуассона рассчитываются по формуле: .
Информация о работе Статистические распределения и их основные характеристики