Понятие вариации признака и ее значение

Автор работы: Пользователь скрыл имя, 10 Декабря 2012 в 18:53, курсовая работа

Краткое описание

Цель проекта: Изучить показатели вариации, их сущность и порядок расчёта.
Задачи проекта:
- Разобрать понятие вариации;
- Рассмотреть абсолютные и относительные показатели вариации,
- Изучить правило сложений дисперсии;
- Рассмотреть показатели структуры распределения;

Содержание

Введение………………………………………………………………………..3

Глава 1. Показатели вариации……………………………………………...5
1.1. Понятие «вариация» ………………………………………………………5
1.2. Показатели вариации ……………………………………………………...6
1.3. Правило сложения дисперсий…………………………………………….13
1.4. Показатели структуры распределения…………………………………...15
1.5. Показатели формы распределения……………………………………….17

Глава 2. Расчет статистических показателей в туризме (Вариант № 13)
2.1. Задание №1 ………………………………………………………………..25
2.2. Задание №2 ……………………………………………………………..…35

Заключение……………………………………………………………………38
Список литературы и источников………………………………………....40
Приложения…………………………………

Прикрепленные файлы: 1 файл

Курсовая работа.doc

— 714.50 Кб (Скачать документ)

где Q3 и Q1  - соответственно третий и первый квартили распределения.

Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

В симметричных или умеренно асимметричных распределениях выполняется  равенство  . Так как на квартильное отклонение не влияют отклонения всех значений признака, то его следует применять, когда определение среднего квадратического отклонения затруднено или невозможно. Например, этот показатель может применяться для рядов распределения с открытыми интервалами, где в качестве характеристики центра распределения использовалась медиана.

Дисперсия и среднее  квадратическое отклонение применяются  в следующих случаях:

    • расчетов, связанных с организацией выборочного наблюдения;
    • оценки полученных на основе выборки статистических показате-

лей;

    • построения показателей тесноты корреляционной связи.

В условиях нормального (симметричного) распределения имеется  следующая зависимость между  величиной среднего квадратического  отклонения и количеством наблюдений (правило «трёх сигм»):

    • в пределах располагается 0,683 количества наблюдений;
    • в пределах располагается 0,954 количества наблюдений;
    • в пределах располагается 0,997 количества наблюдений.

Отклонение  можно считать максимально возможным.

Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака (или медиане). К ним относятся:

    • коэффициент осцилляции:

;

    • относительное линейное отклонение:

;

    • относительный показатель квартильной вариации:

;

    • коэффициент вариации:

.

Наиболее часто применяется  коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.

Чем больше величина коэффициента вариации , тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации приведена в следующей таблице:

Коэффициента вариации, %

Степень однородности совокупности

До 30

Однородная

30 - 60

Средняя

60 и более

Неоднородная


 

Следует заметить, что  приведенная шкала оценки однородности совокупности достаточно условна. Дело в том, что вопрос о степени  интенсивности вариации каждого изучаемого признака должен решаться индивидуально, с учетом сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

 

1.3 Правило сложений дисперсий

Изучая дисперсию признака в совокупности и проводя расчеты  с помощью общей средней, нельзя оценить влияние отдельных факторов на колеблемость индивидуальных значений признака.

Это можно сделать  с помощью метода группировок: единицы  изучаемой совокупности подразделяются на однородные группы по признаку-фактору.

В случае разделения совокупности на группы по какому-либо признаку существует возможность оценки влияния этого  признака-фактора на колеблемость индивидуальных значений.

Наряду с изучением вариации признака по совокупности в целом появляется возможность проследить количественные изменения признака:

1)по группам, на  которые разделяется совокупность.

2)между группами.

При этом кроме общей средней  для всей совокупности исчисляются:

    • средние по отдельным группам (групповые или частные средние)
    • три показателя дисперсии:
  1. общая дисперсия ;
  1. межгрупповая дисперсия ;
  2. средняя внутригрупповая дисперсия 

 

 

Общая дисперсия  характеризует вариацию признака во всей совокупности под влиянием всех факторов, ее вызывающих:

,

где - общая средняя арифметическая для всей совокупности.

Межгрупповая дисперсия  (дисперсия групповых средних) характеризует вариацию индивидуальных значений признака под влиянием признака-фактора, лежащего в основе группировки. По сути, межгрупповая дисперсия – это мера колеблемости групповых средних вокруг общей средней :

,

где  - групповая средняя (средняя по отдельной группе);

       - число единиц в отдельной группе;

       .

Средняя внутригрупповая дисперсия характеризует колеблемость признака в среднем внутри групп в результате влияния остальных неучтенных факторов:

,

где - внутригрупповая дисперсия отдельной группы, которая дает оценку колеблемости признака внутри каждой i-й группы.

Средняя внутригрупповая  дисперсия  дает обобщенную характеристку внутригрупповой колеблемости  вокруг групповых средних.

Между указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий: величина общей дисперсии равна сумме межгрупповой и средней внутригрупповой дисперсии:

Это правило  показывает, что общая вариация признака в совокупнсоти складывается из вариации признака внутри отдельных групп и вариации между ними.

1.4 Показатели  структуры распределения

Форма распределения  отражает характер последовательного  изменения частот. Показатели центра распределения не вскрывают характера последовательного изменения частот fi  . Поэтому для отражения особенностей структуры распределения признака в совокупности используют квантили распределения.

Квантили (градиенты) – это значения признака, занимающие определенное место (каждое четвертое, пятое, десятое и т.д.) в упорядоченном вариационном ряду. В результате квантили делят ряд распределения на равные по числу единиц части. Частыми случаями квантилей являются: квартили, децили, квинтили, перцентели.

Квартили (Q1 ,Q2 , Q3) – это значения признака, делящие ранжированный ряд на четыре равные части (рис. 2)

Следовательно, в ряду распределения выделяют три  квартиля:

  • первый квартиль Q1 (нижний) – отделяет ¼ часть совокупности с наименьшими значениями признака;
  • второй квартиль Q2 – делит распределение пополам и совпадает с медианой Ме;
  • третий квартиль Q3 (верхний) – отсекает ¼ часть совокупности с наибольшими значениями признака.

Вычисление  квартилей аналогично вычислению медианы. В дискретном ряду сначала определяют положение или место квартиля:

  ; ; .

Затем по накопленным  частотам определяют численное значение квартилей. В интервальном ряду распределения  сначала указывают интервал, в  котором лежит квартиль, затем  определяют численное значение по формулам:

;

;

,

где  и - нижние границы квартильных интервалов;

        и - накопленные частоты предквартильных интервалов;

        и - частоты квартильных интервалов.

 

 

 

 

Децили (D1, D2, …D9) – это варианты, которые делят ранжированный ряд на 10 равных частей. Вычисляются для интервального ряда в соответствии с указанными обозначениями по след схеме:

;

 и т.д.

В ряду распределения  выделяют девять децилей, т.к. медиана  является одновременно пятым децилем. Децили находят широкое применение в анализе дифференциации различных социально-экономических явлений; вычисляются по той же схеме что и квартили.

Квинтили – это значение признака, делящие ряд на пять равных частей. Определяется по той же схеме, что и квартили и децили.

Перцентили (Р1, Р2,…, Р99) – это значения признака, делящие ряд на 100 равных частей. Схема вычисления перцентилей аналогична рассмотренной схеме для квинтелей. Очевидно что Р25 = Q1; Р50 = Q2 е ;   Р75 = Q3.

1.5 Показатели формы распределения

Выяснение общего характера распределения предполагает оценку степени его однородности, а также оценку формы распределения.

При этом для  обобщающей характеристики особенностей формы распределения применяется кривая распределения, т.е. графическое изображение эмпирического вариационного ряда в виде плавной кривой. Различают эмпирические и теоретические кривые распределения. Эмпирическая кривая распределения – это фактическая кривая распределения, построенная по исходным данным наблюдения. Теоретическая кривая распределения -  это кривая распределения, выражающая общую закономерность данного типа

распределения.

Таким образом, теоретическое распределение является идеализированной моделью эмпирического  распределения. Можно предположить, что данному распределению соответствует  определенная, характерная для него теоретическая кривая, поэтому анализ вариационного ряда сводится к сопоставлению эмпирического и теоретического распределений. При этом, выдвинув гипотезу о некоторой форме распределения, стремятся вписать эмпирический ряд с помощью математической модели, выражающей теоретический закон распределения.

Теоретическое распределение  может получиться при полном погашении  случайных причин в результате увеличения числа наблюдений и уменьшения величины интервала. В статистике существует большое число теоретических распределений, но чаще всего используется симметричное (нормальное) распределение.

Если сравниваются теоретическое нормальное и эмпирическое распределение, то необходимо проверить  соответствие формы распределения с помощью показателей асимметрии и эксцесса. Исследование закономерностей (формы) распределения предполагает решение 3-х задач:

    1. выяснение общего характера распределения;
  1. выравнивание эмпирического распределения – построение на основе эмпирического распределения кривой у = f(x) с заданной формой;
  1. проверка соответствий между полученными теоретическими и эмпирическими распределениями.

Для характеристики формы распределения используются показатели симметричности распределения  частот:

      • коэффициент асимметрии
    • показатель эксцесса Еk, который отражает крутизну (островершинность) распределения.

Расчет значений этих показателей основан на применение моментов распределения.

Моменты распределения.

Для подробного описания особенностей распределения используются  дополнительные характеристики – моменты распределения.

В математической статистике моментом к-го порядка называют среднюю арифметическую к-й степени отклонений отдельных вариантов xi от некоторой постоянной величины А:

,

 

где  к – степень отклонения (порядок момента).

В зависимости  от выбора постоянной величины А различают три вида моментов:

1)  если  А = 0, то моменты называются начальными (Мк);

2)  если  А = , то моменты называются центральными ( );

3)  если  А 0, а равно некоторой произвольной величине , то моменты называются условными (mк).

При анализе  вариационных рядов практически  ограничиваются расчетом моментов первых четырех порядков (приложение 1).

Однако вычисления по данным формулам достаточно громоздки. Поэтому для их упрощения используют закономерности взаимосвязи между  начальными, центральными и условными  моментами:

Информация о работе Понятие вариации признака и ее значение