Статистический анализ рядов распределения

Автор работы: Пользователь скрыл имя, 13 Апреля 2015 в 21:29, курсовая работа

Краткое описание

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.

Содержание

Введение…………………………………………………………………..….4
1. Табличное и графическое представление вариационного ряда…….....6
2. Характеристика центральной тенденции распределения…………….13
3. Оценка вариации изучаемого признака……….……………………….16
4. Характеристика структуры распределения……………………………18
5.Характеристика формы распределения………………………………...19
Заключение………………………………………………………………....21
Список использованных источников…………………………………..…22

Прикрепленные файлы: 1 файл

А.М. Герасимова з33707_23.вар.2_10.doc

— 591.50 Кб (Скачать документ)

Министерство образования и науки Российской Федерации

 

Федеральное государственное бюджетное образовательное

учреждение высшего профессионального образования

«Санкт-Петербургский государственный политехнический университет Петра Великого»

 

Инженерно-экономический институт

 

Кафедра предпринимательства и коммерции

 

 

КУРСОВАЯ РАБОТА

 

по дисциплине:                «Статистика»

 

тема:                                 «Статистический анализ рядов распределения»

 

Выполнила студентка группы з33707/23

 

_________________А.М. Герасимова

Принял: Доцент, к.э.н.

 

_________________О.А. Пономарева

 

Оценка: __________________

 

«___» ___________ 2015 года

 

 

 

 

 

Санкт-Петербург 
      2015г.

 

Герасимова  А.М... Статистический анализ рядов распределения. Проверка гипотезы о законе распределения: Курсовая работа по дисциплине «Статистика». – СПб.: СПбГПУ, 2015, стр 22. , рис.4 , табл.5 . библ.назв.3

 

 

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, МОДА, МЕДИАНА, ГИСТОГРАММА, КВАРТИЛИ.

 

 

Основной целью написания курсовой работы является освоение методики и приобретение практических навыков статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи: освещено понятие и виды статистических рядов распределения, а также основные формы их представления; рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.

 
СОДЕРЖАНИЕ

 

Введение…………………………………………………………………..….4

1. Табличное и  графическое представление вариационного ряда…….....6

2. Характеристика  центральной тенденции распределения…………….13

3. Оценка вариации  изучаемого признака……….……………………….16

4. Характеристика  структуры распределения……………………………18

5.Характеристика  формы распределения………………………………...19

Заключение………………………………………………………………....21

Список использованных источников…………………………………..…22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

 

ВВЕДЕНИЕ

 

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.

Первичные данные обрабатываются для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в виде удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации, то есть целью изучения рядов распределения является, выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения.

 На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д. Актуальность данной темы обусловлена тем, что статистические ряды распределения являются базисным методом для любого статистического анализа.

В качестве данных для анализа в курсовой работе были использованы данные количества браков на 1000 человек по регионам Российской Федерации за 2010 год. То есть общие коэффициенты брачности в 2010 г по регионам Российской Федерации.

 Исходные данные представлены  в Таблице 1.

 

 

Таблица 1

Общие коэффициенты брачности в регионах России

 

 

 

 

 

1. Графическое и табличное представление вариационного ряда

распределения

 

По средствам программы ППП STATISTICA производим первый шаг в решении задачи статистического анализа – ранжирование исходных данных, определение наличия выбросов. Для этого выбираем в меню Data опцию Sort. Далее в поле Direction выбираем тип сортировки – по возрастанию значений признака (Ascending). Получим значения признака, упорядоченные по возрастанию. Построение ранжированного ряда позволяет увидеть наличие в совокупности выбросов. В данной совокупности выбросами являются значения 3.8, 5.1,5.9; 5.9, 7.1, так как в регионах, которым соответствуют эти значения,  вероятно, на показатель брачности влияют те факторы, которые не влияют на формирование значений признака у основной части единиц совокупности (они не являются единицами основной совокупности). Поэтому при анализе совокупности в дальнейшем исключим эти значения признака.

В итоге изучаемая совокупность будет состоять из 82 значений, результаты представлены в табл. 2

Ряды распределения подразделяют на атрибутивные и вариационные.

Атрибутивные – строятся по описательным признакам в порядке возрастания или убывания наблюденных значений признака. Примером атрибутивных рядов могут служить распределения населения по национальности, по профессиям, по полу;

Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы или графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот.

Вариантом называется числовое значение количественного признака в ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными.

Таблица 2

Общие коэффициенты брачности в регионах России

(ранжированные данные, красным выделены удаленные выбросы)

 

Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. числа, показывающие, как часто встречаются те или иные варианты в вариационном ряду. Сумма всех частот равна общему количеству элементов совокупности и называется объемом совокупности.

Частости – это частоты, выраженные в виде относительных величин (в долях единицы или процентах). Сумма частостей равна единице или 100%.

С помощью программы получаем табличные представления вариационного ряда распределения, построенные с использованием разного числа интервалов k=10, k=5, k=7 Для построения таблиц выбираем следующий путь: Меню Statistics/Basic Statistic Tables.

В появившемся диалоговом окне выбираем пункт Frequency tables. Выбрав переменную, содержащую ранжированный ряд с учетом выбросов, переходим на закладку Advanced. Задаем параметры построения таблицы. Ставим метку в поле No. of exact interval, устанавливаем значение 10, далее после построения 5 и 7. Нажимаем кнопку Summary. Появляется расчетная таблица частот , результаты представлены в табл. 3.1 относительно интервала k=10, далее с использованием  интервала k=5 табл. 3.2 и интервалом  k=7 табл. 3.3

Таблица 3.1

Распределение регионов России по показателю общие коэффициенты брачности 2010 г. с числом интервалов k=10

 

 

Таблица 3.2

Распределение регионов России по показателю общие коэффициенты брачности 2010 г. с числом интервалов k=5

 

Таблица 3.3

Распределение регионов России по показателю общие коэффициенты брачности 2010 г. с числом интервалов k=7

 

В таблицах первая графа (From…to…) содержит интервалы значений признака (общие коэффициенты брачности в 2010 г).

Count –частота (fi), т.е. число  регионов, в которых брачность на 1000 населения находится в пределах соответствующего интервала.

ComulativeCount – накопленная  частота, число регионов, в которых  значение показателя не превышает верхней границы интервала.

Percent – частости (относительные  частоты wi, выражаются в процентах), рассчитываются:

 

wi– доля каждой группы в  общем объеме совокупности.

В таблицах на 3.1 и 3.2 наблюдается многовершинность. Таким образом выбирая окончательный вариант табличного представления вариационного ряда следует выбрать группировку с использованием 7 групп (Таб. 3.3).

Получено мономодальное распределение (т.е. по обе стороны от максимальной частоты наблюдается закономерное убывание частот).

Из таблицы 3.3 мы видим, что в 32 регионах России, что составляет 39,02439%, коэффициент брачности находится в интервале от 15,69167 до 18,20813. В 75 регионах России, что составляет 91,4634%, этот показатель не превышает значения 20,72500. И лишь в 1,21951% регионов России этот показатель выше отметки 23,24167. 

На основе таблицы строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. Графическое представление может быть осуществлено с использованием  как абсолютных, так и относительных частот.

Для изображения вариационных рядов традиционно в отечественной практике используются графики: гистограмма, полигон, кумулята.

Для построения полигона на основе абсолютных частот выделяем столбец Count в таблице частот, щелкаем на нем правой кнопкой мыши. В появившемся меню выбираем Graphs of block data/Line plot: Entire columns. 

 

Рис.1 Полигон распределения регионов России по показателю  общие коэффициенты брачности в 2010 г.

 

Для построения кумуляты по относительным частотам выбираем столбец Cumulative Count в таблице частот  и повторяем процедуру.

 

Рис.2 Кумулята распределения регионов России по значению показателя общие коэффициенты брачности в 2010 г.

Также для графического представления ряда распределения может быть использована гистограмма. Для ее построения воспользуемся кнопкой Histograms на закладке Advanced меню Frequency Tables, которым мы пользовались при построении таблицы.

 

Рис. 3 Гистограмма распределения регионов России по значению показателя общие коэффициенты брачности в 2010 г. с наложенной кривой нормального распределения

 

 

 

2. Характеристика центральной тенденции распределения

 

Статистический анализ вариационных рядов распределения предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.

В качестве показателей тенденции распределения используются: среднее арифметическое значение, мода и медиана. С помощью программы получаем эти показатели (рис. 4).

 

Рис. 4. Основные характеристики распределения регионов России по значению показателя «количество браков на 1000 человек за 2010 г.»

 

 

Необходимо рассчитать показатели центра распределения: среднее арифметическое значение, мода и медиана.

Средняя арифметическая рассчитывается по формуле простой средней: , т.к. простая средняя используется для расчета средней величины по абсолютным не сгруппированным данным.

 В нашем случае  =1362,3/ 82=16,61

Структурные средние  применяются для изучения внутреннего строения рядов распределения значений признака. К структурным средним относятся Мода, Медиана, Квартили.

Мода – наиболее часто встречающееся значение признака в совокупности. Она определяется непосредственно по исходным данным. 
В ППП STATISTICA указывается не значение моды, а ее наличие. 

Для определения моды необходимо сначала определить модальный интервал (тот интервал которому соответствует максимальная частота), а затем рассчитать по формуле:

 – нижняя граница модального  интервала; – величина группировочного интервала; – частота модального интервала; , – частота интервала предшествующего и следующего за модальным соответственно.

Freguency– частота модального значения (значение 5 показывает, что

Mo = 16,91 в совокупности должно встречаться 5 раз)

 

 

 

Медиана – значение признака у единицы, стоящей в центре ранжированного ряда, то есть величина признака, которая делит упорядоченную последовательность его значений на две равные по численности части

, если n – четное, , если n – нечетное.

В нашем случае N=82, четное число. Таким образом:

            Me =  х41+х42 = 16,6 + 16,7 = 16,65

                               2                  2

В среднем в регионах России количество браков на 1000 человек в 2010 году составляло 16,61(17). Значение медианы в этом случае означает, что у 50% единиц совокупности значение признака меньше и у 50% больше медианного. Т. е. в 50% регионов России значение показателя брачности меньше16,65 чел. на 1000 и в 50% регионов России значение этого показателя больше 16,65 чел. на 1000.

 

3. Оценка вариации изучаемого  признака

 

Показатели вариации делятся на: абсолютные и относительные.

К абсолютным показателям относятся, такие как размах вариации, дисперсия и среднее квадратическое отклонение, а к относительным коэффициент вариации.

Размах вариации (R) - мера разброса значений выборки наблюдений или распределения, рассчитываемая как разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

R=Xmax-Xmin,

где Xmax – верхняя граница ряда,

Xmin – нижняя граница ряда.   

R( Range )= 24,5-9,4= 15,1

Размах вариации показывает, насколько максимальное значение признака совокупности превосходит минимальное.

Дисперсия(σ2) –это средний квадрат отклонений значений переменной от среднего арифметического значения. Эта характеристика является мерой рассеяния измеренных величин. Variance определяется:

.

В данном примере

Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей.

Информация о работе Статистический анализ рядов распределения