Автор работы: Пользователь скрыл имя, 09 Сентября 2013 в 21:45, контрольная работа
Пользуясь базой данных официального сайта www.gks.ru, сформировать массив значений признака Y согласно выбранному варианту ПО ВСЕМ СУБЪЕКТАМ РФ за последний год (т.е. самые свежие из опубликованных данных), оценить однородность совокупности с помощью коэффициента вариации и сделать проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.
При расчете среднего значения и проверке совокупности на однородность следует учитывать, что в работе используются относительные показатели, отсюда вытекает необходимость взвешивания исходных значений при расчете средней и показателей вариации.
Министерство образования и науки РФ
Федеральное
государственное бюджетное
Государственный университет управления
Институт управления финансами и налогового администрирования
Кафедра статистики
Домашнее задание по дисциплине «Статистика»
Вариант № 4
Средний возраст населения, занятого в экономике (Рег Р-4)
Выполнил: Сроки сдачи:
плановый: 8.05.2013
фактический: 8.05.2013
Проверил:
Москва – 2013
Задание 1
Пользуясь базой данных официального сайта www.gks.ru, сформировать массив значений признака Y согласно выбранному варианту ПО ВСЕМ СУБЪЕКТАМ РФ за последний год (т.е. самые свежие из опубликованных данных), оценить однородность совокупности с помощью коэффициента вариации и сделать проверку на нормальность распределения с помощью правила «трёх сигм». В случае наличия резко выделяющихся значений, исключить эти субъекты из массива для проведения более объективного дальнейшего исследования.
При
расчете среднего значения и проверке
совокупности на однородность следует
учитывать, что в работе используются
относительные показатели, отсюда вытекает
необходимость взвешивания
Выполнения задания.
Средний возраст по совокупности будет равен среднему возрасту по России в целом, т.е. равен 40 лет. Найдем дисперсию
Таблица 1
Расчет дисперсии по признаку средний возраст населения занятого в экономике
Субъекты РФ |
X, лет |
(x-), лет |
f, тыс. чел. |
(x-)2f |
1 |
2 |
3 |
4 |
5 |
Белгородская область |
39,4 |
-0,6 |
771 |
278 |
Брянская область |
39,7 |
-0,3 |
652 |
59 |
Владимирская область |
40,1 |
0,1 |
769 |
8 |
Воронежская область |
40,2 |
0,2 |
1133 |
45 |
Ивановская область |
39,6 |
-0,4 |
562 |
90 |
Калужская область |
41,3 |
1,3 |
549 |
928 |
Костромская область |
40,2 |
0,2 |
365 |
15 |
Курская область |
40,4 |
0,4 |
582 |
93 |
Липецкая область |
40,4 |
0,4 |
600 |
96 |
Московская область |
41,4 |
1,4 |
3816 |
7479 |
Орловская область |
40,2 |
0,2 |
407 |
16 |
Рязанская область |
40,6 |
0,6 |
570 |
205 |
Смоленская область |
40,8 |
0,8 |
534 |
342 |
Тамбовская область |
40,7 |
0,7 |
540 |
265 |
Тверская область |
40,5 |
0,5 |
719 |
180 |
Тульская область |
40,6 |
0,6 |
798 |
287 |
Ярославская область |
40,2 |
0,2 |
706 |
28 |
г. Москва |
41,2 |
1,2 |
6198 |
8925 |
Республика Карелия |
39 |
-1 |
366 |
366 |
Республика Коми |
39 |
-1 |
531 |
531 |
Архангельская область |
38,9 |
-1,1 |
680 |
823 |
Вологодская область |
39,6 |
-0,4 |
652 |
104 |
Продолжение таблицы 1
1 |
2 |
3 |
4 |
5 |
Калининградская область |
40,6 |
0,6 |
531 |
191 |
Ленинградская область |
40,7 |
0,7 |
921 |
451 |
Мурманская область |
39,4 |
-0,6 |
500 |
180 |
Новгородская область |
40,5 |
0,5 |
344 |
86 |
Псковская область |
40,4 |
0,4 |
366 |
59 |
г. Санкт-Петербург |
41,1 |
1,1 |
2677 |
3239 |
Республика Адыгея |
39,3 |
-0,7 |
210 |
103 |
Республика Калмыкия |
39,7 |
-0,3 |
144 |
13 |
Краснодарский край |
39,9 |
-0,1 |
2575 |
26 |
Астраханская область |
39,4 |
-0,6 |
535 |
193 |
Волгоградская область |
39,8 |
-0,2 |
1335 |
53 |
Ростовская область |
39,8 |
-0,2 |
2175 |
87 |
Республика Дагестан |
37,5 |
-2,5 |
1307 |
8169 |
Республика Ингушетия |
41,4 |
1,4 |
248 |
486 |
Чеченская Республика |
40,2 |
0,2 |
543 |
22 |
Кабардино-Балкарская Республика |
39,8 |
-0,2 |
396 |
16 |
Карачаево-Черкесская Республика |
41,8 |
1,8 |
209 |
677 |
Республика Северная Осетия - Алания |
37 |
-3 |
354 |
3186 |
Ставропольский край |
39,5 |
-0,5 |
1373 |
343 |
Республика Башкортостан |
39,2 |
-0,8 |
2083 |
1333 |
Республика Марий Эл |
39,6 |
-0,4 |
374 |
60 |
Республика Мордовия |
40,1 |
0,1 |
461 |
5 |
Республика Татарстан |
39,3 |
-0,7 |
2042 |
1001 |
Удмуртская Республика |
39,1 |
-0,9 |
845 |
684 |
Чувашская Республика |
39,1 |
-0,9 |
684 |
554 |
Пермский край |
39,9 |
-0,1 |
1438 |
14 |
Кировская область |
39,3 |
-0,7 |
744 |
365 |
Нижегородская область |
39,8 |
-0,2 |
1806 |
72 |
Оренбургская область |
39,3 |
-0,7 |
1107 |
542 |
Пензенская область |
40,6 |
0,6 |
689 |
248 |
Самарская область |
40,7 |
0,7 |
1737 |
851 |
Саратовская область |
40 |
0 |
1357 |
0 |
Ульяновская область |
39,9 |
-0,1 |
701 |
7 |
Курганская область |
40,4 |
0,4 |
466 |
75 |
Свердловская область |
39,2 |
-0,8 |
2384 |
1526 |
Тюменская область |
39,2 |
-0,8 |
1935 |
1238 |
Челябинская область |
40 |
0 |
1918 |
0 |
Республика Алтай |
38,5 |
-1,5 |
102 |
230 |
Республика Бурятия |
38,4 |
-1,6 |
460 |
1178 |
Республика Тыва |
37,8 |
-2,2 |
139 |
673 |
Республика Хакасия |
39,7 |
-0,3 |
276 |
25 |
Алтайский край |
40 |
0 |
1276 |
0 |
Забайкальский край |
39,2 |
-0,8 |
541 |
346 |
Красноярский край |
39,5 |
-0,5 |
1557 |
389 |
Иркутская область |
39 |
-1 |
1313 |
1313 |
Кемеровская область |
39,6 |
-0,4 |
1463 |
234 |
Новосибирская область |
40 |
0 |
1440 |
0 |
Омская область |
39,5 |
-0,5 |
1093 |
273 |
Томская область |
38,3 |
-1,7 |
527 |
1523 |
Республика Саха (Якутия) |
39,6 |
-0,4 |
488 |
78 |
Камчатский край |
40,3 |
0,3 |
204 |
18 |
Приморский край |
40,3 |
0,3 |
1077 |
97 |
Хабаровский край |
40,1 |
0,1 |
785 |
8 |
Амурская область |
39,5 |
-0,5 |
471 |
118 |
Магаданская область |
40,8 |
0,8 |
103 |
66 |
Сахалинская область |
40,8 |
0,8 |
294 |
188 |
Еврейская автономная область |
39,4 |
-0,6 |
94 |
34 |
Чукотский автономный округ |
40,7 |
0,7 |
31 |
15 |
ВСЕГО |
75748 |
54123 |
Получаем, что дисперсия равна:
Тогда стандартное отклонение будет равно:
Коэффициент вариации:
Значит, совокупность является однородной. Сделаем проверку на нормальность распределения с помощью правила «трёх сигм».
Максимальное значение равно: 41,8 лет, а минимальное значение равно 37 лет
Размах составит: R=41,8-37=4,8 лет
Найдем показатель отношения размаха к стандартному отклонению:
Значит, вся совокупность укладывается в три сигмы.
Таким образом, можно сделать вывод, что полученная совокупность регионов по признаку общий коэффициент рождаемости является однородной, а значит пригодной для дальнейшего анализ
Задание 2
По оставшимся данным произвести группировку субъектов РФ, образовав группы с равными интервалами.
На начальном этапе
Формируя группы, нужно помнить , что распределение единиц совокупности внутри групп должно быть как можно более равномерным (в каждую группу должно входить не менее 3-х значений), кроме того, распределение должно иметь только один модальный интервал (имеющий максимальную частоту).
Для соответствия этим критериям, фактическая
величина интервала и число групп
могут иногда отличаться от расчётных
значений. Для удобства восприятия
и анализа группировки
Выполнение задания
Число групп приближенно определяется по формуле Стэрджесса
n = 1 + 3,2log N = 1 + 3,2log(80) = 8
Ширина интервала составит:
Определим границы группы.
Таблица 2
Расчет интервалов группировки
Номер |
Нижняя граница |
Верхняя граница |
1 |
37 |
37.6 |
2 |
37.6 |
38.2 |
3 |
38.2 |
38.8 |
4 |
38.8 |
39.4 |
5 |
39.4 |
40 |
6 |
40 |
40.6 |
7 |
40.6 |
41.2 |
8 |
41.2 |
41.8 |
Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал.
В итоге получаем следующую группировку
Таблица 3
Равно интервальная группировка регионов РФ
Интервал |
Количество, fi |
37 - 37.6 |
2 |
37.6 - 38.2 |
1 |
38.2 - 38.8 |
3 |
38.8 - 39.4 |
18 |
39.4 - 40 |
23 |
40 - 40.6 |
20 |
40.6 - 41.2 |
9 |
41.2 - 41.8 |
4 |
Всего |
80 |
Полученное распределение однородное и равномерное. Значит, полученный ряд можно использовать для дальнейшего анализа
Задание 3
Проанализировать полученный в п.2 ряд распределения значений признака Y. Для этого построить таблицу, содержащую интервальные группы, число субъектов в каждой группе и частоты групп (f), по сгруппированным данным рассчитать статистические показатели, характеризующие
форму распределения.
Дополнить расчеты
Выполнение задания
Построим расчетную таблицу:
Таблица 4
Расчет характеристик
Интервал |
xi, лет |
fi, тыс. чел. |
xi * fi |
Накопленная частота, S |
|x - xср| * f |
(x - xср)2 * f |
(x - xср)3 * f |
(x - xср)4 * f |
37 - 37.6 |
37.3 |
2 |
74.6 |
2 |
5.03 |
12.63 |
-31.72 |
79.7 |
37.6 - 38.2 |
37.9 |
1 |
37.9 |
3 |
1.91 |
3.66 |
-7 |
13.38 |
38.2 - 38.8 |
38.5 |
3 |
115.5 |
6 |
3.94 |
5.17 |
-6.78 |
8.9 |
38.8 - 39.4 |
39.1 |
18 |
703.8 |
24 |
12.82 |
9.14 |
-6.51 |
4.64 |
39.4 - 40 |
39.7 |
23 |
913.1 |
47 |
2.59 |
0.29 |
-0.0327 |
0.00368 |
40 - 40.6 |
40.3 |
20 |
806 |
67 |
9.75 |
4.75 |
2.32 |
1.13 |
40.6 - 41.2 |
40.9 |
9 |
368.1 |
76 |
9.79 |
10.64 |
11.58 |
12.59 |
41.2 - 41.8 |
41.5 |
4 |
166 |
80 |
6.75 |
11.39 |
19.22 |
32.44 |
|
|
80 |
3185 |
|
52.57 |
57.67 |
-18.93 |
152.78 |
Показатели центра распределения.
Средняя взвешенная
лет
Т.е. в среднем в каждом регионе средний возраст занятого в экономике населения составляет 39,81
Мода
Выбираем в качестве начала интервала 39.4, так как именно на этот интервал приходится наибольшее количество.
лет
Наиболее часто встречающееся значение ряда – 39.78
Медиана
Медианным является интервал 39.4, т.к. в этом интервале накопленная частота S, больше медианного номера.
лет
Таким образом, 50% регионов по среднему возрасту занятого в экономике населения будут меньше 39,82
Показатели вариации.
Абсолютные показатели вариации.
R = Xmax - Xmin = 41.8 - 37 = 4,8 лет
Среднее линейное отклонение -
= лет
Каждый регион в среднем отличается от среднего возраста занятого в экономике населения не более, чем на 0,6 лет
Дисперсия
Среднее квадратическое отклонение
Относительные показатели вариации.
Коэффициент вариации
Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
Линейный коэффициент вариации
Коэффициент осцилляции
Показатели формы распределения
Степень асимметрии
As = M3/s3
где M3 - центральный момент третьего порядка.
s - среднеквадратическое
M3 = -18.93/80 = -0.24
Отрицательная величина указывает на наличие левосторонняя асимметрии
Эксцесс
M4 = 152.78/80 = 1.91
Ex < 0 - плосковершинное распределение
Гистограмма распределения:
Рис. 1. Распределение регионов по признаку средний возраст занятого в экономике населения
Таким образом, получив числовые характеристики
можно сделать следующие
- средний возраст занятого в экономике по стране составляет 39,81 лет, при этом 50% регионов имеют средний возраст занятого в экономике ниже 39,82 лет, а остальные больше. Наибольшее количество регионов имеет средний возраст занятого в экономике населения равный 39,78 лет.
- значение показателя вариации равно 2,13%, что говорит о достаточно умеренной вариации признака в исследуемой совокупности
- значения эксцесса и
Задание 4
В соответствии с географическим распределением субъектов РФ по укрупненным федеральным округам (Центральный, Северо-Западный, Приволжский и т. д.,) сравнить средние значения признака Y в отдельных федеральных округах со средним значением по РФ в целом. А также сравнить федеральные округа друг с другом по степени однородности значений исследуемого признака. Построить таблицу, привести необходимые расчеты . Сформулировать выводы о различиях в социально-экономическом положении регионов России по исследуемому признаку Y.
Информация о работе Средний возраст населения, занятого в экономике