Автор работы: Пользователь скрыл имя, 07 Апреля 2014 в 11:21, контрольная работа
Слово «статистика» имеет латинское происхождение (от status – состояние). В средние века оно означало политическое состояние государства. В науку этот термин введен в XVIII в. немецким ученым Готфридом Ахенвалем.
В настоящее время термин «статистика» употребляется в трех значениях:
1) под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о самых различных явлениях общественной жизни (в этом смысле «статистика» выступает как синоним словосочетания «статистический учет»);
2) статистикой называют цифровой материал, служащий для характеристики какой-либо области общественных явлений или территориального распределения какого-то показателя;
стр.
Введение
3
1. Сводка и группировка статистической информации
5
Задача № 1
8
2. Абсолютные и относительные статистические величины
12
Задача № 2
15
3. Средние статистические величины
18
Задача № 3
20
4. Понятие и классификация рядов динамики
27
Задача № 4
29
Задача №5
35
5. Индексы
37
Задача № 6
41
Список литературы
В статистике соблюдаются следующие принципы применения средних величин.
1. Необходим обоснованный выбор статистической совокупности, для которой определяется средняя величина.
2. При определении средней величины исходят из качественного содержания статистических величин, учитывая возможную взаимосвязь изучаемых признаков.
3. Средняя величина должна рассчитываться по однородной совокупности, которая позволяет применять метод группировки, предполагающий расчет системы обобщающих показателей.
4. Общая средняя величина должна подкрепляться и поясняться групповыми средними величинами.
Средние величины делятся на два больших класса: степенные и структурные. К последним относятся мода и медиана, но наиболее часто применяются степенные различных видов.
Степенные средние, в зависимости от представления отдельных величин, могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном порядке. Общая формула простой средней величины имеет вид
Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы
При этом обозначено:
Xi – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения
которого зависят следующие
при m = -1 средняя гармоническая;
при m = 0 средняя геометрическая;
при m = 1 средняя арифметическая;
при m = 2 средняя квадратическая;
при m = 3 средняя кубическая и так далее.
Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида. Так, приняв m = 1, находим, что простая средняя арифметическая величина определяется по формуле
Аналогично для взвешенной средней арифметической величины получаем формулу через частоты или через доли
Простая средняя гармоническая величина определяется по формуле
Формула взвешенной средней гармонической величины, имеет следующий вид
Задача №3
Рассчитайте среднюю арифметическую и структурные средние (моду и медиану) вариационных рядов. Проанализируйте степень колеблемости признака с помощью всех показателей вариации. Сделайте выводы об однородности совокупности и типичности средней арифметической.
Используя исходные данные своих вариантов, представьте интервальные вариационные ряды в виде гистограммы, полигона и кумуляты.
Таблица 7
размер вклада, тыс.руб. |
число вкладчиков в филиале Сбербанка России, чел. |
до 500 |
70 |
500-900 |
100 |
900-1300 |
200 |
1300-1700 |
360 |
1700-2100 |
372 |
2100 и более |
250 |
ИТОГО |
1352 |
Для определения средней арифметической воспользуемся формулой
Х=∑xf / ∑f ,
где x – среднее каждого ряда «размер вклада»
f – число вкладчиков
Х=(250*70+700*100+1100*200+
мода высчитывается по формуле:
МО= X мо + i(fmo –f(mo-1))/((fmo –f(mo-1))+ (fmo –f(mo+1))), где
X мо - нижняя граница модального интервала
fmo -частота модального интервала
f(mo-1)- частота интервала, предшествующего модальному
f(mo+1)- частота интервала, следующего за модальным
i - частота интервала
Для определения моды необходимо определить модальный интервал, т.е. интервал наибольшей частотой.
Частота ряда определяется путем деления частоты каждого интервала на их общую сумму:
w i = f i / ∑ f
Интервал До 500 w 1 = 70/1352*100 = 0,052*100=5,2%
Интервал 500-900 w 2 = 100/1352*100 =0,074*100=7,4%
Интервал 900-1300 w 3 = 200/1352*100=0,147*100=14,7%
Интервал 1300-1700 w 4 = 360/1352*100=0,266*100=26,6%
Интервал 1700-2100 w 5 = 372/1352*100 = 0,275*100=27,5%
Интервал 2100 и больше w 6 = 250/1352*100 =0,185*100=18,5%
Модальным является интервал 1700-2100 с наибольшей частотой – 27,5%
Расчеты представлены в таблице 7.
Таблица 7
размер вклада, тыс.руб. |
число вкладчиков в филиале Сбербанка России, чел. |
частота, в долях, w |
частота в% |
накопленная частота |
До 500 |
70 |
0,052 |
5,2 |
70 |
500-900 |
100 |
0,074 |
7,4 |
170 |
900-1300 |
200 |
0,147 |
14,7 |
370 |
1300-1700 |
360 |
0,266 |
26,6 |
730 |
1700-2100 |
372 |
0,275 |
27,5 |
1102 |
2100 и более |
250 |
0,185 |
18,5 |
1352 |
МО =1700+400(27,5-26,6)/((27,5-
Для определения медианы определяется её место в ряду по формуле:
NMe =(n+1)/2
где n – число членов ряда
NMe = (1352+1)/2 = 676,5
Медианным является интервал: 1300-1700
Медиану можно вычислить по формуле:
Ме= X мe + i(NMe –S(Me-1))/ fMe, где
X мe - Нижняя граница медианного интервала;
i - величина интервала;
S(Me-1)- накопленная частота интервала, предшествующего медианному;
fMe - частота медианного интервала.
Ме = 1300+400(676,5-370)/730 = 1467,95 тыс.руб.
Гистограмма и полигон распределения вкладчиков по сумме вклада в Сбербанке России
Схема 1
Кумулята распределения числа вкладчиков по сумме вкладов в Сбербанке России
Схема 2
Колеблемости признака анализируются с помощью показателей вариации.
Размах вариаций R=Xmax-Xmin
R= 2300-250=2050
Для остальных признаков колеблемости необходимо составить вспомогательную таблицу 8.
Таблица 8
Вспомогательная расчетная таблица.
Размер вклада,тыс руб. |
Х Середина интервала, тыс.руб. |
f число вклад-чиков, чел |
X*f, тыс.руб. |
X-X, тыс.руб. |
│X-X│*f, тыс.руб. |
(X-X)2 , тыс.руб. |
(X-X)2 *f, тыс.руб. |
0 - 500 |
250 |
70 |
17500 |
-1324,93 |
92744,82 |
1755428,9 |
122880023 |
500-900 |
700 |
100 |
70000 |
-874,926 |
87492,6 |
765495,5 |
76549550 |
900-1300 |
1100 |
200 |
220000 |
-474,926 |
94985,2 |
225554,7 |
45110940 |
1300-1700 |
1500 |
360 |
540000 |
-74,926 |
26973,36 |
5613,905 |
2021005,8 |
1700-2100 |
1900 |
372 |
706800 |
325,074 |
120927,52 |
105673,1 |
39310393,2 |
2100 -2500 |
2300 |
250 |
575000 |
723,074 |
180768,50 |
522836 |
130709000 |
итого |
1352 |
2129300 |
603892 |
416580912 |
X - среднее арифметическое = 1574.926 тыс. руб.
Среднее линейное отклонение
d = ∑│x-x│*f / ∑f
d = 603892/1352= 446,666 тыс.руб.
Дисперсия
ơ2 = ∑(х-х)2 *f/ ∑f
ơ2 = 416580912/1352= 308121,976 тыс.руб
Среднее квадратическое
ơ =√ ∑(х-х)2 *f/ ∑f
ơ =√ 308121.976= 555,087 тыс.руб.
Квартильное отклонение
dk = (Q3 – Q1)/2,
где Q3 и Q1 -соответветственно третья и первая квартили распределения.
Для определения квартили необходимо определить её положение:
NQ1 = (n+1)/4; NQ3 = ((n+1)/4)*3
NQ1 = (1352+1)/4 = 338,25чел.
NQ3 = (1352+1)/4 * 3 = 1014,75 чел.
Квартиль определяется по формуле
Q = xq + i*(Nq – S(q-1))/ fq, где
xq -нижняя граница интервала, в котором находится квартиль
S(q-1)- накопленная частота интервала, предшествующего тому, в котором находится квартиль
fq - частота интервала, в котором находится квартиль
Q1 = 1+400*(338,25 - 0)/5,2 = 26020,231 тыс.руб.
Q3 = 900+400*(1014,75 -170)/14,7 = 23886,395 тыс.руб.
dk = (Q3 – Q1)/2=( 23886,395 – 26020,231)/2 = -1066,918 тыс.руб.
Коэффициент вариации — это отношение среднего квадратического отклонения к средней арифметической, выраженное в процентах. Он применяется для сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим.
Расчет коэффициента осуществляется по формуле:
V = (ơ / x) * 100
Коэффициент вариации используют не только для сравнительной оценки единиц совокупности, но и также для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
V = (555,087/ 1574,926)*100= 35,0%
Выводы: При коэффициенте вариации 35% совокупность можно считать типичной.
Ряд динамики — это последовательность упорядоченных во времени количественных статистических величин, характеризующих развитие изучаемого явления или процесса. Конкретное значение величины называется уровнем ряда и обозначается Y, а их число в ряду обозначается n. Ряды динамики классифицируются по следующим признакам.
1. По времени — ряды моментные и интервальные (периодные) которые показывают уровень явления на конкретный момент времени или на определенный его период. Сумма уровней интервального ряда дает вполне реальную статистическую величину за несколько периодов времени, например, общий выпуск продукции, общее количество проданных акций и т.п. Уровни моментного ряда, хотя и можно суммировать, но эта сумма реального содержания, как правило, не имеет. Так, если сложить величины запасов на начало каждого месяца квартала, то полученная сумма не означает квартальную величину запасов.
2. По форме представления — ряды абсолютных, относительных и средних величин.
3. По интервалам времени — ряды равномерные и неравномерные (полные и неполные), первые из которых имеют равные интервалы, а у вторых равенство интервалов не соблюдается.
4. По числу смысловых статистических величин — ряды изолированные и комплексные (одномерные и многомерные). Первые представляют собой ряд динамики одной статистической величины (например, индекс инфляции), а вторые — нескольких (например, потребление основных продуктов питания).
Система уровней ряда аналогична системе дискретных статистических величин X. По-прежнему вычисляются абсолютное, относительное изменения, среднее значение, а также соответствующие индексы и темпы изменения по единичным и средним значениям. Используются те же формулы средних величин от простой арифметической до геометрической.
Любое изменение уровней ряда определяется базисным и цепным способами.
Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда, определяясь по формуле
Цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда, определяясь по формуле
По знаку абсолютного изменения делается вывод о характере развития явления: при > 0 — рост, при < 0 — спад, при = 0 — стабильность.
Для проверки правильности расчетов применяется правило, согласно которому сумма цепных абсолютных изменений равняется последнему базисному.
где к = n-1 — количество изменений уровней ряда (r = 1 ...к).
Базисное относительное изменение представляет собой соотношение конкретного и первого уровней ряда, определяясь по формуле
Цепное относительное изменение представляет собой соотношение конкретного и предыдущего уровней ряда, определяясь по формуле
Относительные изменения уровней — это по существу индексы динамики, критериальным значением которых служит 1. Если они больше ее, имеет место рост явления, меньше ее — спад, а при равенстве единице наблюдается стабильность явления.
Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. При положительном темпе изменения имеет место рост явления, при отрицательном — спад, а при нулевом темпе изменения наблюдается стабильность явления.
Для проверки правильности расчетов применяется правило, согласно которому произведение цепных относительных изменений равняется последнему базисному.