Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 13:09, курсовая работа
Слово корреляция ввел в употребление в статистику английский биолог и статистик Френсис Гальтон в конце в. Тогда оно писалось как «corelation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь, но не привычной в то время функциональной форме. В науке вообще, а именно в палеонтологии, термин «корреляция» применил ещё раньше, в конце в., знаменитый французский палеонтолог (специалист по ископаемые останками животных и растений прошлых эпох) Жорж Кювель. Он ввел даже «закон корреляции» частей и органов животных.
Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. Наличие корреляционных связей присуще многим общественным явлениям.
Введение……………………………………………………………………..3
1.Теоретическая часть:
1.1.Корреляционно-регрессионный анализ как объект статистического изучения ………………………………………………………………………………..4
1.2.Система статистических показателей, характеризующих корреляционно-регрессионный анализ………………………………………………… …..6
1.3Применение метода корреляционно-регрессионного анализа в
статистике ………………………………………………………………… 9
2. Расчетная часть…………………………………………………………..11
3. Аналитическая часть…………………………………………….………37
Заключение………………………………………………………………….42
Литература…………………………………………………
Правильное применение и интерпретация результатов корреляционно-регрессионного анализа возможны лишь при понимании всех специфических черт, достоинств и ограничений метода.
Необходимо сказать и о других задачах применения корреляционно-регрессионного метода, имеющих не формально математический, а содержательный характер.
1. Задача выделения важнейших факторов, влияющих на результативный признак (т.е. на вариацию его значений в совокупности). Эта задача решается в основном на базе мер тесноты связи факторов с результативным признаком.
2. Задача оценки хозяйственной деятельности по эффективности использования имеющихся факторов производства.
3. Задача
прогнозирования возможных
4. Задача
подготовки данных, необходимых
в качестве исходных для
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов. В этом отношении корреляционные методы глубоко противоречивы. С одной стороны, их идеал – измерение чистого влияния каждого фактора. С другой стороны, такое измерение возможно при отсутствии связи между факторами и случайной вариации признаков. А тогда связь является функциональной, и корреляционные методы анализа излишни. В реальных системах связь всегда имеет статистический характер, и тогда идеал методов корреляции становится недостижимым. Но это не значит, что эти методы не нужны.
Данное противоречие означает простоту недостижимость абсолютной истины в познании реальны связей. Приближенный характер любых результатов корреляционно-регрессионного анализа не является поводом для отрицания их полезности. Всякая научная истина – относительна. Забывать об этом и абсолютизировать параметры регрессионных уравнений, меры корреляции было бы ошибкой, так же как и отказаться от использования этих мер.
2. Расчетная часть
Имеются следующие выборочные данные за отчётный период по предприятиям одной из финансово-промышленных групп (выборка 10%-ная, механическая):
Таблица 1 – Исходные данные
№ предприятия |
Фондовоору-жённость труда, тыс. руб./чел. |
Производитель-ность труда, тыс. руб./чел. |
№ предприятия |
Фондовоору-жённость труда, тыс.руб./чел. |
Производитель-ность труда, тыс. руб./чел. |
1 |
404,1 |
2340,6 |
16 |
330,8 |
1750,0 |
2 |
368,1 |
2125,8 |
17 |
390,6 |
1929,6 |
3 |
398,4 |
2325,3 |
18 |
360,6 |
2012,3 |
4 |
361,2 |
2012,7 |
19 |
426,4 |
2527,1 |
5 |
379,0 |
2194,5 |
20 |
416,1 |
2416,8 |
6 |
440,6 |
2550,0 |
21 |
387,8 |
2229,3 |
7 |
423,4 |
2512,0 |
22 |
377,2 |
2153,6 |
8 |
388,5 |
2250,0 |
23 |
358,4 |
1969,3 |
9 |
366,8 |
2069,9 |
24 |
380,4 |
2225,4 |
10 |
405,8 |
2382,1 |
25 |
347,2 |
1858,6 |
11 |
362,5 |
2038,0 |
26 |
358,9 |
1991,0 |
12 |
344,8 |
1797,4 |
27 |
355,2 |
1940,2 |
13 |
401,5 |
2329,1 |
28 |
392,5 |
2255,5 |
14 |
414,1 |
2390,0 |
29 |
375,4 |
2129,3 |
15 |
352,8 |
1909,1 |
30 |
367,3 |
2074,5 |
Задание 1
По исходным данным:
1.Постройте статистический ряд распределения организаций по признаку фондовооруженность труда , образовав пять групп с равными интервалами.
2.Графическим методом и путём расчётов определите значения моды и медианы полученного ряда распределения.
3.Рассчитайте характеристики интервального ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
Сделайте выводы по результатам выполнения пунктов 1, 2, 3 задания.
4.Вычислите среднюю арифметическую по исходным данным, сравните её с аналогичным показателем, рассчитанным в п.3 для интервального ряда распределения. Объясните причину их расхождения.
Решение:
1.Построение интервального ряда распределения предприятий по признаку фондовооруженность труда.
Для построения интервального вариационного ряда, характеризующего распределение банков по объему кредитных вложений, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h определяется по формуле
,
при заданных k = 5, xmax = 440,6 тыс руб/чел. , xmin =380,8 тыс руб/чел.
При h = 21,96 тыс руб/чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):
Таблица 2 – Определение границы интервалов рядов распределения.
Номер группы |
Нижняя граница, млн руб. |
Верхняя граница, млн руб. |
1 |
330,8 |
352,76 |
2 |
353,76 |
374,72 |
3 |
374,72 |
396.68 |
4 |
396,68 |
418,64 |
5 |
418,64 |
440,6 |
Процесс группировки единиц совокупности по признаку Объем кредитных вложений представлен во вспомогательной (разработочной) таблице 3
Группы предприятий по фондовооруженности труда тыс.руб/чел |
Номер предприятия |
Фондовооруженность труда тыс.руб/чел |
Производительность труда тыс.руб/чел |
1 |
2 |
3 |
4 |
330,8 – 352,76 |
16 |
330,8 |
1750,0 |
12 |
344,8 |
1797,4 | |
25 |
347,2 |
1858,6 | |
Всего |
3 |
1022,8 |
5406 |
352,76 – 374,72 |
15 |
352.8 |
1909.1 |
27 |
355,2 |
1940,2 | |
23 |
358,4 |
1969,3 | |
26 |
358,9 |
1991,0 | |
18 |
360,6 |
2012,3 | |
4 |
361,2 |
2012,7 | |
11 |
362.5 |
2038,0 | |
9 |
366,8 |
2069,9 | |
30 |
367,3 |
2074,5 | |
2 |
368,1 |
2125.8 | |
Всего |
10 |
3611,8 |
20142,7 |
374,72-396,68 |
29 |
375,4 |
2129.3 |
22 |
377,2 |
2153,6 | |
5 |
379,0 |
2194,5 | |
24 |
380,4 |
2225,4 | |
21 |
387,8 |
2229,3 | |
8 |
388,5 |
2250,0 | |
17 |
390,6 |
1929,6 | |
28 |
392,5 |
2255,5 | |
Всего |
8 |
3071,4 |
17367,2 |
396,68- 418,64 |
3 |
398,4 |
2325,3 |
13 |
401,5 |
2329.1 | |
1 |
404,1 |
2340,6 | |
10 |
405,8 |
2382,1 | |
14 |
414.1 |
2390,0 | |
20 |
416,1 |
2416.8 | |
Всего |
6 |
2440 |
14183,9 |
418,64-440,6 |
7 |
423,4 |
2512,0 |
19 |
426,4 |
2527,1 | |
6 |
440,6 |
2550,0 | |
Всего |
3 |
1290,4 |
7589,1 |
Итого |
30 |
11436,4 |
29362,1 |
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая табл. 4, представляющая интервальный ряд распределения банков по объему кредитных вложений.
Таблица 4 - Распределение предприятий по фондовооруженности труда.
Номер группы |
Группы предприятий по фондовооруженности труда тыс.руб/чел х |
Число предприятий f |
1 |
330,8 - 352,76 |
3 |
2 |
352,76 – 374,2 |
10 |
3 |
374,72 – 396,68 |
8 |
4 |
396,68 – 418,64 |
6 |
5 |
418,64 – 440,6 |
3 |
Итого |
30 |
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .
Таблица 5 - Структура предприятий по фондовооруженности труда
№ группы |
Группы предприятий по фондовооруженности труда тыс.руб/чел |
Число предприятий, fj |
Накопленная частота, Sj |
Накопленная частоcть, % | |
в абсолютном выражении |
в % к итогу | ||||
1 |
2 |
3 |
4 |
5 |
6 |
1 |
330,8 - 352,76 |
3 |
10,0 |
3 |
10,0 |
2 |
352,76 – 374,2 |
10 |
33,0 |
13 |
43,0 |
3 |
374,72 – 396,68 |
8 |
27,0 |
21 |
70,0 |
4 |
396,68 – 418,64 |
6 |
20,0 |
27 |
90,0 |
5 |
418,64 – 440,6 |
3 |
10,0 |
30 |
100,0 |
Итого |
30 |
100,0 |
Вывод. Анализ интервального
ряда распределения изучаемой
2. Нахождение моды
и медианы полученного
Рисунок 1 - Определение моды графическим методом
Конкретное значение моды для интервального ряда рассчитывается по формуле:
где хМo – нижняя граница модального интервала,
h –величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным
Вывод: Для рассматриваемой
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5)
Рисунок 2 - Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Вывод: В рассматриваемой совокупности предприятий половина имеет фондовооруженность не более 380,21 млн руб./чел, а другая половина – не менее 380,21 млн руб./чел.
3. Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 5 строится вспомогательная табл. 6 ( – середина j-го интервала).
Таблица 6 - Расчетная таблица для нахождения характеристик ряда распределения
Группы предприятий по фондовооруженности, млн руб./чел |
Середина интервала, |
Число предприятий, fj |
||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
330,8-352,76 |
341,78 |
3 |
1025,34 |
-40,99 |
1680,18 |
5040,54 |
352,76 – 374,2 |
363,74 |
10 |
3637,4 |
-19,03 |
362,14 |
3621,4 |
374,72– 396,68 |
385,7 |
8 |
3085,6 |
2,93 |
8,58 |
68,64 |
396,68– 418,64 |
407,66 |
6 |
2445,96 |
24,89 |
619,51 |
3717,06 |
418,64 – 440,6 |
429,62 |
3 |
1288,86 |
46,85 |
2194,92 |
6584,76 |
Итого |
30 |
11483,16 |
19032,4 |
Расчет средней арифметической взвешенной:
(5)
Расчет дисперсии:
(6)
Расчет среднего квадратического отклонения:
Расчет коэффициента вариации:
Вывод. Анализ полученных значений показателей и σ говорит о том, что средняя фондовооруженность составляет 382,77 тыс руб./чел, отклонение от среднего объема в ту или иную сторону составляет в среднем 25,19 млн руб./чел (или 6,58%), наиболее характерные значения объема кредитных вложений находятся в пределах от 357,59 млн руб/чел. до 407,95 млн руб/чел. (диапазон ).