Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 13:09, курсовая работа
Слово корреляция ввел в употребление в статистику английский биолог и статистик Френсис Гальтон в конце в. Тогда оно писалось как «corelation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь, но не привычной в то время функциональной форме. В науке вообще, а именно в палеонтологии, термин «корреляция» применил ещё раньше, в конце в., знаменитый французский палеонтолог (специалист по ископаемые останками животных и растений прошлых эпох) Жорж Кювель. Он ввел даже «закон корреляции» частей и органов животных.
Корреляционная связь существует там, где взаимосвязанные явления характеризуются только случайными величинами. Наличие корреляционных связей присуще многим общественным явлениям.
Введение……………………………………………………………………..3
1.Теоретическая часть:
1.1.Корреляционно-регрессионный анализ как объект статистического изучения ………………………………………………………………………………..4
1.2.Система статистических показателей, характеризующих корреляционно-регрессионный анализ………………………………………………… …..6
1.3Применение метода корреляционно-регрессионного анализа в
статистике ………………………………………………………………… 9
2. Расчетная часть…………………………………………………………..11
3. Аналитическая часть…………………………………………….………37
Заключение………………………………………………………………….42
Литература…………………………………………………
Значение Vσ = 6,58% не превышает 33%, следовательно, вариация фондовооруженности предприятий незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно ( =382,77млн руб./чел, Мо=369,84млн руб./чел, Ме=380,21млн руб/чел.), что подтверждает вывод об однородности совокупности предприятий.
Мо<Me< - правосторонняя ассиметрия.
Правосторонняя ассиметрия означает, что наиболее часто встречается значение признака, который меньше среднего значения.
Таким образом, найденное среднее значение фондовооруженности является типичной, надежной характеристикой исследуемой совокупности предприятий.
4.Вычисление средней
арифметической по исходным
Для расчета применяется формула средней арифметической простой:
, (8)
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти предприятий, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
Задание 2
По исходным данным табл. 1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
1.Установить наличие и характер корреляционной связи между признаками фондовооруженность труда и производительность труда , используя метод аналитической группировки.
2.Оценить тесноту и силу корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
3. Оценить
статистическую значимость
4. Сделать выводы по результатам выполнения Задания 2.
Выполнение Задания 2
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак Фондовооруженность труда (X), результативным – признак Производительность труда (Y).
1.Установление наличия и характера связи между признаками Фондовооруженность и Производительность труда методом аналитической группировки.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Фондовооруженность труда и результативным признаком Y – Производительность труда .
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 7.
Таблица 7 - Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы |
Группы предприятий по фондовооруженности,тыс.руб./ х |
Число предприятий, fj |
Производительность труда, тыс . руб./ чел | |
всего |
в среднем на одно предприятие, | |||
1 |
2 |
3 |
4 |
5=4:3 |
1 |
330,8 - 352,76 |
3 |
5406 |
1802 |
2 |
352,76 – 374,2 |
10 |
20142,7 |
2014,27 |
3 |
374,72 – 396,68 |
8 |
17367,2 |
2170,9 |
4 |
396,68 – 418,64 |
6 |
14183,9 |
2363,98 |
5 |
418,64 – 440,6 |
3 |
7589,1 |
2529,7 |
Итого |
30 |
64688,9 |
2156,3 |
Вывод. Анализ данных табл. 7 показывает, что с увеличением фондовооруженности от группы к группе систематически возрастает и средняя прибыль по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
2. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
,
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
,
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
Для расчета общей дисперсии применяется вспомогательная таблица 8.
Таблица 8 - Вспомогательная таблица для расчета общей дисперсии
Номер предприятия п/п |
Производительность труда,тыс руб./ чел |
|
| |
1 |
2 |
3 |
4 |
5 |
1 |
2340,6 |
184,3 |
33966,49 |
5478408,36 |
2 |
2125,8 |
-30,5 |
930,25 |
4519025,64 |
3 |
2325,3 |
169 |
28561 |
5407020,09 |
4 |
2012,7 |
-143,6 |
20620,96 |
4050961,29 |
5 |
2194,5 |
38,2 |
1459,24 |
4815830,25 |
6 |
2550,0 |
393,7 |
154999,69 |
6502500 |
7 |
2512,0 |
355,7 |
126522,49 |
6310144 |
8 |
2250,0 |
93,7 |
8779,69 |
5062500 |
9 |
2069,9 |
-86,4 |
7464,96 |
4284486,01 |
10 |
2382,1 |
225,8 |
50985,64 |
5674400,41 |
11 |
2038,0 |
-118,3 |
13994,89 |
4153444 |
12 |
1797,4 |
-359,3 |
129096,49 |
3230646,76 |
13 |
2329,1 |
172,8 |
29859,84 |
5424706,81 |
14 |
2390,0 |
233,7 |
54615,69 |
5712100 |
15 |
1909,1 |
-247,2 |
61107,84 |
3644662,81 |
16 |
1750,0 |
-406,3 |
165079,69 |
3062500 |
17 |
1929,6 |
-226,7 |
51392,89 |
3723356,16 |
18 |
2012,3 |
-144 |
20736 |
4049351,29 |
19 |
2527,1 |
370,8 |
137492,64 |
6386234,41 |
20 |
2416,8 |
260,5 |
67860,25 |
5840922,24 |
21 |
2229,3 |
73 |
5329 |
4969778,49 |
22 |
2153,6 |
-2,7 |
7,29 |
4637992,96 |
23 |
1969,3 |
-187 |
34969 |
3878142,49 |
24 |
2225,4 |
69,1 |
4774,81 |
4952405,16 |
25 |
1858,6 |
-297,7 |
88625,29 |
3454393,96 |
26 |
1991,0 |
-165,3 |
27324,09 |
3964081 |
27 |
1940,2 |
-216,1 |
46699,21 |
3764376,04 |
28 |
2255,5 |
99,2 |
9840,64 |
5087280,25 |
29 |
2129,3 |
-27 |
729 |
4533918,49 |
30 |
2074,5 |
-81,8 |
6691,24 |
4303550,25 |
Итого |
64689 |
29,6 |
1390516,2 |
140879119,5 |
Расчет общей дисперсии по формуле (10):
Общая дисперсия характеризует вариацию результативного признака – производительности труда, которая возникает под влиянием всех возможных факторов: и факторного признака – фондовооруженности, по которому построена группировка, и других, не учтенных при построении группировки признаков.
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
Для расчета межгрупповой дисперсии строится вспомогательная таблица 9 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 9 - Вспомогательная
таблица для расчета
Группы предприятий по фондовооруженности, тыс. руб./чел,х |
Число банков,
|
Среднее значение в группе |
|
|
1 |
2 |
3 |
4 |
5 |
330,8 - 352,76 |
3 |
1802 |
-354,3 |
376585,47 |
352,76 – 374,2 |
10 |
2014,27 |
-142,03 |
201725,209 |
374,72 – 396,68 |
8 |
2170,9 |
14,6 |
1705,28 |
396,68 – 418,64 |
6 |
2363,98 |
207,68 |
258785,89 |
418,64 – 440,6 |
3 |
2529,7 |
373,4 |
418282,68 |
Итого |
30 |
1257084,53 |
Расчет межгрупповой дисперсии по формуле (11):
Межгрупповая дисперсия характеризует вариацию результативного признака – производительности труда, которая возникает только под влиянием факторного признака – фондовооруженности труда.
Расчет эмпирического коэффициента детерминации по формуле (9):
или 90,4%
Вывод: 90,4% вариации производительности труда обусловлено вариацией объема фондовооруженности труда, а 9,6% – влиянием прочих неучтенных факторов
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 10):
Таблица 10 - Шкала Чэддока
h |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале
Чэддока связь между
3. Оценка статистической
значимости коэффициента
Показатели и рассчитаны для выборочной совокупности, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
Величина рассчитывается, исходя из правила сложения дисперсий:
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследования обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).