Корреляционная связь

Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 13:01, реферат

Краткое описание

Корреляционная связь - это зависимость, при которой значение одной переменной величины y формируется под влиянием значения другой переменной величины x.

Прикрепленные файлы: 1 файл

11. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ.doc

— 365.00 Кб (Скачать документ)

Как видно из столбца 6 совпадение знаков наблюдается  в 10 случаях и только два раз знаки не совпали.

Отсюда коэффициент Фехнера будет равен:

 

Полученная величина коэффициента Фехнера свидетельствует о том, что можно предположить наличие прямой зависимости между исследуемыми признаками.

Между тем, величина этого коэффициента, как видно из расчёта, не зависит от величины отклонений факторного и результативного признака от соответствующей величины. Поэтому нельзя говорить о степени тесноты корреляционной связи, а тем более об оценке её существенности на основании этого показателя.

 

Линейный коэффициент корреляции

Более совершенным показателем тесноты связи является линейный коэффициент корреляции, который был предложен английским математиком  Пирсоном.

При расчёте этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сама величина этих отклонений, как для факторного, так  и результативного признаков величины - и .

Однако непосредственно сопоставлять между собой полученные абсолютные величины нельзя, так как сами признаки могут быть выражены в разных единицах измерения, а при наличии одних и тех же единиц измерения средние могут быть различны по величине. По этой причине целесообразно сравнивать отклонения, выраженные в относительных величинах, то есть долях стандартного отклонения – нормированными отклонениями. Тогда для факторного признака будет иметь место совокупность величин , а для результативного - .

Полученные нормированные отклонения можно сравнивать между собой. Для того, чтобы на основе сопоставления рассчитанных нормированных отклонений получить обобщающую характеристику степени тесноты связи между признаками для всей совокупности, рассчитывают среднее произведение нормированных отклонений. Полученная таким образом средняя и будет являться линейным коэффициентом корреляции

                                                                            

 


где                                – линейный коэффициент корреляции;

                                        n  - число единиц в совокупности.

Вычисление коэффициента корреляции по приведённой формуле является достаточно трудоёмкой операцией. Выполнив ряд преобразований, можно получить следующую формулу для расчёта линейного коэффициента корреляции:

 

  

 


где                                n – число единиц в совокупности.

Коэффициент парной корреляции обладает следующими основными свойствами:

- симметричности, т.е. его значение не изменяется, если x и y поменять местами;

- безразмерности величины, т.е. он не изменяется при изменении единиц измерения признаков x и y.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе значение коэффициента корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи – прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.

Если с увеличением значений факторного признака x, результативный признак y имеет тенденцию к увеличению, то величина коэффициента корреляции будет находиться между 0 и 1.

Если же с увеличением значений факторного признака x, результативный признак y имеет тенденцию к снижению, то величина коэффициента корреляции будет находиться между 0 и -1.

 

ПРИМЕР

По нижеприведённым данным рассчитать линейный коэффициент корреляции.

 

Номер фирмы

Затраты фирмы на рекламу

Объём отгрузки

x2

y2

xi*yi

1

2

3

4

5

6

1

1,90

44,00

3,61

1 936,00

83,60

2

1,90

42,50

3,61

1 806,25

80,75

3

2,00

44,50

4,00

1 980,25

89,00

4

2,20

45,50

4,84

2 070,25

100,10

5

2,20

44,00

4,84

1 936,00

96,80

6

2,20

44,00

4,84

1 936,00

96,80

7

2,40

46,00

5,76

2 116,00

110,40

8

2,50

47,00

6,25

2 209,00

117,50

9

2,50

45,50

6,25

2 070,25

113,75

10

2,60

44,00

6,76

1 936,00

114,40

11

2,60

47,00

6,76

2 209,00

122,20

12

2,60

46,00

6,76

2 116,00

119,60

Сумма

27,60

540,00

64,28

24 321,00

1 244,90


Отсюда линейный коэффициент корреляции равен:

Сам по себе коэффициент корреляции не имеет содержательной интерпретации. Однако его квадрат , называемый коэффициентом детерминации (обычно выражается в %), имеет большой содержательный смысл – это показатель того, насколько изменения зависимого признака объясняются изменениями независимого.

Из определения коэффициента детерминации следует, что он принимает значения в диапазоне от 0% до 100%.

В рассмотренном примере коэффициент детерминации равен , то есть увеличение или уменьшение стоимости выпущенной товарной продукции на 50,06%  вариации объема отгрузки, произведённой фирмами объясняется вариацией затрат фирм на рекламу своих товаров.

Между тем, сама по себе величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени согласованности в изменениях признаков. Установлению причинно-следственной зависимости предшествует анализ качественной природы явлений. Но есть и ещё одно обстоятельство, объясняющее формулировку выводов о возможном наличии связи по величине коэффициентов корреляции.

Связано это с тем, что степени тесноты связи с помощью коэффициента корреляции производится, как правило, на основе более или менее ограниченной информации об изучаемом явлении. При этом возникает вопрос, насколько правомерно сделано заключение по выборочным данным в отношении действительного наличия корреляционной связи в той генеральной совокупности, из которой сделана выборка.

Принципиально возможны случаи, когда отклонение от нуля полученной величины выборочного коэффициента корреляции оказывается целиком обусловленным неизбежными случайными колебаниями тех выборочных данных, на основании которых он вычислен. Особенно осторожно следует подходить к истолкованию полученных коэффициентов корреляции при незначительных объёмах выборочной совокупности.

В этой связи возникает необходимость оценки существенности  линейного коэффициента корреляции, дающая возможность распространить выводы по результатам выборки на генеральную совокупность. В зависимости от объёма выборочной совокупности предлагаются различные методы оценки существенности линейного коэффициента корреляции.

Рассмотрим следующие основные критерии, используемые в статистике.

1. При большом объёме выборки следует рассчитать среднюю квадратическую ошибку линейного коэффициента корреляции по следующей формуле:

 

                                                                            

 


где          - линейный коэффициент корреляции, полученный по данным выборки;

               – объём выборки.

Если величина линейного коэффициента корреляции превышает величину средней квадратической ошибки более, чем  , то можно говорить о существенности выборочного коэффициента корреляции, где - уровень значимости 0,01 или 0,05.

Если же отношение окажется меньше , то с вероятностью следует предполагать отсутствие корреляционной связи в генеральной совокупности.

Доверительный интервал для коэффициента корреляции будет записан так:

 

                                                                            

 


где          - линейный коэффициент корреляции в генеральной совокупности.

2. Для малого объёма выборочной совокупности используется тот факт, что величина при условии r = 0, распределяется по закону Стьюдента с (n-2) свободами.

Полученную величину сравнивают с табличным значением (число степеней свободы равно n-2). Если рассчитанная величина превосходит табличное значение критерия , то практически невероятно, что найденное значение обусловлено только случайными совпадениями x и y в выборке из генеральной совокупности, для которой действительное значение коэффициента корреляции равно нулю. Если же вычисленная величина меньше, чем в таблице, то полагают, что коэффициент корреляции в генеральной совокупности в действительности равен нулю и соответственно эмпирический коэффициент корреляции существенно не отличается от нуля.

 

ПРИМЕР

Оценить существенность корреляции между затратами фирм на рекламу и объёмами отгрузки.

Так как объём выборки равен 12 фирмам и величина коэффициента корреляции равна 0,7075

В таблице для числа степеней свободы 12-12=10 и уровня значимости 1% находим, что t=3,169

 

ЗНАЧЕНИЯ ПРЕДЕЛОВ В ЗАВИСИМОСТИ ОТ k СТЕПЕНЕЙ СВОБОДЫ И ЗАДАННОГО УРОВНЯ ЗНАЧИМОСТИ ДЛЯ РАСПРЕДЕЛЕНИЯ СТЬЮДЕНТА

          

K

5,0

2,5

1,0

0,5

0,3

1

12,706

25,452

63,657

127,300

212,200

2

4,303

6,205

9,925

14,089

18,216

3

3,182

4,177

5,841

7,453

8,891

4

2,776

3,495

4,604

0,597

6,435

5

2,571

3,163

4,032

4,773

5,376

6

2,447

2,969

3,707

4,317

4,800

7

2,365

2,841

3,499

4,029

4,442

8

2,306

2,752

3,355

3,833

4,199

9

2,262

2,685

3,250

3,690

4,024

10

2,228

2,634

3,169

3,581

3,892

12

2,179

2,560

3,055

3,428

3,706

14

2,145

2,510

2,977

3,326

3,583

16

2,120

2,473

2,921

3,252

3,494

18

2,101

2,445

2,878

3,193

8,428

20

2,086

2,423

2,845

3,153

3,376

22

2,074

2,405

2,819

3,119

3,335

24

2,064

2,391

2,797

3,092

3,302

Таким образом, лишь с вероятностью меньшей 1% можно утверждать, что величина могла появиться в силу случайной выборки. Такое событие является маловероятным, а поэтому можно считать с вероятностью 99%, что в генеральной совокупности действительно существует прямая зависимость между изучаемыми признаками, т.е. отличие выборочного коэффициента корреляции от нуля является существенным.

3. Проверку гипотезы об отсутствии связи можно сделать и без вычислений, пользуясь таблицей Р. Фишера.

В этой таблице показывается величина коэффициента корреляции, которая может считаться существенной при данном количестве наблюдений. При пользовании этой таблицы величину коэффициента корреляции следует искать для числа степеней свободы, равного n-2.

 

4

0,8114

0,8822

0,9172

8

0,6319

0,7155

0,7646

10

0,576

0,6581

0,7079

13

0,5139

0,5923

0,6411

18

0,4438

0,5155

0,5614

20

0,4227

0,4921

0,5368

Информация о работе Корреляционная связь