Автор работы: Пользователь скрыл имя, 13 Октября 2014 в 20:47, реферат
В биологических исследованиях нередко возникает необходимость изучить отдельные признаки в их взаимосвязи, проследить, в каких соотношениях находятся изменения одного признака с изменениями другого.
Взаимосвязи двух признаков хорошо известны в физике и математике. В пределах этих наук взаимосвязи определены совершенно точно: площадь треугольника определяется его высотой, длина окружности или площадь круга - величиной его радиуса, угол преломления светового луча определяется плотностью среды и т.д.
10. Получив значение дисперсий, выраженных в квадратах классового промежутка для первого и второго признаков – С1 и С2 , а также аналогичную величину по ряду разностей - Сd, вставляют их в формулу для расчета коэффициента корреляции:
r =
Таким образом, получена положительная корреляция при r=+0,40 . Рассмотренный способ расчета наиболее удобен при положительной' корреляции между признаками.
Если приходится иметь дело с обратной, отрицательной корреляцией, проще использовать не разности, а суммы отклонений, а расчет коэффициента корреляции вести по формуле:
Таблица 24
Расчет коэффициента корреляции по корреляционной решетке (отрицательная корреляция)
1 2 |
86 -90 |
91 -95 |
96 – 100 |
111 – 115 |
116 – 120 |
n2 |
p1=24 |
p2=9 |
nS |
p1=17 |
p2=6 | ||
59 |
2 |
1 |
9 |
9 |
9 |
1 |
1 |
1 | |||||
58 |
1 |
2 |
1 |
3 |
6 |
15 |
- |
3 |
4 |
5 | |||
57 |
1 |
2 |
8 |
- |
- |
8 |
12 |
- | |||||
56 |
1 |
2 |
1 |
1 |
1 |
5 |
17 |
- |
8 |
- |
- | ||
55 |
1 |
2 |
2 |
1 |
6 |
12 |
20 |
7 |
20 |
- | |||
54 |
2 |
1 |
1 |
4 |
6 |
8 |
5 |
13 |
22 | ||||
53 |
2 |
2 |
2 |
2 |
7 |
8 |
9 | ||||||
n1 |
4 |
4 |
7 |
14 |
8 |
2 |
1 |
40 |
q1=37 |
q2=30 |
1 |
1 |
1 |
q1=27 |
4 |
8 |
15 |
- |
11 |
3 |
1 |
p1=15 |
N = 40 |
40 |
q1=42 |
q2=32 | |
q2=16 |
4 |
12 |
- |
- |
- |
4 |
1 |
p2=5 |
Таблица вспомогательных величин
S1=p1-q1 |
S2=p1+q1+2(p2+q2) |
S12 |
C = S2- |
S=K | |||
1 |
15-27=-12 |
15+27+2(5+16)=84 |
144 |
3,6 |
84-3,6=80,4 |
103,5+5 |
5´ |
2 |
24-37=-13 |
24+37+2(9+30)=139 |
169 |
4,2 |
139-4,2=134,8 |
57+1´ |
1´ |
S |
17-42=-25 |
17+42+2(6+32)=135 |
625 |
15,6 |
135-15,6=119,4 |
- |
- |
r =
Направление корреляции можно определить по виду распределения частот сразу после заполнения корреляционной решетки (об этом говорилось выше). При отрицательной корреляции для получения ряда сумм отклонений частоты суммируются по диагоналям, проходящим из правого нижнего угла решетки в левый верхний угол (т.е. перпендикулярно диагоналям при положительной корреляции).
В следующем алгоритме (табл.24) приводится пример расчета корреляции между яйценоскостью кур за 5 месяцев продуктивности и средней массой сносимых ими яиц.
1- признак - яйценоскость за 5 мес. продуктивности кур
2-й признак - средняя масса яиц (г).
Как видно по корреляционной решетке (табл. 24), в данном случае имеет место отрицательная корреляция и расчет проводится в соответствии с этим. Расчет примера в алгоритме показал, что между указанными признаками кур существует отрицательная корреляция при r = -0,83:
r=
Ошибка
коэффициента прямолинейной корреляции
и
Поскольку коэффициент корреляции рассчитывается как величина, характеризующая определенную выборку, он имеет свою ошибку репрезентативности.
Для больших выборок эта ошибка рассчитывается по формуле:
Sr =
где r - коэффициент корреляции генеральной совокупности; n - число пар значений в выборке, т. е. ее объем. В эту формулу включается коэффициент корреляции для генеральной совокупности, который в практической работе известен исключительно редко. Вследствие этого в большинстве исследований вместо точного значения ошибки коэффициента корреляции берут ее приближенное значение, которое может быть определено по формуле с включением выборочного коэффициента корреляции:
Sr =
Необходимо отметить, что эта формула расчета ошибки коэффициента корреляции действительна лишь для больших выборок, когда число пар в выборке не меньше 100. При работе с малыми выборками (n<100) расчет по этой формуле дает менее точные, а иногда и совсем неверные результаты. В этой связи при п<100 применяется другая формула ошибки коэффициента корреляции:
Sr =
Для определения достоверности выборочного коэффициента корреляции рассчитывается критерий достоверности:
tr =
Рассчитанный критерий tr оценивается так же, как и критерий достоверности разности средних или долей, т.е. путем сравнения полученного значения t с фиксированными значениями по таблице Стьюдента (в соответствии с тремя степенями безошибочных суждений). При этом число степеней свободы принимается равным числу пар определений минус 2, т.е. n = n-2. В качестве упражнения рассчитываем ошибку и достоверность коэффициента корреляции на материале примеров, рассмотренных ранее.
1. В расчете получен коэффициент корреляции г - +0. 31 при n = 10:
Sr = ; Sr = = = = = 0,336 Sr = 0,336
tr = ; tr = =0,92; tr = 0,92
n = 10-2=8; tst = 2,3 – 3,4 – 5,0; tr = 0,92 < tst (при P<0,95).
Коэффициент корреляции в данном случае оказался недостоверным.
2. В одном из расчетов был использован аналогичный материал, что и в предыдущей задаче, но взят больший объем выборки. Получены данные: r= +0,40 при n =- 40:
Sr = ; Sr = = = = = 0,148 Sr = 0,148
tr = ; tr = =2,7; tr = 2,7
n = 40-2=38; tst = 2,5 – 2,7 – 3,6; tr=2,7 = tst (при P<0,99).
Коэффициент корреляции (r = 0,40) достоверен при втором уровне вероятности безошибочного суждения.
В первом случае коэффициент корреляции получился недостоверным в силу недостаточного объема выборки. Увеличение числа измерений до 40 пар во втором случае позволило получить достоверный коэффициент корреляции.
Если в исследовании важно определить только достоверность коэффициента корреляции, а ошибка коэффициента не представляет интереса, расчет может быть значительно упрощен.
В таблице 25 приведены значения объема выборки n при возможных значениях коэффициента корреляции. Использование таблицы делает очень простым определение достоверности коэффициента корреляции - при этом отпадает необходимость в вычислениях. Таблица применима для работы с выборками любой численности, как большими, так и малыми.
Таблица 25
Количество пар значений, достаточное для достоверности выборочного коэффициента прямолинейной корреляции (n)
r |
n | ||
P1=0,95 |
P2=0,99 |
P3=0,999 | |
t1=1,96 |
t2=2,58 |
t3=3,30 | |
.01 |
38407 |
66503 |
108903 |
.02 |
9603 |
16628 |
27228 |
.03 |
4269 |
7392 |
12103 |
.04 |
2403 |
4159 |
6809 |
.05 |
1539 |
2263 |
4359 |
.06 |
1069 |
1850 |
3028 |
.07 |
787 |
1360 |
2225 |
.08 |
604 |
1042 |
1704 |
.09 |
477 |
824 |
1347 |
.10 |
383 |
661 |
1081 |
.11 |
317 |
548 |
896 |
.12 |
267 |
462 |
754 |
.13 |
228 |
392 |
640 |
.14 |
196 |
337 |
550 |
.15 |
171 |
295 |
481 |
.16 |
151 |
259 |
422 |
.17 |
133 |
228 |
373 |
.18 |
119 |
204 |
332 |
.19 |
107 |
183 |
297 |
.20 |
97 |
165 |
270 |
.21 |
87 |
149 |
242 |
.22 |
80 |
136 |
211 |
.23 |
73 |
124 |
202 |
.24 |
68 |
114 |
185 |
.25 |
62 |
105 |
170 |
Продолжение табл.25
r |
n | ||
P1=0,95 |
P2=0,99 |
P3=0,999 | |
t1=1,96 |
t2=2,58 |
t3=3,30 | |
.26 |
57 |
97 |
157 |
.27 |
53 |
90 |
145 |
.28 |
49 |
83 |
135 |
.29 |
49 |
78 |
125 |
.30 |
43 |
73 |
117 |
.31 |
40 |
68 |
109 |
.32 |
38 |
63 |
102 |
.33 |
36 |
60 |
96 |
.34 |
34 |
56 |
90 |
.35 |
32 |
53 |
85 |
.36 |
30 |
50 |
80 |
.37 |
28 |
47 |
75 |
.38 |
27 |
44 |
71 |
.39 |
26 |
42 |
67 |
.40 |
24 |
40 |
64 |
.41 |
23 |
38 |
60 |
.42 |
22 |
36 |
57 |
.43 |
21 |
34 |
55 |
.44 |
20 |
33 |
52 |
.45 |
19 |
31 |
49 |
.46 |
19 |
30 |
47 |
.47 |
18 |
29 |
45 |
.48 |
17 |
27 |
43 |
.49 |
16 |
26 |
41 |
.50 |
16 |
25 |
39 |
.51 |
15 |
24 |
37 |
.52 |
15 |
23 |
36 |
.53 |
14 |
22 |
34 |
.54 |
14 |
21 |
33 |
.55 |
13 |
20 |
32 |
.56 |
13 |
20 |
30 |
.57 |
12 |
19 |
29 |
.58 |
12 |
18 |
28 |
.59 |
11 |
18 |
27 |
.60 |
11 |
17 |
26 |
.61 |
11 |
16 |
25 |
.62 |
10 |
16 |
24 |
.63 |
10 |
15 |
23 |
.64 |
.10 |
15 |
22 |
.65 |
9 |
14 |
21 |
.66-.67 |
9 |
13 |
20 |
.68 |
9 |
13 |
19 |
.69-.70 |
8 |
12 |
18 |
.71 |
8 |
11 |
17 |