Автор работы: Пользователь скрыл имя, 14 Декабря 2013 в 20:42, курсовая работа
Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся — с их успеваемостью по математике или по литературе и т.п.? Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.
Введение…………………………………………………………………………………………………………………………………….. 3
Построение корреляционной таблицы…………………………………………………………………………………….. 5
Вычисление параметров уравнения связи………………………………………………………………………………… 7
Вычисление корреляционного отношения………………………………………………………………………………. 8
Построение кривой связи…………………………………………………………………………………………………………… 10
Оценка надежности корреляционного отношения………………………………………………………………….. 10
Заключение…………………………………………………………………………………………………………………………………. 11
Список литературы……………………………………………………………………………………………………………………… 12
Федеральное
государственное бюджетное
высшего профессионального образования
РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ
Кафедра
инженерного бизнеса и
Курсовая работа
по дисциплине: «Теория вероятностей и математическая статистика»
на тему: «Корреляционный анализ»
Выполнил: ________________________
Проверил: ________________________
Москва, 2013
Содержание.
Введение………………………………………………………… |
3 |
Построение корреляционной таблицы…………………………………………………………… |
5 |
Вычисление параметров уравнения
связи………………………………………………………………… |
7 |
Вычисление корреляционного |
8 |
Построение кривой связи………………………………………………………………… |
10 |
Оценка надежности корреляционного
отношения……………………………………………………… |
10 |
Заключение…………………………………………………… |
11 |
Список литературы………………………………… |
12 |
Введение.
Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся — с их успеваемостью по математике или по литературе и т.п.?
Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией.
Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.
Известно, например, что в среднем
между ростом людей и их весом
наблюдается положительная
Корреляционные связи — это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики.
Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Задача корреляционного
Корреляционные связи
По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. рис.). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.
По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого. При отрицательной корреляции соотношения обратные. При положительной корреляции коэффициент корреляции имеет положительный знак, например τ=+0,207, при отрицательной корреляции – отрицательный знак, например τ=-0,207.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Максимальное возможное
Общая классификация корреляционных связей:
сильная, или тесная |
при коэффициенте корреляции |
τ > 0,7 |
средняя |
0,5<τ<0,69 | |
умеренная |
0,3<τ<0,49 | |
слабая |
0,2<τ<0,29 | |
очень слабая |
τ<0,19 |
Построение корреляционной таблицы
X |
Y |
X |
Y |
X |
Y |
2 |
55 |
69 |
75 |
90 |
115 |
5 |
60 |
72 |
85 |
85 |
119 |
7 |
61 |
75 |
85 |
83 |
113 |
9 |
67 |
78 |
85 |
80 |
115 |
10 |
65 |
82 |
89 |
78 |
113 |
12 |
68 |
84 |
87 |
75 |
115 |
15 |
70 |
86 |
87 |
70 |
118 |
18 |
68 |
89 |
94 |
68 |
120 |
25 |
80 |
91 |
85 |
65 |
115 |
28 |
75 |
93 |
90 |
62 |
118 |
30 |
70 |
97 |
90 |
60 |
120 |
31 |
80 |
98 |
94 |
55 |
117 |
33 |
77 |
100 |
90 |
52 |
110 |
37 |
85 |
103 |
92 |
50 |
120 |
41 |
85 |
105 |
95 |
48 |
125 |
43 |
79 |
108 |
97 |
45 |
120 |
45 |
80 |
110 |
98 |
40 |
123 |
48 |
83 |
120 |
100 |
38 |
130 |
50 |
83 |
112 |
108 |
35 |
125 |
52 |
89 |
110 |
110 |
30 |
125 |
54 |
75 |
105 |
110 |
27 |
128 |
57 |
79 |
100 |
115 |
25 |
129 |
60 |
85 |
98 |
110 |
20 |
135 |
64 |
90 |
95 |
112 |
15 |
133 |
67 |
83 |
93 |
112 |
8 |
140 |
Для результативного признака необходимо определить величину интервала группировки. Это можно сделать с помощью формулы Стержэсса:
,
где – максимальное значение х; – минимальное значение х; – количество проб.
Тогда,
В корреляционной таблице факторный признак X располагаем в строках, а результативный признак Y – в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y:
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
|||||
ξ(X) η(Y) |
2-19 (10) |
20-36 (27) |
37-53 (44) |
54-70 (61) |
71-87 (78) |
88-104 (95) |
105-121 (112) |
Итого m(Y) |
m*η |
m*η^2 | |
-3 |
140-151 (145) |
1 |
1 |
-3 |
9 | ||||||
-2 |
128-139 (133) |
1 |
3 |
1 |
5 |
-10 |
20 | ||||
-1 |
116-127 (121) |
2 |
4 |
5 |
1 |
12 |
-12 |
12 | |||
0 |
104-115 (109) |
1 |
1 |
4 |
5 |
3 |
14 |
0 |
0 | ||
1 |
92-103 (97) |
3 |
4 |
7 |
7 |
7 | |||||
2 |
80-91 (85) |
2 |
6 |
3 |
6 |
4 |
21 |
42 |
84 | ||
3 |
68-79 (73) |
3 |
3 |
1 |
3 |
10 |
30 |
90 | |||
4 |
55-67 (61) |
5 |
5 |
20 |
80 | ||||||
Итого m(X) |
10 |
10 |
13 |
12 |
11 |
12 |
7 |
75 |
74 |
302 | |
m*ξ |
-30 |
-20 |
-13 |
0 |
11 |
24 |
21 |
Σ= |
-7 |
||
m*ξ^2 |
90 |
40 |
13 |
0 |
11 |
48 |
63 |
Σ= |
265 |
||
m*ξ^3 |
-270 |
-80 |
-13 |
0 |
11 |
96 |
189 |
Σ= |
-67 |
||
m*ξ^4 |
810 |
160 |
13 |
0 |
11 |
192 |
567 |
Σ= |
1753 |
||
Σmη |
24 |
5 |
9 |
10 |
25 |
11 |
4 |
Σ= |
74 |
||
Σmη^2 |
120 |
49 |
41 |
44 |
11 |
19 |
4 |
Σ= |
302 |
||
ξΣmη |
-72 |
-10 |
-9 |
0 |
11 |
22 |
12 |
Σ= |
-46 |
||
ξ^2Σmη |
216 |
20 |
9 |
0 |
1067 |
44 |
36 |
Σ= |
336 |
||
Σm(xi)y(i) |
802 |
1030 |
1309 |
1188 |
97 |
1176 |
715 |
Σ= |
7287 |
||
Σ(xi)y(i)/Σm(xi) |
80,2 |
103 |
100,7 |
99 |
11 |
98 |
102,1 |
Вычисление параметров уравнения связи.
1) С помощью корреляционной решетки:
Уравнение регрессии в форме параболы второго порядка имеет следующий вид (в координатах η и ξ):
Параметры уравнения (1) определяют по методу наименьших квадратов, решая систему уравнений:
Подставив в систему (2) значения из таблицы, получим:
Следовательно, уравнение параболы имеет следующий вид (в координатах η и ξ):
Выразим η и ξ через x и y:
Подставив (4) в (3), имеем уравнение параболической регрессии:
или
2) С помощью матриц по формуле Крамера:
Определитель для системы (2) имеет вид:
Т.к. определитель не равен нулю, находим дополнительные определители:
Тогда,
Следовательно, уравнение параболы имеет вид:
,
а уравнение параболической регрессии:
Вычисление корреляционного отношения.
При статическом изучении взаимосвязей между признаками общественных явлений важное значение имеет оценка тесноты связи, то есть оценка близости корреляционной связи к функциональной.
Теснота связи при криволинейной зависимости определяется корреляционным отношением.
Для каждого содержания x выразим содержание y:
y(10)=80,2; y(27)=103; y(44)=100,7; y(61)=99; |
y(78)=97; y(95)=98; y(112)=102,1 |
Вычислим значение дисперсии по группам по формуле:
Средневзвешенное значение дисперсии (внутригрупповая дисперсия) показывает рассеивание содержания y за счет прочих факторов, кроме x:
Влияние содержания xна содержание y отражает межгрупповая дисперсия:
где – вычисляется по формуле: