Корреляционный анализ

Автор работы: Пользователь скрыл имя, 14 Декабря 2013 в 20:42, курсовая работа

Краткое описание

Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся — с их успеваемостью по математике или по литературе и т.п.? Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.

Содержание

Введение…………………………………………………………………………………………………………………………………….. 3
Построение корреляционной таблицы…………………………………………………………………………………….. 5
Вычисление параметров уравнения связи………………………………………………………………………………… 7
Вычисление корреляционного отношения………………………………………………………………………………. 8
Построение кривой связи…………………………………………………………………………………………………………… 10
Оценка надежности корреляционного отношения………………………………………………………………….. 10
Заключение…………………………………………………………………………………………………………………………………. 11
Список литературы……………………………………………………………………………………………………………………… 12

Прикрепленные файлы: 1 файл

Построение корреляционной таблицы.docx

— 61.49 Кб (Скачать документ)

Федеральное государственное бюджетное образовательное  учреждение

высшего профессионального образования

РОССИЙСКИЙ  УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ

 

 

 

 

 

 

Кафедра инженерного бизнеса и управления предприятиями

 

 

 

 

 

Курсовая  работа

по дисциплине: «Теория вероятностей и математическая статистика»

на тему: «Корреляционный анализ»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выполнил: ________________________

Проверил: ________________________

 

 

 

 

Москва, 2013 

Содержание.

Введение……………………………………………………………………………………………………………………………………..

3

Построение корреляционной таблицы……………………………………………………………………………………..

5

Вычисление параметров уравнения  связи…………………………………………………………………………………

7

Вычисление корреляционного отношения……………………………………………………………………………….

8

Построение кривой связи……………………………………………………………………………………………………………

10

Оценка надежности корреляционного  отношения…………………………………………………………………..

10

Заключение………………………………………………………………………………………………………………………………….

11

Список литературы………………………………………………………………………………………………………………………

12


 

 

Введение.

Исследователя нередко интересует, как связаны между собой две  или большее количество переменных в одной или нескольких изучаемых  выборках. Например, могут ли учащиеся с высоким уровнем тревожности  демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся — с их успеваемостью по математике или по литературе и т.п.?

Такого рода зависимость между  переменными величинами называется корреляционной, или корреляцией.

Корреляционная связь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.

Известно, например, что в среднем  между ростом людей и их весом  наблюдается положительная связь, и такая, что чем больше рост, тем  больше вес человека. Однако из этого  правила имеются исключения, когда  относительно низкие люди имеют избыточный вес, и, наоборот, астеники, при высоком  росте имеют малый вес. Причиной подобных исключений является то, что  каждый биологический, физиологический  или психологический признак  определяется воздействием многих факторов: средовых, генетических, социальных, экологических  и т.д.

Корреляционные связи — это  вероятностные изменения, которые  можно изучать только на представительных выборках методами математической статистики.

Корреляционная зависимость  – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Задача корреляционного анализа  сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Корреляционные связи различаются по форме, направлению и степени (силе).

По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. рис.). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.

По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого. При отрицательной корреляции соотношения обратные. При положительной корреляции коэффициент корреляции имеет положительный знак, например τ=+0,207, при отрицательной корреляции – отрицательный знак, например τ=-0,207.

Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.

Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.

Максимальное возможное абсолютное значение коэффициента корреляции τ=1,00; минимальное τ=0,00.

Общая классификация корреляционных связей:

сильная, или тесная

при коэффициенте корреляции

τ > 0,7

средняя

 

0,5<τ<0,69

умеренная

 

0,3<τ<0,49

слабая

 

0,2<τ<0,29

очень слабая

 

τ<0,19


 

Построение  корреляционной таблицы

X

Y

X

Y

X

Y

2

55

69

75

90

115

5

60

72

85

85

119

7

61

75

85

83

113

9

67

78

85

80

115

10

65

82

89

78

113

12

68

84

87

75

115

15

70

86

87

70

118

18

68

89

94

68

120

25

80

91

85

65

115

28

75

93

90

62

118

30

70

97

90

60

120

31

80

98

94

55

117

33

77

100

90

52

110

37

85

103

92

50

120

41

85

105

95

48

125

43

79

108

97

45

120

45

80

110

98

40

123

48

83

120

100

38

130

50

83

112

108

35

125

52

89

110

110

30

125

54

75

105

110

27

128

57

79

100

115

25

129

60

85

98

110

20

135

64

90

95

112

15

133

67

83

93

112

8

140


 

 

Для результативного признака необходимо определить величину интервала группировки. Это можно сделать с помощью  формулы Стержэсса:

,

где – максимальное значение х; – минимальное значение х; – количество проб.

Тогда,

                      

В корреляционной таблице факторный  признак X располагаем в строках, а результативный признак Y – в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y:

 

   

-3

-2

-1

0

1

2

3

     
 

ξ(X)

η(Y)

2-19

(10)

20-36

(27)

37-53

(44)

54-70

(61)

71-87

(78)

88-104

(95)

105-121

(112)

Итого

m(Y)

m*η

m*η^2

-3

140-151

(145)

1

           

1

-3

9

-2

128-139

(133)

1

3

1

       

5

-10

20

-1

116-127

(121)

 

2

4

5

1

   

12

-12

12

0

104-115

(109)

   

1

1

4

5

3

14

0

0

1

92-103

(97)

         

3

4

7

7

7

2

80-91

(85)

 

2

6

3

6

4

 

21

42

84

3

68-79

(73)

3

3

1

3

     

10

30

90

4

55-67

(61)

5

           

5

20

80

 

Итого

m(X)

10

10

13

12

11

12

7

75

74

302

 

m*ξ

-30

-20

-13

0

11

24

21

Σ=

-7

 
 

m*ξ^2

90

40

13

0

11

48

63

Σ=

265

 
 

m*ξ^3

-270

-80

-13

0

11

96

189

Σ=

-67

 
 

m*ξ^4

810

160

13

0

11

192

567

Σ=

1753

 
 

Σmη

24

5

9

10

25

11

4

Σ=

74

 
 

Σmη^2

120

49

41

44

11

19

4

Σ=

302

 
 

ξΣmη

-72

-10

-9

0

11

22

12

Σ=

-46

 
 

ξ^2Σmη

216

20

9

0

1067

44

36

Σ=

336

 
 

Σm(xi)y(i)

802

1030

1309

1188

97

1176

715

Σ=

7287

 
 

Σ(xi)y(i)/Σm(xi)

80,2

103

100,7

99

11

98

102,1

     

 

Вычисление  параметров уравнения связи.

1) С помощью корреляционной решетки:

Уравнение регрессии в форме  параболы второго порядка имеет  следующий вид (в координатах  η и ξ):

                                                                         (1)

Параметры уравнения (1) определяют по методу наименьших квадратов, решая  систему уравнений:

                                                         (2)

Подставив в систему (2) значения из таблицы, получим:

 

Следовательно, уравнение параболы имеет следующий вид (в координатах  η и ξ):

                                                                         (3)

Выразим η и ξ через x и y:

                                                                     (4)

Подставив (4) в (3), имеем уравнение параболической регрессии:

 

или

 

 

 

2) С помощью матриц по формуле Крамера:

Определитель для системы (2) имеет  вид:

 

 

 

 

 

Т.к. определитель не равен нулю, находим  дополнительные определители:

 

 

 

 

 

 

 

 

 

 

 

 

Тогда,

 

 

 

 

 

 

Следовательно, уравнение параболы имеет вид:

,

а уравнение параболической регрессии:

 

 

Вычисление  корреляционного отношения.

При статическом изучении взаимосвязей между признаками общественных явлений  важное значение имеет оценка тесноты  связи, то есть оценка близости корреляционной связи к функциональной.

Теснота связи при криволинейной  зависимости определяется корреляционным отношением.

Для каждого содержания x выразим содержание y:

y(10)=80,2;

y(27)=103;

y(44)=100,7;

y(61)=99;

y(78)=97;

y(95)=98;

y(112)=102,1


 

Вычислим значение дисперсии по группам по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средневзвешенное значение дисперсии (внутригрупповая дисперсия) показывает рассеивание содержания y за счет прочих факторов, кроме x:

 

 

 

Влияние содержания xна содержание y отражает межгрупповая дисперсия:

 

где – вычисляется по формуле:

Информация о работе Корреляционный анализ