Автор работы: Пользователь скрыл имя, 30 Марта 2014 в 22:53, контрольная работа
Корреляционные моменты, коэффициент корреляции - это числовые характеристики, тесно связанные во введенным выше понятием случайной величины, а точнее с системой случайных величин. Поэтому для введения и определения их значения и роли необходимо пояснить понятие системы случайных величин и некоторые свойства присущие им.
1.Введение……………………………………………………3-5
2. Коэффициент корреляции………………………………...6-16
3. Заключение………………………………………………...17
4. Список литературы………………………………………..18
Нетрудно видеть, что математическое ожидание центрированной случайной величины равно нулю.
Центрирование случайной величины равносильно переносу начала координат в точку, абсцисса которой равна математическому ожиданию.
Центральным моментом порядка s случайной величины Х называется математическое ожидание s-ой степени соответствующей центрированной случайной величины:
.
Для прерывной случайной величины s-й центральный момент выражается суммой
,
а для непрерывной - интегралом
.
Важнейшее значение имеет второй
центральный момент, который называют дисперсией и
обозначают D[X]. Для дисперсии имеем
.
Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около её математического ожидания. Само слово "дисперсия" означает "рассеивание".
Механической интерпретацией дисперсии является не что иное, как момент инерции заданного распределения масс относительно центра тяжести.
На практике часто применяется
также величина
,
называемая средним квадратичным отклонением (иначе - "стандартом") случайной величины Х.
Теперь перейдем к рассмотрению характеристик систем случайных величин.
Начальным моментом порядка
k,s системы (Х, Y) называется математическое
ожидание произведения Xk и Ys,
xk,s=M[XkYs].
Центральным моментом порядка
k,s системы (Х, Y) называется математическое
ожидание произведения k-ой и s-ой степени
соответствующих центрированных величин:
,
где , .
Для прерывных случайных величин
,
где рij - вероятность того , что система (Х, Y) примем значения (xi, yj), а сумма рассматривается по всем возможным значениям случайных величин X,Y.
Для непрерывных случайных величин
,
где f(x,y) - плотность распределения системы.
Помимо чисел k и s, характеризующих порядок момента по отношению к отдельным величинам, рассматривается ещё суммарный порядок момента k+s, равный сумме показателей степеней при Х и Y. Соответственно суммарному порядку моменты классифицируют на первый, второй и т.д. На практике обычно применяются только первые и вторые моменты.
Первые начальные моменты представляют
собой математические ожидания величин
Х и Y, входящих в систему
σ1,0=mx σ0,1=my.
Совокупность математических ожиданий mx , my представляет собой характеристику положения системы. Геометрически это координаты средней точки на плоскости, вокруг которой происходит рассеивание точки (Х, Y).
Важную роль на практике играют также вторые центральные моменты систем. Два из них представляют собой дисперсии величин Х и Y
,
характеризующие рассеивание случайной точки в направлении осей Ox и Oy.
Особую роль играет второй смещенный центральный момент:
,
называемый корреляционным моментом (иначе - "моментом связи")случайных величин Х и Y.
Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо рассеивания величин Х и Y, еще и связь между ними. Для того, чтобы убедиться в этом отметим, что корреляционный момент независимых случайных величин равен нулю.
Заметим, что корреляционный
момент характеризует не только зависимость
величин, но и их рассеивание. Поэтому
для характеристики связи между величинами
(Х;Y) в чистом виде переходят от момента
Kxy к характеристике
, (3)
где σx, σy - средние квадратичные отклонения величин Х и Y. Эта характеристика называетсякоэффициентом корреляции величин Х и Y.
Из формулы (3) видно, что для независимых случайных величин коэффициент корреляции равен нулю, так как для таких величин kxy=0.
Случайные величины, для которых rxy=0, называют некоррелированными (несвязанными).
Отметим однако, что из некоррелированности случайных величин не следует их независимость.
Коэффициент корреляции характеризует не всякую зависимость, а только так называемую линейную зависимость. Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или же убывать) по линейному закону. Т.о., коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами.
Для определения коэффициента корреляции имеется несколько методов. Однако мы приведем пример с использованием коэффициента корреляции смешанных моментов Пирсона, где
(4)
с применением таблицы данных (в нашем примере относительного содержания Т-лимфоцитов в % и уровня IgG в г/л):
1 |
2 |
3 |
4 |
5 |
6 |
7 |
x |
Y |
x' |
y' |
x'y' |
x'2 |
y'2 |
69,8 |
17,1 |
1,9 |
1,65 |
3,135 |
3,61 |
2,7225 |
69,5 |
16,9 |
1,6 |
1,45 |
2,32 |
2,56 |
2,1025 |
68,8 |
16,2 |
0,9 |
0,75 |
0,675 |
0,81 |
0,5625 |
67,5 |
14,8 |
-0,4 |
-0,65 |
0,26 |
0,16 |
0,4225 |
66,4 |
14,1 |
-1,5 |
-1,35 |
2,025 |
2,25 |
1,8225 |
65,5 |
13,6 |
-2,4 |
-1,85 |
5,76 |
5,76 |
3,4225 |
∑=679 |
∑=154,5 |
∑=12,855 |
∑=15,15 |
∑=11,055 |
Подставив полученные значения в формулу (4), получим
Т.е., коэффициент корреляции динамики Т-лимфоцитов и иммуноглобулина G у детей при перитонитах равен 0,9933, что говорит о высокой связи между данными показателями.
Заключение
Основное назначение корреляционного анализа – это выявление связи между переменными. Мерой связи являются коэффициенты корреляции, выбор которых напрямую зависит от типа шкалы, в которой измерены переменные, числа варьирующих признаков в сравниваемых переменных и распределения переменных. Наличие корреляции двух переменных еще не означает, что между ними существует причинная связь. Хотя корреляция прямо не указывает на причинную связь, она может быть ключом к разгадке причин. На ее основе можно сформировать гипотезы. В некоторых случаях отсутствие корреляции имеет более глубокое воздействие на гипотезу о причинной связи. Нулевая корреляция двух переменных может свидетельствовать, что никакого влияния одной переменной на другую не существует.
Корреляционные методы, особенно при множественной корреляции параметров, эффективно используются, как правило, в совокупности с другими экономико-математическими методами.
В любом случае, независимо от используемого конкретного метода, наибольший эффект и объективность исследовательских работ может быть достигнута комплексным применением приемлемых для целей исследования СУ методов. При этом одни из них могут быть эффективны на одном этапе исследования, а другие - на ином.
Список литературы
1. Гублер Е.В., Генкин А.А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л.: Медицина, 1973.
2. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и её инженерные приложения. - М.: Наука, 1988.
3. Применение вычислительной техники и математической теории эксперимента в научных исследованиях (учебное пособие).// Под ред. М-Б.А. Бабаева. - Баку, "Елм". - 1999. - 85 стр.