Автор работы: Пользователь скрыл имя, 09 Декабря 2013 в 19:12, контрольная работа
Математическая статистика – наука о математических методах систематизации и использования статистических данных для решения научных и практических задач. Математическая статистика тесно примыкает к теории вероятностей и базируется на ее понятиях. Однако главным в математической статистике является не распределение случайных величин, а анализ статистических данных и выяснение, какому распределению они соответствуют. Большая статистическая совокупность, из которой отбирается часть объектов для исследования, называется генеральной совокупностью, а множество объектов, собранных из нее,– выборочной совокупностью, или выборкой. Статистическое распределение – это совокупность вариант и соответствующих им частот (или относительных частот).
Введение
Функциональная, статистическая и корреляционная зависимости.
Корреляционная таблица.
Уравнения прямых регрессий.
Коэффициент линейной корреляции, его свойства.
Метод наименьших квадратов.
Понятие о множественной корреляции.
Приложения в медицине.
Заключение
называется коэффициентом регрессии У на Х. Уравнение прямой регрессии У на Х имеет вид :
Аналогично получим уравнение прямой регрессии Х на У :
Выразим коэффициенты регрессии через коэффициент корреляции.
Тогда уравнения примут вид:
Обе прямые проходят через общую точку (a;b) , угловые коэффициенты прямых регрессии равны:
для прямой регрессии У на Х -
для прямой регрессии Х на У -
Чем ближе |r| к единице, тем меньше угол между прямыми регрессии, и только в случае | r | =1 прямые сливаются.
Коэффициент корреляции связан с коэффициентами регрессии соотношением:
5.Коэффициент линейной корреляции, его свойства.
Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона).
Коэффициент корреляции Пирсона представляет собой коэффициент ковариации нормированных случайных величин и :
,
где и – среднеквадратические отклонения величин и ,
и – среднее значение выборок.
Значение коэффициента корреляции лежит в пределах от –1 до +1. Если случайные величины x, y независимы, то коэффициент корреляции обязательно равен нулю, обратное утверждение неверно.
Коэффициент корреляции характеризует значимость линейной связи между параметрами:
В первых двух случаях имеет место функциональная зависимость: зная значение одного параметра, можно однозначно указать значение другого параметра.
Коэффициент ранговой корреляции Кендалла
Применяется для выявления
взаимосвязи между
где
Р— суммарное число наблюдений,
следующих за текущими наблюдениями
с большим значением рангов Y.
Q — суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y. (равные ранги не учитываются!)
Коэффициент взаимной сопряженности Пирсона-Чупрова применяется, когда требуется установить связь между качественными признаками, каждый из которых состоит из трех и более групп. Коэффициент взаимной сопряженности опред еляется по формуле
где φ2 - показатель средней квадратической сопряженности.
Коэффициент взаимной сопряженности изменяется от 0 до 1.
Коэффициент
корреляции рангов Спирмена
Для определения тесноты связи как между
количественными, так и между качественными
признаками, при условии, что значения
этих признаков могут быть проранжированы
по степени убывания или возрастания,
используется коэффициент корреляции
рангов Спирмэна:
где di - разность между величинами рангов
признака-фактора и результативного признака;
п - число показателей (рангов) изучаемого
ряда.
Он варьирует в пределах от -1,0 до +1,0.
Множественный коэффициент
ранговой корреляции (коэффициент конкордации)
Для оценки степеней тесноты связи между
несколькими признаками получил широкое
распространение коэффициент конкордации,
который вычисляется по формуле:
Где k – количество строк, n- количество
столбцов, S – сумма квадратов
отклонений сумм по строкам от их общего
среднего значения. Данный коэффициент
изменяется в пределах от 0 до 1.
Корреляционная матрица
Используя понятие коэффициента корреляции, матрице экспериментальных данных можно поставить в соответствие квадратную матрицу оценок коэффициентов корреляции (корреляционную матрицу). Её вид следующий:
Корреляционная матрица обладает следующими свойствами:
6. Метод наименьших квадратов.
В основе метода наименьших квадратов(МНК) лежит поиск таких значений коэффициентов регрессии, при которых сумма квадратов отклонений теоретического распределения от эмпирического была бы наименьшей.
Иными словами, из всего множества линий, линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной:
следовательно
Целью процедур линейной регрессии является подгонка прямой линии по точкам. А именно, построить линию регрессии так, чтобы минимизировать квадраты отклонений этой линии от наблюдаемых точек. Поэтому на эту общую процедуру иногда ссылаются как оценивание по методу наименьших квадратов. Прямая линия на плоскости (в пространстве двух измерений) задается уравнением Y=ax+b
7.Понятие о множественной корреляции.
При решении практических
задач исследователи
В условиях действия множества
факторов показатели парной корреляции
оказываются условными и
Этапы исследования множественной
корреляции
Множественный, или совокупный, коэффициент
корреляции для случая трех признаков,
один из которых — результативный (с номером
1) и два—факторных (с порядковыми номерами
2 и 3) рассчитывается по формуле.
Для расчетов используется такая формула:
пригодная для случаев, когда число признаков, совокупное влияние которых исследуется, превосходит два. Существуют стандартные программы, вычисляющие R1(23...P))
где подстрочные индексы
при r показывают номера признаков, связь
между которыми оценивается этим
коэффициентом корреляции.
Множественный коэффициент корреляции
является показателем тесноты линейной
связи между результативным признаком
и совокупностью факторных признаков.
Множественный коэффициент корреляции
изменяется в пределах от 0 до 1. Равенство
его нулю говорит об отсутствии линейной
связи, равенство единице—о функциональной
связи. Указаний на то, является ли связь
прямой или обратной, коэффициент не дает.
Совокупный коэффициент множественной корреляции Я представляет собой квадратный корень из совокупного коэффициента детерминации . Пределы изменения совокупного коэффициента множественной корреляции: 0 < Z < 1. Чем ближе K к 1, тем точнее уравнение множественной линейной регрессии отражает реальную связь. Иначе говоря, среди отобранных факторов присутствуют те, которые решающим образом влияют на результативный. Малое значение Я можно объяснить либо тем, что в уравнение множественной регрессии не включены существенно влияющие на результат факторы, либо тем, что установленная линейная форма зависимости не отражает реальной взаимосвязи признаков. Добиться адекватности модели множественной регрессии эмпирическим данным возможно, соответственно, либо включением в уравнение регрессии дополнительных, ранее не учитываемых факторов, либо построением нелинейной модели множественной регрессии.
Совокупный коэффициент множественной корреляции зависит не только от корреляции результативного признака с факторными, но и от корреляции факторных признаков между собой. Наличие между двумя факторами весьма тесной линейной связи (парный коэффициент корреляции превышает по абсолютной величине 0,8) называется коллинеарностью, а между несколькими факторами — мультиколлинеарностью.
8. Приложения в медицине.
Метод корреляций широкое применение нашел в медицине, а именно в областях: психологии, физического развития организма, фармации и др.
В своей работе мы рассмотрели область физического развития.
Антропометрические
признаки физического развития,
особенно такие, как длина,
масса тела, окружность грудной
клетки, взаимосвязаны. Эта
Антропометрические признаки.
Степень зависимости
между признаками выражается величиной
коэффициента корреляции (г) в пределах
± 1. Коэффициент +1 означает прямую взаимосвязь между
исследуемыми признаками (с увеличением
одного при-знака увеличивается другой).
Коэффициент - 1 означает обратную связь
(при увеличении одного признака другой
уменьшается, и наоборот).
Величина, на которую увеличивается (или
уменьшается) второй признак, если первый
увеличивается на единицу (например, увеличение
длины тела на 1 см), называется коэффициентом
регрессии (коэффициент b приведен в приложении
3). Вычисление этих коэффициентов позволяет
представить корреляцию между антропометрическими
признаками в виде таблиц или графиков
(номограмм), используемых для оценки показателей
физического развития.
Метод корреляций дает
возможность уточнить оценку антропометрических
данных.
Процедура оценки. Вначале,
как и при использовании метода стандартов,
оценивают длину тела. Для этого из показателя,
полученного при измерении, вычитают А/длины
тела соответствующей возрастной группы.
Разность обычно выражается в сигмах.
Остальные данные оценивают следующим
образом (приложение 3). В вертикальной
графе М возрастной группы 20 лет показаны
средние значения признаков (масса тела,
окружность грудной клетки, жизненная
емкость легких, сила правой кисти), соответствующие
длине тела 172 см. При определении должной
величины этих признаков для другого значения
длины тела следует:
• вычесть из показателя длины тела величину
М длины тела;
• значение Ъ (коэффициент регрессии)
данного признака умножить на разницу
в сантиметрах (отклонение) между данной
длиной тела и длиной тела М;
• результат прибавить (если длина тела
больше М) к средней величине исследуемого
признака, соответствующего росту 172 см,
или вычесть (если длина тела меньше М);
полученная цифра показывает должную
величину признака;
• для оценки интересующего признака
следует вычесть из имеющейся величины
признака его должную величину, а раз-ность
разделить на соответствующую этому признаку
сигму (сигму регрессии). Результат оценивают
по шкале оценок.
Метод индексов. Этот метод
может быть использован только для приблизительной,
ориентировочной оценки антропометрических
данных и в практике врачебного контроля
почти не применяется,
так как большинство индексов (и показателей)
недостаточно конкретизированы в возрастном,
половом и профессиональном отношениях.
К наиболее широко используемым индексам
относят:
- массоростовой (Кетле);
- жизненный;
- Эрисмана;
- Пирке;
- Пинье.
При исследовании (или же проектировании) каких-либо систем преимущества имеют задачи с одним выходным параметром, но на практике приходится учитывать множество параметров и соответствующие связи между ними, число которых в реальных задачах велико.
Математические модели можно построить для каждого из параметров, но невозможно одновременно оптимизировать несколько функций. Поэтому обычно из многих выходных параметров в качестве параметра оптимизации выбирается один, наиболее важный с точки зрения цели исследования, а остальные служат ограничениями.
Исследование возможности уменьшения числа выходных параметров позволяет снять некоторые из таких ограничений. Для этих целей и используется корреляционный анализ.
Результаты корреляционного анализа могут дать существенную информацию об исследуемом объекте, а также подсказать и направление дальнейших исследований, и совокупность требуемых методов, в том числе статистических, необходимых для более полного изучения объекта.
В областях, где причины определённых явлений и их характеры ещё недостаточно изучены, целесообразно применение аппарата корреляционного анализа на стадии ранних исследований.
Корреляционный анализ находит применение в самых разных областях: от технических до социальных.
Литература:
|
Практикум по математике. – Караганда: КГМУ, 2008 |
Абаева Н.Ф. Головачева В.Н. |
Математика. Часть 1. – Караганда: КГМУ, 2007 |
Абаева Н.Ф. Головачева В.Н. |
Математика. Часть 2. – Караганда: КГМУ, 2007 |
4. Павлушков И.В. Розовский Л.В. Капульцевич А.Е. |
Основы высшей математики и математической статистики. - М.: ГЭОТАР-МЕД, 2008.
|
5.Интернет ресурсы: |
Иллюстрации |
Койчубеков Б.К. |
Основы статистического
анализа медико-биологических |
Информация о работе Статистическая и корреляционная зависимости