Автор работы: Пользователь скрыл имя, 21 Мая 2013 в 11:38, контрольная работа
При статистическом анализе важно знать закон распределения генеральной совокупности. Если закон неизвестен, но имеются основания предположить, что он имеет определенный вид, то говорят: генеральная совокупность распределена по закону А. Если закон известен, но неизвестны его параметры и, например, есть основания предполагать, что , то выдвигают гипотезу: (здесь речь идет о гипотезе: равенстве параметру закона).
Возможны и другие гипотезы:
1. о равенстве параметров двух или нескольких распределений;
2. о независимости выборок и др.
Статистическая гипотеза.
Нулевая и конкурирующая, простая и сложная гипотеза.
При статистическом анализе важно знать закон распределения генеральной совокупности. Если закон неизвестен, но имеются основания предположить, что он имеет определенный вид, то говорят: генеральная совокупность распределена по закону А. Если закон известен, но неизвестны его параметры и, например, есть основания предполагать, что , то выдвигают гипотезу: (здесь речь идет о гипотезе: равенстве параметру закона).
Возможны и другие гипотезы:
Статистической называют гипотезу если идет речь о виде неизвестного распределения или о значениях параметров известных распределений. Гипотеза о наличии жизни на комете Хейла-Ботте не является статистической, т.к. нет закона или параметров.
Наряду с выдвинутой
гипотезой рассматривают и
Кроме того гипотез делят на простые и сложные.
Простой называют гипотезу, содержащую только одно предположение.
Сложной называют гипотезу, содержащую несколько простых гипотез. Например гипотеза Н: содержит бесчисленное множество простых гипотез Нi: ,где -любое число большее 5.
Ошибки первого и второго рода
Выдвинутая гипотеза может быть правильной или неправильной. Поэтому необходима ее проверка. Проверку осуществляют статистическими методами. При проверке возможны ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Статистический критерий проверки нулевой гипотезы.
Критическая область
Для проверки нулевой гипотезы используют случайно подобранную случайную величину, распределение которой будет известно. Будем обозначать это распределение буквой К (K=U,F,T и т.п.).
Статистическим критерием
Если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимают отношение исправленных выборочных дисперсий
.
Эта величина распределена по закону Фишера-Снедепора.
Для проверки гипотезы по данным выборок вычисляют его частное значение К1.
Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.
После выбора критерия множество его возможных значений разбивают на два непересекающихся множества:
Критической областью называют совокупность значений критерия К, при которых Н0 отвергается, т.е. первая область.
Областью принятия гипотезы Н0 называют совокупность значений критерия К, при которых Н0 принимают.
Основной принцип проверки статистических гипотез: если Кнабл области принятия гипотез, то гипотезу принимают.
К –одномерная случайная
Критическими точками называют точки отделяющие критическую область от области принятия гипотезы.
Различают следующие критические области:
Отыскание критических областей
Для отыскания правосторонней критической областидостаточно найти ккр.
Для ее нахождения задаются достаточно малой вероятностью –уровнем значимости .
ккр ищут исходя из требования, чтобы при условии справедливости Н0 вероятность того, что К примет значение > ккр была бы равна , т.е. Р(К> ккр)= . Из этого уравнения и находят ккр.
Почему для нахождения ккр требуется выполнение условия Р(К> ккр)= ?
Т.к. Р(К> ккр) –мала, то событие при справедливости Н0 не должно наступить в единичном испытании, если все же оно наступило (Кнабл> ккр), тоо это можно обьяснить тем, что Н0 ложно, и следовательно Н0 должна быть отвергнута. Т.о. условие Р(К> ккр)= определяет такие значения критерия, при которых Н0 отвергается, и следовательно, такие К составляют критическую область.
Введем понятие мощности критерия. Мощностью критерия называют вероятность попадания критерияв критическую область при условии, что справеедлива конкурирующая гипотеза (Н1). Другими словами мощность критерияесть вероятность того, что Н0 будет отвергнута, если верна Н1. Если вероятность ошибки второго рода равна , томощность равна 1- .
Если для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный обьем, то остается произвол в выборе критической области. Критическую область необходимо строить так, чтобы мощность критерия была максимальна.
Элементы дисперсионного и корреляционного анализа.
Элементы дисперсионного анализа
Дисперсионный анализ основан на анализе значений частных средних и дисперсий, полученных по выборкам, характеризующим выпускаемую продукцию на разных технологических установках.
Продукция выпускаемая на
разном технологическом
Пусть имеется К выборок с n числом изделий в каждой. Тогда число наблюдений за некоторым параметром равно N=n*k. В дисперсионном анализе их располагают в таблицы:
Номер выборки | |||||||
Номер наблюдения |
1 |
2 |
… |
I |
… |
K | |
1 |
X11 |
X21 |
… |
Xi1 |
… |
Xk1 | |
2 |
X12 |
X22 |
… |
Xi2 |
… |
Xk2 | |
… |
… |
… |
… |
… |
… |
… | |
J |
X1j |
X2j |
… |
Xij |
… |
Xkj | |
… |
… |
… |
… |
… |
… |
… | |
N |
X1n |
X2n |
… |
Xin |
… |
Xkn | |
Частная средняя |
|
|
… |
|
… |
| |
Частная дисперсия |
|
|
… |
|
… |
|
Здесь ; .
Кроме описанных характеристик
вычисляют также общую и
; .
В дисперсионном анализе
кроме общей дисперсии
;
.
Т.о. вычислив , и , которые являются представительными оценками , и оформив их в таблицу, можно выполнить анализ о качестве выпускаемой продукции на разном технологическом оборудовании.
Элементы корреляционного анализа.
Корреляционный анализ используют тогда, когда анализируются два различных параметра качества. Возможны следующие варианты их взаимной связи:
При анализе ттехнологического процесса в целом отвечают на следующие два вопроса:
На первый вопрос отвечает величина коэффициента корреляции:
; .
. При связь между х и у функциональная, при , х и у –независимы, при <1 связь между х и у статистическая. При rxy>0 зависимость возрастающая, т.е. большему х соответствует большее у. При rxy<0 зависимость убывающая.
На вторй вопрос отвечает следующее уравнение регрессии. Его получают из следующих соображений. При статистических связях каждому фиксированному х соответствует распределение у и наоборот. Поэтому подсчитав можно эту связь записать ввиде и соответственно .
Данные уравнения называют уравнениями регрессии у на х (х на у). иногда их называют корреляционными уравнениями.
На практике чаще всего уравнения регрессии получают линейными. В тех случаях, когда зависимость нелинейна, ее линеаризуют посредством преобразований.
Линейную регрессию записывают ввиде:
, , .
Коэффициент b называют коэффициентом регрессии и вычисляют по формуле:
.
Примеры
Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.
Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2).
Ошибки двух видов, связанные с действиями а1 и а2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.
Рассмотрим случай когда предпринимается действие а2, в то время когда а1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.
Информация о работе Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотеза