Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотеза

Автор работы: Пользователь скрыл имя, 21 Мая 2013 в 11:38, контрольная работа

Краткое описание

При статистическом анализе важно знать закон распределения генеральной совокупности. Если закон неизвестен, но имеются основания предположить, что он имеет определенный вид, то говорят: генеральная совокупность распределена по закону А. Если закон известен, но неизвестны его параметры и, например, есть основания предполагать, что , то выдвигают гипотезу: (здесь речь идет о гипотезе: равенстве параметру закона).
Возможны и другие гипотезы:
1. о равенстве параметров двух или нескольких распределений;
2. о независимости выборок и др.

Прикрепленные файлы: 1 файл

МАТЕМАТИКА.doc

— 138.00 Кб (Скачать документ)

 

Статистическая гипотеза.

Нулевая и конкурирующая, простая  и сложная гипотеза.

 

При статистическом анализе важно знать закон распределения генеральной совокупности. Если закон неизвестен, но имеются основания предположить, что он имеет определенный вид, то говорят: генеральная совокупность распределена по закону А. Если закон известен, но неизвестны его параметры и, например, есть основания предполагать, что , то выдвигают гипотезу: (здесь речь идет о гипотезе: равенстве параметру закона).

Возможны и другие гипотезы:

    1. о равенстве параметров двух или нескольких распределений;
    2. о независимости выборок и др.

 

Статистической называют гипотезу если идет речь о виде неизвестного распределения или о значениях параметров известных распределений. Гипотеза о наличии жизни на комете Хейла-Ботте не является статистической, т.к. нет закона или параметров.

Наряду с выдвинутой гипотезой рассматривают и противоположную  ей. Если выдвинутая гипотеза будет  отвергнута, то имеет место противоположная ей. По этой причине гипотезы делят на:

  1. нулевую. Нулевой (основной) называют выдвинутую гипотезу Н0;
  2. конкурирующую. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной.

Кроме того гипотез делят на простые и сложные.

Простой называют гипотезу, содержащую только одно предположение.

Сложной называют гипотезу, содержащую несколько простых гипотез. Например гипотеза Н: содержит бесчисленное множество простых гипотез Нi: ,где -любое число большее 5.

 

Ошибки первого и  второго рода

 

Выдвинутая гипотеза может быть правильной или неправильной. Поэтому необходима ее проверка. Проверку осуществляют статистическими методами. При проверке возможны ошибки двух родов.   

Ошибка первого рода состоит  в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит  в том, что будет принята неправильная гипотеза.

 

Статистический критерий проверки нулевой гипотезы.

Критическая область

 

Для проверки нулевой гипотезы используют случайно подобранную случайную величину, распределение которой будет известно. Будем обозначать это распределение буквой К (K=U,F,T и т.п.).

Статистическим критерием называют случайную величину К, которая служит для проверки Н0.

Если проверяют гипотезу о равенстве  дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимают отношение исправленных выборочных дисперсий

.

Эта величина распределена по закону Фишера-Снедепора.

Для проверки гипотезы по данным выборок  вычисляют его частное значение К1.

Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

После выбора критерия множество его  возможных значений разбивают на два непересекающихся множества:

  1. значения критерия, при которых Н0 отвергается;
  2. значения критерия, при которых Н0 принимается.

Критической областью называют совокупность значений критерия К, при которых  Н0 отвергается, т.е. первая область.

Областью принятия гипотезы Н0 называют совокупность значений критерия К, при которых Н0 принимают.

Основной принцип проверки статистических гипотез: если Кнабл области принятия гипотез, то гипотезу принимают.

К –одномерная случайная величина. Ее возможные значения принадлежат некоторому интервалу.

Критическими точками называют точки отделяющие критическую область от области принятия гипотезы.

Различают следующие критические  области:

  1. правостороннюю критическую область: К>ккр;
  2. левостороннюю критическую область: К<ккр;
  3. односторонней называют право- или левостороннюю критическую область;
  4. двухсторонней называют область, у которой К>ккр1 ,К<ккр2.

 

Отыскание критических  областей

 

Для отыскания правосторонней критической  областидостаточно найти ккр.

Для ее нахождения задаются достаточно малой вероятностью –уровнем значимости .

ккр ищут исходя из требования, чтобы при условии справедливости Н0 вероятность того, что К примет значение > ккр была бы равна , т.е. Р(К> ккр)= . Из этого уравнения и находят ккр.

Почему для нахождения ккр требуется выполнение условия Р(К> ккр)= ?

Т.к. Р(К> ккр) –мала, то событие при справедливости Н0 не должно наступить в единичном испытании, если все же оно наступило (Кнабл> ккр), тоо это можно обьяснить тем, что Н0 ложно, и следовательно Н0 должна быть отвергнута. Т.о. условие Р(К> ккр)= определяет такие значения критерия, при которых Н0 отвергается, и следовательно, такие К составляют критическую область.

Введем понятие мощности критерия. Мощностью критерия называют вероятность попадания критерияв критическую область при условии, что справеедлива конкурирующая гипотеза (Н1). Другими словами мощность критерияесть вероятность того, что Н0 будет отвергнута, если верна Н1. Если вероятность ошибки второго рода равна , томощность равна 1- .

Если для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный обьем, то остается произвол в выборе критической области. Критическую область необходимо строить так, чтобы мощность критерия была максимальна.

 

Элементы дисперсионного и корреляционного анализа.

Элементы дисперсионного анализа

 

Дисперсионный анализ основан на анализе значений частных средних и дисперсий, полученных по выборкам, характеризующим выпускаемую продукцию на разных технологических установках.

 Продукция выпускаемая на  разном технологическом оборудовании  должна быть проанализирована на однородность значений параметров определяющих качество продукции. Задача дисперсионного анализа состоит в ответе на вопрос: существенно ли отличаются значения параметров качества изделий.

Пусть имеется К выборок с  n числом изделий в каждой. Тогда число наблюдений за некоторым параметром равно N=n*k. В дисперсионном анализе их располагают в таблицы:

 

Номер выборки

Номер наблюдения

1

2

I

K

1

X11

X21

Xi1

Xk1

2

X12

X22

Xi2

Xk2

J

X1j

X2j

Xij

Xkj

N

X1n

X2n

Xin

Xkn

Частная средняя

Частная дисперсия


 

Здесь ; .

Кроме описанных характеристик  вычисляют также общую и среднюю  дисперсию.

; .

В дисперсионном анализе  кроме общей дисперсии вычисляют  еще две другие оценки рассеяния:

  1. дисперсию между выборками

;

  1. дисперсию внутри выборок

.

Т.о. вычислив , и , которые являются представительными оценками , и оформив их в таблицу, можно выполнить анализ о качестве выпускаемой продукции на разном технологическом оборудовании.

 

 

Элементы корреляционного  анализа.

Корреляционный анализ используют тогда, когда анализируются два  различных параметра качества. Возможны следующие варианты их взаимной связи:

  1. параметры тесно связаны функциональной зависимостью y=f(x);
  2. параметры совершенно не связаны между собой и, следовательно, переменные x и y независимы;
  3. параметры связаны между собой не строго. В этом случае говорят о статистической зависимости.

При анализе ттехнологического  процесса в целом отвечают на следующие два вопроса:

  1. насколько тесно связаны между собой две характеристики x и y?
  2. Каков вид связи между x и y?

На первый вопрос отвечает величина коэффициента корреляции:

; .

. При  связь между х и у функциональная, при , х и у –независимы, при <1 связь между х и у статистическая. При rxy>0 зависимость возрастающая, т.е. большему х соответствует большее у. При rxy<0 зависимость убывающая.

На вторй вопрос отвечает следующее уравнение регрессии. Его получают из следующих соображений. При статистических связях каждому фиксированному х соответствует распределение у и наоборот. Поэтому подсчитав можно эту связь записать ввиде и соответственно .


 

 

 

 

 

 

 

 

Данные уравнения называют уравнениями регрессии у на х (х на у). иногда их называют корреляционными уравнениями.

На практике чаще всего  уравнения регрессии получают линейными. В тех случаях, когда зависимость  нелинейна, ее линеаризуют посредством  преобразований.

Линейную регрессию  записывают ввиде:

, , .

Коэффициент b называют коэффициентом регрессии и вычисляют по формуле:

  .

Примеры

Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.

 

 

Исследование лекарства может  привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2).

 

Ошибки двух видов, связанные с  действиями а1 и а2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.

 

Рассмотрим случай когда предпринимается  действие а2, в то время когда а1 является более предпочтительным. Это  означает, что вследствие неточностей  в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.


Информация о работе Статистическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотеза