Ошибки первого и второго рода. Мощность критерия

Автор работы: Пользователь скрыл имя, 17 Октября 2015 в 13:52, реферат

Краткое описание

Целью работы является исследование ошибок первого и второго рода и мощности критерия
Задачи:
1. дать определения понятиям ошибки первого и второго рода, мощность критерия
2. определить сферы применения ошибок первого и второго рода, и виды критериев, используемых при проверке выдвигаемых гипотез.

Содержание

Введение
Глава 1. Ошибки первого и второго рода
1.1 Ошибки первого и второго рода: понятие и суть
1.2 Области применения
Глава 2. Мощность критерия
2.1 Мощность критерия: понятие и суть
2.2 Виды критериев
Заключение
Список литературы

Прикрепленные файлы: 1 файл

Реферат Ахкямова.docx

— 38.18 Кб (Скачать документ)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

ИНСТИТУТ СОЦИОЛОГИИ И РЕГИОНОВЕДЕНИЯ

ЗАРУБЕЖНОЕ РЕГИОНОВЕДЕНИЕ

 

 

 

Реферат по учебной дисциплине

ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ И ТЕОРИЮ ВЕРОЯТНОСТЕЙ

«Ошибки первого и второго рода. Мощность критерия»

 

 

Выполнила:

Ахкямова Ирина Витальевна, студентка 1-го курса

 

Преподаватель:

Дятлов Александр Викторович

 

 

 

 

 

 

Ростов – на – Дону

2015 

 

 

План

 

Введение

 

Глава  1. Ошибки первого и второго рода

            1.1 Ошибки первого и второго рода: понятие и суть

  1.2 Области применения

 

Глава 2. Мощность критерия

  2.1 Мощность критерия: понятие и суть

  2.2 Виды критериев

 

Заключение

Список литературы

 

 

Введение

Гипотеза, которую выдвигает исследователь, может оказаться как верной, так и неверной, поэтому возникает острая необходимость проверить данную гипотезу. Эта гипотеза проверяется методами статистики, поэтому она именуется статистической.

В результате проверки гипотезы методами статистики исследователь дважды может допустить ошибку и принять неверное решение, т.е. совершить ошибку двух родов. Поэтому все выводы, сделанные на основе статистических данных, нередко содержат в себе ошибки. Эти ошибки, совершенные исследователем могут привести к очень серьезным последствиям, так как статистические методы применяются во многих областях, чем объясняется актуальность темы ошибок первого и второго рода.

Избежать ошибки при проверке статистических гипотез могут помочь различные критерии. Различные они потому что каждый критерий обладает определенной мощностью и уровнем значимости. Но и они не дают 100% результат принятия верной гипотезы, однако они помогают значительно снизить вероятность совершения ошибки и принятия неверной гипотезы к минимуму.

 

Целью работы является исследование ошибок первого и второго рода и мощности критерия

 

Задачи:

  1. дать определения понятиям ошибки первого и второго рода, мощность критерия
  2. определить сферы применения ошибок первого и второго рода, и виды критериев, используемых при проверке выдвигаемых гипотез.

Глава  1. Ошибки первого и второго рода

 

1.1 Ошибки первого и второго рода: понятие и суть

Ошибки первого (α-риск) и второго рода (β-риск) – это ключевые понятия в математической статистике, которые используют при проверки гипотез, выдвигаемых исследователем.

Сущность ошибки первого рода заключается в том, что исследователем отвергается верная гипотеза. Уровнем значимости называется та вероятность, с которой возможно совершение ошибки первого рода, её принято обозначать – α, при этом значение обычно принимают за 0,05 или 0,01.

Сущность ошибки второго рода заключается в том, что исследователем принимается неверная гипотеза. Эта ошибка не имеет общепринятого названия, но ее принято обозначать – β.

 

Гипотеза верна

(нулевая гипотеза)

(альтернативная гипотеза)

Применение критерия исследователем

 верно принята

 неверно принята  
(Ошибка второго рода)

 неверно отвергнута  
(Ошибка первого рода)

 верно отвергнута


 

Исходя из этого можно сделать вывод, что ошибки первого и второго родов взаимно-симметричны, и если поменять местами гипотезы и , то ошибки первого рода станут ошибками второго рода, а ошибки второго станут ошибками первого. Нулевая гипотеза – это наиболее вероятный, так называемый ожидаемый результат, а альтернативная – это противоположный, маловероятный результат, требующий дополнительной проверки.

Ошибку первого рода часто называют ложноположительным срабатыванием, а ошибку второго рода называют ложноотрицательным срабатыванием.

Вероятность совершения ошибки первого рода можно свести к нулю, всегда принимая нулевую гипотезу. Точно так же обстоит дело и с ошибками второго рода – всегда принимать альтернативную теорию. Но оба эти варианта неприемлемы.

 

1.2 Области применения

Ошибки первого и второго рода имеют широкую область применения.

Например, их используют в радиолокации для систем ПВО, где они имеют формулировку «ложная тревога» и «пропуск цели». В этой сфере ошибки первого и второго рода несут в себе основные принципы для построения радиолокационных станций.

Так же ошибки первого и второго рода используются в области компьютерного программного обеспечения, компьютерной безопасности. Например, для решения сохранения целостности данных и обеспечения доступа к ним легальных пользователей: здесь, как пример ошибки первого рода можно привести ситуацию, когда авторизованный пользователь распознается системой как нарушитель, а ошибкой второго рода – когда нарушитель распознается, как авторизованный. Так же их применяют для сортировки спама, в антивирусных программах, в компьютерных системах в аэропортах для предварительного досмотра пассажиров и их багажа на наличие запрещенных веществ и предметов, в биометрии.

Еще одной областью применения является медицина. Например их используют при проведении массовой медицинской диагностики – скрининга (относительно дешевый тест, используемый для массовой проверки людей, при отсутствии у них признаков заболевания), при чем здесь более распространены ошибки первого рода (например анализ крови на ВИЧ и СПИД). При проведении тестирования (исследование конкретного человека, при наличии у него клинических проявлений заболевания), ошибки второго рода наиболее распространены и являются существенной проблемой, например показать, что у пациента отсутствует заболевание, которое на самом деле у него есть, из-за чего больному не назначается, или назначается неуместное лечение.

Так же понятие «ошибка первого рода» используется исследователями в сфере изучения паранормальных явлений, где этим термином пользуются для описания какого либо визуального или аудио свидетельства, как несостоятельного.

 

 

 

Глава  2. Мощность критерия

 

2.1.Мощность критерия: понятие и суть

Как говорилось во введении, избежать ошибки при проверке статистических гипотез могут помочь различные критерии. Одной и наиболее значимой характеристикой любого критерия является его мощность.

Мощность – это способность выявить различия, если таковые имеются. Другими словами – это способность отклонить нулевую гипотезу, так как она неверна. Мощность критерия колеблется в диапазоне от 0 до 1, и чем ближе она к 1, тем мощнее критерий.  Она вычисляется по формуле (1- β). Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

 При этом мощность критерия определяется только эмпирическим путем, и как не странно, из-за существования множества критериев, на практике оказывается, что один критерий способен выявить различия, где другому критерию этого сделать не удалось.

Существует несколько способов повышения уровня мощности:

  1. Выбрать более высокий уровень значимости (α)
  2. Сформулировать направленные гипотезы, где исследователь может сосредоточиться только на α-риске тех исходов, которые согласованы с направленной гипотезой
  3. Увеличение объема выборки
  4. Увеличить эффективность, т.е. выбрать значения с большей величиной связи

 

2.2.Виды критериев

Статистический критерий – это правило, которое математически обосновывает принятие нулевой гипотезе, об отсутствии различий, и отклонение альтернативной гипотезе, о наличии различий.

Статистические критерии подразделяются на параметрические и непараметрические.

Параметрические критерии предназначены для проверки параметрических гипотез и основываются на расчете показателей распределения, таких как среднее, дисперсия, стандартное отклонение. Они позволяют оценить напрямую уровень основных параметров генеральной совокупности, разности средних и различия дисперсий. На основе параметрических критериев можно проследить тенденцию изменения признаков. Так же эти критерии считаются наиболее мощными по сравнению с непараметрическими, но если признак измерен интервальной шкалой и нормально распределен. Но с интервальной шкало часто возникают проблемы, проверка на нормальность распределения требует сложных расчетов, а распределение часто отклоняется от нормального, тогда требуется обращаться к непараметрическим критериям.

Непараметрические критерии не содержат в себе ограничений, как параметрические и основаны на работе с другими данными, такими как частоты, ранги и т.п. Но с другой стороны с помощью этих критериев невозможно оценить такие важные параметры, как среднее или дисперсия, нельзя дать оценку взаимодействие двух или более условий и факторов, которые влияют на изменение признака. С помощью непараметрических критериев можно решать задачи в исследованиях в области, например педагогики или психологии: выявить различия в уровнях исследуемых признаков, оценить сдвиг значений и выявить различия в распределении.

Примеры непараметрических критериев:

  • Q-критерий Розенбаума
  • U-критерий Манна-Уитни
  • Критерий Уилкоксона
  • Критерий Пирсона
  • Критерий Колмогорова-Смирнова

Примеры параметрических критериев:

  • t-критерий Стьюдента
  • Критерий Фишера
  • Критерий отношения правдоподобия
  • Критерий Романовского

Также существуют другие способы классификации критериев, но они условны и включают в себя параметрические и непараметрические, и один и тот же критерий может быть использован в разных случаях.

Условная классификация:

  • Критерий значимости. Предполагает проверку гипотезы о численных значениях известного закона распределения
  • Проверка на согласие подразумевает проверку предположения о том, что величина, которую исследуют, будет подчинена предполагаемому закону. Критерии согласия можно трактовать, как критерии значимости. Это критерии Пирсона, Колмогорова, Крамера, Купера
  • Критерии проверки на однородность. При проверке на однородность исследуемые величина подвергаются проверке на факт значимости различия их законов распределения, другими словами, поддаются ли исследуемые величины одному и тому же закону. Применяются в факторном анализе для определения зависимостей.

Все критерии для принятия или опровержения выдвигаемой исследователем гипотезы применяются с доверительной вероятностью, другими словами на определенном уровне значимости.

Уровень значимости – это вероятность, с которой мы можем отклонить верную гипотезу и признать альтернативную, т.е. мы сочли различия в проверяемом признаке достаточно значимыми в ходе проверки любым из вышеперечисленных критериев.

 

Заключение

 

В ходе выполнения работы, мы выяснили, что же собой представляют ошибки первого и второго рода и области их применения, а так же познакомились с таким важным понятием в математической статистике как мощность критерия, а так же познакомились с некоторыми вида критериев и провели их классификацию.

Таким образом, можно сделать вывод, что ошибки первого и второго рода играют важную роль во многих сферах, таких как медицина, радиолокация, компьютерные технологии и во многих других.

Огромна роль их и при проведении психологических, педагогических и т.п. исследованиях.

Так как ошибки первого и второго рода являются случайными и могут привести к серьезным последствиям, существуют различные способы их проверки с помощью статистических критериев.

Эти критерии делятся на несколько групп. Каждый критерий обладает определенной мощностью, но каждый из них не достоверен на 100% и может дать сбой, поэтому определенно сказать, какой критерий более эффективный сказать нельзя. Каждый из них применяется в определенном случае и относительно уровня значимости.

Информация о работе Ошибки первого и второго рода. Мощность критерия