Основные задачи математической статистики

Автор работы: Пользователь скрыл имя, 29 Сентября 2013 в 12:32, лекция

Краткое описание

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.
Первая задача математической статистики — указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;

Прикрепленные файлы: 1 файл

мат. статистика.docx

— 412.67 Кб (Скачать документ)

Наблюдаемыми значениями критерия называют значение величины К, полученные по выборке и обозначают К набл.

Событие К набл. > kкр. – маловероятное событие, которое можно считать практически невозможным при справедливости Н0, и если оно все же произошло, то этот факт противоречит гипотезе Н0, отсюда следует, что её надо отвергнуть.

Левосторонняя критическая  область находится с помощью  равенства:

РНо (К < kкр.) = α

             


              k                    К

Для построения двусторонней критической области составляем равенство:

PНо (К < k1.) + РН1 (К > k2.) = α.

В частности, если распределение  критерия К  симметрично относительно нуля, то:

РНо (|К| > kкр..) = α.

Р (К > kкр..) = α.

 

 

 

                    


    -kкр.            kкр.  

Замечание 1. Значение К набл.  может оказаться в критической области не только потому, что гипотеза Н0 ложна, но и по другим причинам:

- недостаточный объем  выборки;

- недостатки ведения  эксперимента и др.

В таком случае, отвергая правильную гипотезу Н0, мы допускаем ошибку 1-го рода. Вероятность ошибки равна α.

Замечание 2. Если Н0 принята, то это не означает, что она доказана. Действительно, только один факт, подтверждающий правильность некоторого общего утверждения, вовсе не доказывает его.

Отвергают гипотезу Н0 более категорично. Только один пример, противоречащий общему утверждению, полностью опровергает это утверждение. Поэтому в первом случае, когда значения К набл. попадают в область принятия гипотезы, более правильно говорить: «Данные эксперимента согласуются с гипотезой Н0 и не дают основания её отвергнуть». Ответ во втором случае, когда К набл. попадает в критическую область, гипотеза Н0 отвергается.

Замечание 3. Чем меньше α  и β, тем критерий К  лучше. Однако, при заданном объеме выборки добиться одновременного уменьшения α и β невозможно. Единственным способом одновременного уменьшения α и β является увеличение объема выборки n.

 

 

 

 

 

 

 

 

13.

Пусть некоторая случайная величина имеет плотность распределения, зависящее от параметра Q, f(t,Q) одномерно или многомерно принимает значения из некоторого множества .

Зададим уровень значимости для проверки гипотез . Среди всевозможных критериев проверки Н0 целесообразно выбрать критерий, у которого мощность наибольшая.

Оптимальным критерием (Копт.) называется критерий, который имеет наибольшую мощность из всех критериев проверки Н0 для заданного уровня значимости .

Мощность:

Составим функцию правдоподобия:

- независимая выборка из распределенной  случайной величины.

Если гипотеза Н0 верна, то .

Если гипотеза Н1 верна, то .

Отношение правдоподобия:

Теорема Неймана-Пирсона.

Среди всех критериев заданного  уровня значимости , проверяющих простую гипотезу Н0 против конкурирующей гипотезы Н1 оптимальным критерием является критерий отношения правдоподобия.

С помощью такого оптимального критерия находим постоянную с, что выполняет равенство .

Полученное значение с  можно построить критическое  значение и рассчитать область критерия.

Указанное равенство равносильно  следующему: , где .

 

14. Построение  оптимальных критериев для проверки  гипотез о параметров нормального и биномиального распределений.

Пусть – независимая выборка из нормального распределения с параметрами a и .

I Пусть - значение известно, относительно параметра a. ; конкурирующая ; причем . Построим оптимальный критерий воспользовавшись теоремой Неймана-Пирсона. , если верна , то   Составляя ф-цию правдоподобия , т.е. так как это нер-во , где - некоторое число. , то есть оптим. Критерием является , а

Опр.: – квантилью (квантилем) данной случайной величины называется такое число , которое является 2корнем уравнением. где - функция распределение этой случайной величины, если случайная величина имеет параметры 0 и 1, то функция: поэтому является квантилем этого распределения если выполняется рав-во РИСУНОК. Заметим, что для норм-ого распределения . Учитывая, что имеет норм-ое распределение с параметрами a и . Найдем ошибки 1-ого и 2-ого рода и рассчитаем мощность , заметим, что если . Ошибка 2-ого рода = т.е. противоположное событие принимается неправильной гипотизей. = где отсюда будет равен Это рав-во дает тот объем выборки, который обеспечивает ошибки 1 и 2-ого рода Если правая часть рав-ва не целая, то в кач-ве выбирается ближайшее к нему большее целое число. Мощность критерия равна: 1-=; так как . Оптимальным критерием является который выражается через квантиль нор-ного распределения. отвергается, если , т.е. откуда или . Критическая область односторонняя. РИСУНОК.

Зам.: если конкурирующая гипотеза имеет вид: где , то прейдем к нер-ву и тогда =(квантиль). гипотиза отвергается если критическая область левосторонняя.

II Пусть - значение известно, причем , основная гипотеза причем . Если справедлива основная гипотеза ; если наоборот, то . Должно выполняться нер-во при условии, что , решение сведем к K. , заметим, что величина имеет распределение . - распределение, тогда , откуда ; поэтому - квантиль распределения . Получаем, что , это является если критическая область правосторонняя.

Пусть случайная величина распределена по Биномиальному закону с вероятностью P, т.е. , где Выдвинем гипотезу , где . Составим отношение правдоподобий должно выполняться нер-во , это нер-во сводится к таким образом , критической точкой будет , по интегральной теореме Муавра-Лапласса, биноминальному распределение асимптотически сходиться к нормальному распределению асимптотической конечностью.= - квантиль норм. Распределения. а теперь ошибки 2-ого рода. . Выразим объем выборки, который обеспечивает ошибки 1-ого и 2-ого рода .

 

 

 

15. Оптимальные  критерии для проверки сложных  гипотез.

I Пусть – независимая выборка из нормально распределенных генеральной совокупности с параметрами a и - причем значение известно, а относительно другого параметра a выдвинуто 2 гипотезы. ; (простая нулевая) и сложная конкурирующая , для любого фиксированного значения , где , получим нер-во: где фиксируя различные значения получим, что ошибка 2-ого рода зависит от значения = тогда мощность критерия тоже зависит от - Если , то Если График мощности получается путем преобразование графика функции Лапласа. РИСУНОК.

II Пусть . Тогда при любом фиксированном значение a=; получим : где а следовательно . При любом фиксированном значение a= приведем к нер-ву , где , причем Поэтому нет единого критерия, который максимизировал бы функцию мощности для всех значений a, тогда рассматривают критерий, который достигает наибольшей мощности при выполнении нер-ва: то есть двусторонний критерий. Функция мощности -. Если , то . Если Тогда график будет. РИСУНОК.

III Пусть даны 2 независимые выборки из генеральной совокупности имеющая нормальное распределение с параметрами 0 и и из нормального распред. Совокупности с параметрами 0 и .

Теор.: Неймана-Пирсона для проверки гипотезы , при сложно конкурирующей гипотезе , приводим к нер-ву: . В левой части нер-ва имеет распределение Фишера-Следекора с и степенями свободы. Пусть -функция этого распределение, тогда вероятность того, что такое нер-во выполняется при справедливости нулевой гипотезы равна. , . Квантиль распределения Фишера-Снедекора. То есть Критическая точка . Критическая область правосторонняя, если наблюдаемое значение критерия превышает , то отвергается на уровне значимости . РИСУНОК. Если конкурирующая гипотеза имеет вид: , то строится двусторонний критерий, который достигает наибольшей мощности. Тогда отвергается при или . РИСУНОК. Так как распределение Фишера-Снедекора не симметричны, то ,. Однако доказано, что распределение Фишера-Снедекора ; то есть .

 

IV Пусть даны 2 независимые выборки из 2 нормально распределенных генеральных совокупностей из из совокупности с параметрами   и , а другая выборка из совокупности с параметрами и . Требуется проверить ; при .

a) Значение и - известны, вычисляя выборочные средние сравниваем между собой

и , -. Случайная величина , имеет нормальное распределение с параметрами 0 и 1. Действительно, = при условии справедливости . а значит z работает хорошо с функцией Лапласа, получим: РИСУНОК. Если конкурирующая гипотеза имеет вид: , то получают: получаем, что . РИСУНОК. Если конкурирующая гипотеза: , то получаем. . РИСУНОК.

б) Значение и – неизвестны, но известно, что они равны между собой, тогда однако величина , не подчиняется нормальному закону, тогда которое имеет распределение Стьюдента с степенями свободы. Если гипотеза , то То отвергается. Если , то , а поскольку распределение симметрично от нуля, то РИСУНОК. Если , то РИСУНОК.

Зам.: При больших выборках , распределение Стьюдента становиться очень близким к нормальному распределению. Поэтому в кач-ве критерия получим , где выборочная дисперсия 1-ой выборки. - выборочная диспресия 2-ой выборки.

16 . Непараметрические  критерии.

Если построение критерия не опирается на предположение о  конкретном виде распредиления случайной величины  и не исправленные параметры, то такой критерий называют непараметрическим . они являются функциями от опытных значений случайной величины с их частотами.

  1. Критерий Пирсона.

Пусть проверяется  о том ,что независимая выборка … случайно величины ξ имеет функцию распределения  F(x), конкурирующая гипотеза , состоит в том ,что функция распределения величина ξ реализация которой является выборка отличная от F(x).

-, и по данной гипотезе F(x) найдем числа , которое является вероятностями значения величины в промежутке обозначается -число выбранных значений в промежутке случайные величины - имеют полиномиальное распределение поэтому о том что вероятности этого распределения равны . рассмотрим величину случайную: (1).

Т: при n -> случайная величина (1) сходится равномерно по распредилению ХИ квадрат с r-1 степенью свободы. функция ХИ квадрат с r-1 степенью свободы., тогда ==1-, те =1- -квант распределения ХИ квадрат с r-1 степенью свободы. Если наблюдаемое значение величины (1), превосходит , то  гипотеза  отвергается . в противном случаи нет оснований отвергать гипотезу это правило используется при

З: - это абсолютные частоты попадания в промежуток . теоритические абсолютные частоты, тогда можно записать - это относительные частоты.

З: если предполажение с S- параметрами F(x,), то число степеней свободы распределения ХИ квадрат к которому сходится величина (1) будет равно r-1-s , r-1-s=r-3. Т к для нормального распределения s=2 , а для показательного r=2, s=1 , а у равномерного распределения r=3 , s=1/ случайная величина (1)- называется  ст . Пирсона.

  1. Критерий Колмогорова

Пусть проверяется таже гипотеза , что в (1) и пусть по независимой выборке … построим эмпирическую функцию распределения , рассмотрим величину :

 

Т: если F(x) непрерывна , то распределение случайной величины независит от вида функции F(x), те инвариантно.

Эта теорема дает основания  протабулировать величину  для одного распределения например равномерного и использовать это и для других распределений.

Т(колмогорова): если F(x)- непрерывна ,то .этот факт используется с хорошим приближением при n>20. Если наблюдаемое значение величины - превысит -квантиль правой и части равенства (2) то гипотеза , отвергается на уровне значимости . Иначе наоборот.

С выражением в правой части (2) связан еще один критерий смирнова. Пусть имеются две независимые выборки … для случайной величины ξ, , … - для случайной величины и пусть построены эмпирические функции : , рассмотрим величину

= sup , пусть F(x)- функция распределения ξ, а G(x)- функция распределения для .

Т: если F(x), G(x)- непрерывны то

Этот факт используется для  проверки гипотезы выборки взятой из одного и того же распределения.; F(x)G(x). Эти выборки можно взяты из разных распределений называются гипотезой однородности. Гипотезы о виде неизвестной функции распределения выдвигает гипотезу согласия о критериях и проверки их согласия

Критерий Пирсога и Колмогорова являются критериями согласия.

Последняя теорема дает основания  для проверки гипотезы однородности ; F(x)= G(x).если наблюдаемое значение величины - превышает значение - квантиль правой части равенства (3), то тогда отвергает критерий Смирного , который является критерием однородности.

  1. Критерий однородности .

а) критерий смирного

б) критерий Вилкоксона

в) критерий знаков

г) критерий однородности ХИ квадрат 

д) Макномары

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17.Линейная регрессия.

Пусть исследуемая система  двух величин  и η т.е двумерная случайная величина . Пусть в результате n-независимых опытов получено n пар значений ,. Изобразим соответствующие точки на координатной плоскости и получим поле корреляции. Рисунок. Одному и тому же значению может соответствовать несколько значений . Их среднее арифметическое - выборочный аналог условного математического ожидания Одному и тому же могут соответствовать несколько значений Их среднее арифметическое - выборочный аналог условного математического ожидания ). ; ) . Если точки поля коррел. расположены по прямолинейной конфигурации, то говорят о прямолинейной корреляционной связи между двумя величинами. Условное мат.ожидание является функцией от , а явл. функцией от (ξ на η). Они называются функциями регрессии. Если обе являются линейными то говорят случайная величина связаны линейной корреляционной зависимостью. ; . Найдем прямую от которой как можно меньше отклон. экспериментальные точки , . Найдем , чтобы сумма квадратов расстояний экспериментальных точек от прямой была минимальной. – min. Система{} Разделим на n. => Система{; }. Система нормальных уравнений в мет. наим. квадр. Система{ } Умножим на , где. Найдем В знаменателе есть выборочная дисперсия для сл.вел. . то есть Обозначим то есть . . Если выборочный коэф. коррел.   то , тогда т.о. ур-ие искомой прямой:   . Т.о. наилучшим приближением, . выборочное уравнение регрессии на . Оно опред. зависимость между значениями сл. вел. и средними значениями случ. вел. . Углов. коэф.   наз. выборочным коэф. регрессии на . Аналогично найдем чтобы эксперимент. точки наимен. образом отклонялись от прямой , тогда выборочное уравнение регрессии на η. С наилучшим приближением ). Рисунок. T.( - центр совместного эмпирического распределения. Если то прямые сливаются; то нет линейной корреляционной зависимости, но это не означает что зависимости нет вообще она может быть нелинейной. Замечание. Числитель в ф-ле  коэффициента корреляции между η и называется ковариацией. Если и η - независим. сл. вел. то и тогда , обратно если , то величина ξ и η наз. некоррелируемыми, но это не означает что они независимы. Свойство: . Если , то между ξ и η имеется функциональная связь. Функц-ая зависимость – частный случай коррел-ой зависимости.

Информация о работе Основные задачи математической статистики