Автор работы: Пользователь скрыл имя, 29 Ноября 2013 в 10:02, курс лекций
Формы статистического наблюдения
К основным организационным формам статистического наблюдения относят: статистическая отчетность; специально организованное наблюдение.
Важнейшей формой статистического наблюдения является отчетность.
Отчетность – это форма статистического наблюдения, при которой в соответствующие статистические органы поступают в определенные сроки сведения от предприятий и организация, которые осуществляют экономическую деятельность. Сведения должны подаваться в установленном законом порядке отчетных документов.
, .
Свойство 1. есть показательное распределение с параметром .
Действительно, если , то - есть плотность распределения случайной величины, распределенной по показательному закону с параметром .
Свойство 2. Если , то .
Доказательство. Найдем функцию распределения :
Свойство 3. Если независимы и , то .
Доказательство. По свойству характеристической функции
- что есть характеристическая функция случайной величины, распределенной по .
Свойство 4. Если независимы и имеют стандартное нормальное распределение, то .
Доказательство. Вытекает из свойств 2 и 3.
Определение. Распределение суммы квадратов независимых стандартных нормальных случайных величин называют распределением "хи-квадрат" с степенями свободы и обозначают . (Саму случайную величину также часто обозначают ).
Согласно этому определению и свойству 4 предыдущего раздела, - есть гамма распределение . Следовательно, плотность распределения :
, (3.6)
а основные числовые характеристики , , мода распределения, при , равна .
Графики плотности вероятностей для различных степеней свободы приведены на рис
Если случайные величины и независимы и , , то, очевидно, их сумма .
Определение. Пусть - случайная величина распределенная по закону , а - независимая от нее случайная величина распределенная по закону хи-квадрат с степенями свободы. Тогда распределение величины
(3.7)
называется распределением Стьюдента с степенями свободы и обозначают .
Плотность распределения Стьюдента:
, (3.8)
Числовые характеристики: , . Распределение Стьюдента симметрично относительно .
Так как при , согласно закону больших чисел, , то при .
Теорема 1 (об ортогональном преобразовании нормального вектора). Пусть - случайный вектор, координаты которого независимы и имеют стандартное нормальное распределение, а , где - ортогональная матрица порядка (т.е. ),. Тогда координаты вектора независимы и имеют стандартное нормальное распределение.
Доказательство. Запишем плотность распределения вектора . Так как величины независимы и имеют стандартное нормальное распределение, то:
,
где .
Чтобы записать плотность распределения вектора , воспользуемся формулой для плотности при линейном преобразовании вектора: если , то . Тогда, с учетом того, что и получим:
.
Но, умножение вектора на ортогональную матрицу не меняет нормы вектора, действительно: .
Следовательно, , т.е. величины также как и величины , независимы и имеют стандартное нормальное распределение.
Теорема 2 (лемма Фишера). Пусть - выборка из и , где - ортогональная матрица порядка . Тогда для любого статистика распределена по закону , и не зависит от .
Доказательство. Так как , то (см. доказательство предыдущей теоремы). Тогда .
Пусть независимы и имеют нормальное распределение , , , . Тогда:
Доказательство.
Введем стандартные нормальные величины и выразим через : , где . То есть можно изначально считать, что величины имеют стандартное нормальное распределение. Попробуем применить к лемму Фишера, для этого представим в виде: , где .
Покажем, что найдется ортогональная матрица такая, что вектор , будет иметь координату . Возьмем в качестве первой строки матрицы строку, . Тогда . Так как норма этой строки (длина вектора) равна 1, то эту строку всегда можно дополнить до ортогональной матрицы (строки и столбы ортогональной матрицы – есть ортонормированные вектора).
Тогда в соответствии с леммой Фишера, статистика имеет распределение хи-квадрат с степенью свободы.
величина независимы, то есть и независимы.
величина , и по следствию 4 эти величины независимы. Следовательно, .
С вероятностью : , где - квантиль стандартного нормального распределения уровня .
Из следствия 5 леммы Фишера, учитывая симметрию распределения Стьюдента, с вероятностью получим:
, (3.13)
где - квантиль распределения Стьюдента уровня . Заметим, что квантиль распределения Стьюдента называется коэффициентом Стьюдента уровня .
Из следствия 2 леммы Фишера, с вероятностью получим:
, (3.14)
где , - квантили распределения хи-квадрат с степенями свободы уровней и соответственно.
Из следствия 3 леммы Фишера, с вероятностью получим:
, (3.15)
где , - квантили распределения хи-квадрат с степенью свободы уровней и соответственно.
Пример 1. Найти доверительный интервал для дисперсии нормальной величины с надежностью , если .
Решение. По таблицам распределения для степеней свободы находим квантили распределения уровней и : , . Следовательно, доверительный интервал:
.
Пример 2. Найти доверительный интервал для математического ожидания нормальной случайной величины с надежностью , если , , .
Решение. По таблицам распределения Стьюдента для степеней свободы находим коэффициент Стьюдента уровня : . Таким образом, с вероятностью :
или .
ТЕМА № 7 Проверка статистических гипотез
В математической статистике считается, что данные, получаемые в результате наблюдений, подчинены некоторому неизвестному вероятностному распределению, и задача состоит в том, чтобы извлечь из данных правдоподобную информацию об этом неизвестном распределении. В настоящей главе мы обсудим еще один подход к этой общей задаче, состоящий в проверке гипотез. Статистической гипотезой называют предположение о распределении вероятностей, которое необходимо проверить по имеющимся данным.
Статистический критерий
— строгое математическое правило,
по которому принимается или отвергается
та или иная статистическая гипотеза
с известным уровнем
Непараметрические критерии
Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.
Q-критерий Розенбаума
U-критерий Манна-Уитни
Критерий Уилкоксона
Критерий Пирсона
Критерий Колмогорова-Смирнова
Параметрические критерии
Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).
t-критерий Стьюдента
Критерий Фишера
Критерий отношения
Критерий Романовского
Определения
Пусть в (статистическом) эксперименте
доступна наблюдению случайная величина X, распределение
Статистическая гипотеза, однозначно определяющая распределение , то есть , где какой-то конкретный закон, называется простой.
Статистическая гипотеза, утверждающая принадлежность распределения к некоторому семейству распределений, то есть вида , где — семейство распределений, называется сложной.
На практике обычно требуется
проверить какую-то конкретную и как
правило простую гипотезу H0. Такую гипотезу
принято называть нулевой. При этом параллельно
рассматривается противоречащая ей гипотеза H1,
называемая конкурирующей или
Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.
В большинстве случаев статистические критерии основаны на случайной выборке фиксированного объема из распределения. В последовательном анализе выборка формируется в ходе самого эксперимента и потому её объем является случайной величиной
Уровень значимости и мощность
При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.
Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, α = P{U Ψ | H0}, т.е. уровень значимости α – это вероятность события {U Ψ}, вычисленная в предположении, что верна нулевая гипотеза Н0.
Уровень значимости однозначно определен, если Н0 – простая гипотеза. Если же Н0 – сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей Н0. Статистику критерия U обычно строят так, чтобы вероятность события {U Ψ} не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезе Н0) имеют результаты наблюдений. Для статистик критерия U общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берется по всем возможным распределениям, удовлетворяющим нулевой гипотезе Н0, т.е. α = sup P{U Ψ | H0}.
Если критическая область
P{U > C | H0} = α. (10)
Если С задано, то из последнего соотношения определяют α. Часто поступают по иному - задавая α (обычно α = 0,05, иногда α = 0,01 или α = 0,1, другие значения α используются гораздо реже), определяют С из уравнения (10), обозначая его Сα, и используют критическую область Ψ = {U > Cα} с заданным уровнем значимости α.
Вероятность ошибки второго рода есть P{U Ψ | H1}. Обычно используют не эту вероятность, а ее дополнение до 1, т.е. P{U Ψ | H1} = 1 - P{U Ψ | H1}. Эта величина носит название мощности критерия. Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.
Понятия уровня значимости и мощности
критерия объединяются в понятии
функции мощности критерия – функции,
определяющей вероятность того, что
нулевая гипотеза будет отвергнута.
Функция мощности зависит от критической
области Ψ и действительного
распределения результатов