Автор работы: Пользователь скрыл имя, 28 Января 2013 в 18:21, реферат
Одна из основных статистических процедур - вычисление средних величин для тех или иных совокупностей данных. Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.
1.Введение
2. Статистики интегрального типа и их асимптотика
3. Метод аппроксимации ступенчатыми функциями
4. Обобщение теоремы Хелли
5. Основные результаты
6. Статистика интегрального типа для проверки симметрии распределения
7. Заключение
8. Литература
при некотором х0 . Таким образом, проверке подлежит гипотеза симметрии относительно 0, которую можно переписать в виде
H(x) + H(-x) - 1 = 0 .
Для построенной по выборке Zj = Xj - Yj , j = 1,2,…,n, эмпирической функции распределения Hn(x) последнее соотношение выполнено лишь приближенно:
Как измерять отличие от 0? По тем же соображениям, что и в предыдущем пункте, целесообразно использовать статистику типа омега-квадрат. Соответствующий критерий был предложен в работе [35]. Он имеет вид
Представим эту статистику в интегральном виде. Рассмотрим выборочный процесс
При справедливости нулевой гипотезы
Положим
Тогда, как легко видеть, статистика, заданная формулой (27), представляется в виде
Таким образом, асимптотическое поведение этой статистики может быть изучено с помощью описанной выше предельной теории статистик интегрального типа. Исторически ход мысли был обратным - сначала была построена и изучена статистика (27), а потом путем обобщения разработанных при анализе конкретной статистики методов исследования была построена общая теория, включающая в себя ряд необходимых и достаточных условий.
Критерий проверки гипотезы
симметрии распределения
В работе [35] найдено предельное распределение этой статистики:
В табл.1 приведены критические значения статистики типа омега-квадрат для проверки симметрии распределения (и тем самым для проверки однородности связанных выборок), соответствующие наиболее распространенным значениям уровней значимости (расчеты проведены Г.В. Мартыновым; см.также [31]).
Таблица 1. Критические значения статистики
для проверки симметрии распределения
Значение функции |
Уровень значимости |
Критическое значение х статистики |
0,90 |
0,10 |
1,20 |
0,95 |
0,05 |
1,66 |
0,99 |
0,01 |
2,80 |
Как следует из табл.1, правило принятия решений при проверке симметрии распределения (или однородности связанных выборок) в наиболее общей постановке и при уровне значимости 5% формулируется так. Вычислить статистику . Если <1,66, то принять гипотезу однородности. В противном случае - отвергнуть.
Пример. Пусть величины Zj , j=1,2,…,20, таковы:
20, 18, (-2), 34, 25, (-17), 24, 42, 16, 26,
13, (-23), 35, 21, 19, 8, 27, 11, (-5), 7.
Соответствующий вариационный ряд имеет вид:
(-23)<(-17)<(-5)<(-2)<7<8<11<
<19<20<21<24<25<26<27<34<35<
Для расчета значения статистики построим табл.2 из 7 столбцов и 20 строк, не считая заголовков столбцов (сказуемого таблицы). В первом столбце указаны номера (ранги) членов вариационного ряда, во втором - сами эти члены, в третьем - значения эмпирической функции распределения при значениях аргумента, совпадающих с членами вариационного ряда. В следующем столбце приведены члены вариационного ряда с обратным знаком, а затем указываются соответствующие значения эмпирической функции распределения. Например, поскольку минимальное наблюдаемое значение равно (-23), то Hn(x) = 0 при x < -23, а потому для членов вариационного ряда с 14-го по 20-й в пятом столбце стоит 0. В качестве другого примера рассмотрим минимальный член вариационного ряда, т.е. (-23). Меняя знак, получаем 23. Это число стоит между 13-м и 14-м членами вариационного ряда, 21<23<24. На этом интервале эмпирическая функция распределения совпадает со своим значением в левом конце, поэтому следует записать в пятом столбце значение 0,65. Остальные ячейки пятого столбца заполняются аналогично. На основе третьего и пятого столбцов элементарно заполняется шестой столбец, а затем и седьмой. Остается найти сумму значений, стоящих в седьмом столбце. Подобная таблица удобна как для ручного счета, так и при использовании электронных таблиц типа Excel.
Таблица 2. Расчет значения статистики
для проверки симметрии распределения
j |
Z(j) |
Hn(Z(j)) |
- Z(j) |
Hn(-Z(j)) |
Hn(Z(j))+ Hn(-Z(j))-1 |
(Hn(Z(j))+ Hn(-Z(j))-1)2 |
1 |
-23 |
0,05 |
23 |
0,65 |
-0,30 |
0,09 |
2 |
-17 |
0,10 |
17 |
0,45 |
-0,45 |
0,2025 |
3 |
-5 |
0,15 |
5 |
0,20 |
-0,65 |
0,4225 |
4 |
-2 |
0,20 |
2 |
0,20 |
-0,60 |
0,36 |
5 |
7 |
0,25 |
-7 |
0,10 |
-0,65 |
0,4225 |
6 |
8 |
0,30 |
-8 |
0,10 |
-0,60 |
0,36 |
7 |
11 |
0.35 |
-11 |
0,10 |
-0,55 |
0,3025 |
8 |
13 |
0,40 |
-13 |
0,10 |
-0,50 |
0,25 |
9 |
16 |
0,45 |
-16 |
0,10 |
-0,45 |
0,2025 |
10 |
18 |
0,50 |
-18 |
0,05 |
-0,45 |
0,2025 |
11 |
19 |
0,55 |
-19 |
0,05 |
-0,40 |
0,16 |
12 |
20 |
0,60 |
-20 |
0,05 |
-0,35 |
0,1225 |
13 |
21 |
0,65 |
-21 |
0,05 |
-0,30 |
0,09 |
14 |
24 |
0,70 |
-24 |
0 |
-0,30 |
0,09 |
15 |
25 |
0,75 |
-25 |
0 |
-0,25 |
0,0625 |
16 |
26 |
0,80 |
-26 |
0 |
-0,20 |
0,04 |
17 |
27 |
0,85 |
-27 |
0 |
-0,15 |
0,0225 |
18 |
34 |
0,90 |
-34 |
0 |
-0,10 |
0,01 |
19 |
35 |
0,95 |
-35 |
0 |
-0,05 |
0,0025 |
20 |
42 |
1,00 |
-42 |
0 |
0 |
0 |
Результаты расчетов (суммирование значений по седьмому столбцу табл.2) показывают, что значение статистики =3,055. В соответствии с табл.1 это означает, что на любом используемом в прикладных эконометрических исследованиях уровнях значимости отклоняется гипотеза симметрии распределения относительно 0 (а потому и гипотеза однородности в связанных выборках).
Заключение
В прикладной статистике широко
используются статистики типа омега-квадрат
и типа Колмогорова-Смирнова [6]. Они
применяются для проверки согласия
с фиксированным распределением
или семейством распределений, для
проверки однородности двух выборок, симметрии
распределения относительно 0, при
оценивании условной плотности и
регрессии в пространствах
Литература
1. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука,1979. – 296 с.
2. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей. - М;: Статистика, 1980. - 208 с.
3. . ГОСТ 11.010-81. Прикладная статистика. Правила определения оценок параметров и доверительных границ для биномиального и отрицательного биномиального распределений. – М.: Изд-во стандартов, 1982. – 32 с.
4. Ибрагимов И.А., Хасьминский Р.З. Асимптотическая теория оценивания. – М.: Наука, 1979. – 528 с
5. Боровков А.А. Математическая статистика / Учебное пособие для вузов. – М.: Наука, 1984. – 472 с.
6. Петрович М.Л., Давидович М.И. Статистическое оценивание и проверка гипотез на ЭВМ. – М.: Финансы и статистика, 1989. – 191 с.
7. Орлов А.И. Непараметрические оценки плотности в топологических пространствах. – В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. - С. 12-40.
8. Орлов А.И. Асимптотическое поведение статистик интегрального типа. – Журнал «Доклады АН СССР». 1974. Т.219. No. 4. С. 808-811.
9. Холлендер М., Вульф Д. Непараметрические методы статистики. – М.: Финансы и статистика, 1983. - 518 с.
10. Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. - М.: Наука, 1976. – 736 с.