Автор работы: Пользователь скрыл имя, 28 Января 2013 в 18:21, реферат
Одна из основных статистических процедур - вычисление средних величин для тех или иных совокупностей данных. Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.
1.Введение
2. Статистики интегрального типа и их асимптотика
3. Метод аппроксимации ступенчатыми функциями
4. Обобщение теоремы Хелли
5. Основные результаты
6. Статистика интегрального типа для проверки симметрии распределения
7. Заключение
8. Литература
Федеральное агенство по образованию
Государственное образовательное учреждение высшего профессионального образования
Тверской Государственный Технический Университет
( ГОУВПО ТГТУ)
Кафедра АТПП
РЕФЕРАТ
На тему:
Статистики интегрального типа
Выполнила:
студент 3-го курса ЗО
Группа: С С
Ф.И.О.: Улезко С.Ю.-090182
Работу проверила преподаватель:
Емцева Наталья Алексеевна
Тверь 2013
Содержание
1.Введение
2. Статистики интегрального типа и их асимптотика
3. Метод аппроксимации ступенчатыми функциями
4. Обобщение теоремы Хелли
5. Основные результаты
6. Статистика интегрального типа для проверки симметрии распределения
7. Заключение
8. Литература
Статистики интегрального типа
Введение
Одна из основных статистических процедур - вычисление средних величин для тех или иных совокупностей данных. Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.
Однако
математический аппарат при этом
основан на свойствах сумм случайных
величин (векторов, элементов линейных
пространств). Следовательно, он не пригоден
для изучения вероятностных и
статистических проблем, связанных
со случайными объектами нечисловой
природы. Это такие объекты, как
бинарные отношения, нечеткие множества,
вообще элементы пространств без
векторной структуры. Объекты нечисловой
природы все чаще встречаются
в прикладных исследованиях. Много
конкретных примеров приведено выше
в главе 1. Поэтому необходимо научиться
усреднять различные нечисловые
данные, т.е. определять эмпирические и
теоретические средние в
Статистики интегрального типа и их асимптотика
Рассмотрим статистики интегрального типа
где Х – некоторое пространство, по которому происходит интегрирование (например, X = [0; 1], X = R1 или X = Rk). Здесь {б} – направленное множество, переход к пределу по которому обозначен как б→∞ (см. приложение 1). Случайные функции fб: XЧЩ → Y обычно принимают значения, являющиеся числами. Но иногда рассматривают и постановки, в которых У = Rk или У – банахово пространство (т.е. полное нормированное пространство [27]). Наконец, Fб(x,щ) – случайная функция распределения или случайная вероятностная мера; в последнем случае используют также обозначение dFб(x,щ)= Fб(dx,щ).
Предполагаются выполненными необходимые для корректности изложения внутриматематические предположения измеримости, например, сформулированные в [28, 29].
Пример 1. Рассмотрим критерий Лемана – Розенблатта, т.е. критерий типа омега-квадрат для проверки однородности двух независимых выборок [6]. Его статистика имеет вид:
LR =
где Fm(x) – эмпирическая функция распределения, построенная по первой выборке объема m, Gn(x)) - эмпирическая функция распределения, построенная по второй выборке объема n, а Hm+n(x) – эмпирическая функция распределения, построенная по объединенной выборке объема m+n. Легко видеть, что
Hm+n(x) =
Ясно, что статистика LR имеет вид (1). При этом х – действительное число, Х = У = R1, в роли б выступает пара (m, n), и б→∞ означает, что min(m, n) → ∞. Далее,
fб(x,щ) =
Наконец, Fб(x,щ) = Hm+n(x).
Теперь обсудим
Нетрудно проверить, что
Сделаем замену переменной t = F(x). Тогда выборочные процессы переходят в соответствующие эмпирические процессы (см. приложение 1):
Конечномерные распределения этого процесса, т.е. распределения случайных векторов
для всех возможных наборов (t1, t2, … , tk), сходятся к конечномерным распределениям квадрата броуновского моста о2(t). В соответствии с разделом П-5 приложения 1 рассматриваемая сходимость по распределению обозначается так:
Нетрудно видеть, что при любом х
Fб(x,щ) = Hm+n(x) → F(x)
при б→∞ (сходимость по вероятности). С помощью замены переменной t = F(x) получаем, что
Fб(F-1(t),щ) = Hm+n(F-1(t)) → t (3)
при б→∞. Из соотношений (2) и (3) хотелось бы сделать вывод, что в случае статистики Лемана - Розенблатта типа омега-квадрат
т.е. предельным распределением этой статистики является классическое распределение [30], найденное как предельное для одновыборочной статистики критерия согласия омега-квадрат, известного также как критерий Крамера - Мизеса - Смирнова.
Действительно, сформулированное утверждение справедливо. Однако доказательство нетривиально.
Так, может показаться очевидным следующее утверждение.
Утверждение 1. Пусть f: [0; 1] → R1 – ограниченная функция, Gn(x) и G(x) – функции распределения, Gn(0) = G(0) =0, Gn(1) = G(1) = 1, причем Gn(x) → G(x) при всех х. Тогда
Это утверждение неверно (ср. [31, с.42]). Действительно, пусть f(x) = 1, если х рационально, и f(x) = 0, если х иррационально, G(x) =x, а Gn(x) имеет скачки величиной 2-n в точках m/2n, m = 1, 2, … , 2n при всех n =1, 2, … Тогда Gn(x) → G(x) при всех х, однако
при всех n =1, 2, … Следовательно, вопреки сформулированному выше утверждению 1,
т.е. соотношение (4) неверно.
Итак, сформулируем проблему. Пусть известно, что последовательность случайных функций fб(x, щ) сходится по распределению при б→∞ к случайной функции f(x,щ). Пусть последовательность случайных мер Fб(A,щ), определенных на множествах А из достаточно обширного семейства, сходится по распределению к вероятностной мере F(A) при б→∞. Если речь идет о конечномерном пространстве и меры задаются функциями распределения, то сходимость Fб(х,щ) к F(х) должна иметь место во всех точках непрерывности F(х). В каких случаях можно утверждать, что при б→∞ справедлив предельный переход
Выше показано, что, например, ограниченности fб(x, щ) для этого недостаточно.
Метод аппроксимации ступенчатыми функциями
Рассмотрим общий метод, позволяющий получить предельные распределения не только для статистик интегрального типа, но и для других статистических критериев, например, для критериев типа Колмогорова. Пусть T = {С1, С2, … , Сk} – разбиение пространства Х на непересекающиеся подмножества. Пусть в каждом элементе Сj разбиения T выделена точка xj, j = 1, 2, … , k. На множестве функций f: X → Y введем оператор AT: если x Сj, то
ATf(x) = f(xj), j = 1, 2, … . k. (5)
Тогда ATf – аппроксимация функции f ступенчатыми (кусочно-постоянными) функциями.
Пусть fб(x,щ) – последовательность случайных функций на Х, а К(∙) – функционал на множестве всех возможных их траекторий как функций от х. Для изучения распределения К(fб) методом аппроксимации ступенчатыми функциями используют разложение
К(fб) = К(АТfб) + {К(fб) - К(АТfб)}. (6)
Согласно (5) распределение первого слагаемого в (6) определяется конечномерным распределением случайного элемента, а именно, распределением вектора
(fб(x1,щ), fб(x2,щ), … fб(xk,щ)). (7)
В обычных постановках
предельной теории классических непараметрических
критериев распределение
(f(x1,щ), f(x2,щ), … f(xk,щ)). (8)
В соответствии с теорией наследования сходимости (приложение 1) при слабых условиях на функционал К(∙) из сходимости по распределению вектора (7) к вектору (8) следует сходимость по распределению К(АТfб) к К(АТf).
Используя аналогичное (6) разложение
К(f) = К(АТf) + {К(f) - К(АТf)}, (9)
можно устанавливать сходимость по распределению К(fб) к К(f) при б→∞ в два этапа: сначала выбрать разбиение Т так, чтобы вторые слагаемые в правых частях соотношений (6) и (9) были малы, а затем при фиксированном операторе АТ воспользоваться сходимостью по распределению К(АТfб) к К(АТf).
Рассмотрим простой пример применения метода аппроксимации ступенчатыми функциями.
Обобщение теоремы Хелли
Пусть f: [0; 1] → R1 – измеримая функция, Fn(x) – функции распределений, сосредоточенных на отрезке [0; 1]. Пусть Fn(x) сходятся в основном к функции распределения F(x), т.е.
для всех х, являющихся точками непрерывности F(x).
Утверждение 2. Если f(x) – непрерывная функция, то
(рассматриваются интегралы Лебега-Стилтьеса).
Утверждение 2 известно в литературе как первая теорема Хелли [27, с.344-346], вторая теорема Хелли [32, с.174-175], лемма Хелли-Брея [33, с.193-194].
Естественно поставить вопрос: при каких f из (10) следует (11)? Необходимо ввести условия и на Fn: если Fn ≡ F, то соотношение (11) верно для любой измеримой функции f, для которой интеграл в (11) существует. Поэтому рассмотрим следующую постановку.
Постановка 1. Пусть функция f такова, что для любой последовательности Fn, удовлетворяющей (10), справедливо (11). Что можно сказать о функции f?
В работах [28, 29] найдены следующие
необходимые и достаточные
Теорема 1. Пусть ограниченная на [0; 1] функция f интегрируема по Риману-Стилтьесу по функции распределения F(x). Тогда для любой последовательности функций распределения Fn, сходящейся в основном к F, имеет место предельный переход (11).
Теорема 2. Пусть функция f не интегрируема по Риману-Стилтьесу по функции распределения F(x). Тогда существует последовательность функций распределения Fn, сходящаяся в основном к F, для которой соотношение (11) не выполнено.
Теоремы 1 и 2 в совокупности дают необходимые и достаточные условия для f в постановке 1. А именно, необходимо и достаточно, чтобы ограниченная на [0; 1] функция f была интегрируема по Риману-Стилтьесу по F.
Напомним определение интегрируемости функции f по Риману-Стилтьесу по функции распределения F [27, с.341]. Рассмотрим разбиение T = {С1, С2, … , Сk}, где
Сi = [yi-1, yi), i = 1, 2, …, m – 1, Сm = [ym-1, ym], (12)
0 = y0 < y1 < y2 <…< ym = 1.
Выберем в Сi произвольную точку xi, i = 1, 2, …, m, и составим сумму
Если при max(yi – yi-1) → 0 эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления отрезка [0; 1], ни от выбора точек xi в каждом из элементов разбиения), то этот предел называется интегралом Римана-Стилтьеса от функции f по функции F по отрезку [0; 1] и обозначается символом, приведенным в правой части равенства (11).
Рассмотрим суммы Дарбу-
где
Ясно, что
SH(T) < S(T) < SB(T).
Необходимым и достаточным условием интегрируемости по Риману-Стилтьесу является следующее: для любой последовательности разбиений Tk, k = 1, 2, 3, … вида (12) такой, что max(yi – yi-1) → 0 при k→∞, имеем
Напомним, что согласно разделу П-3 приложения 1 колебанием д(f, B) функции f на множестве B называется д(f, B) = sup{|f(x) – f(y)|, x B, y B}. Поскольку
д(f, Сi) = Mi – mi,
то условие (13) можно записать в виде
Условие (14), допускающее обобщение с Х = [0; 1] и f: [0; 1] → R1 на X и f более общего вида, и будем использовать при доказательстве теорем 1 и 2.