Автор работы: Пользователь скрыл имя, 29 Сентября 2013 в 12:32, лекция
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.
Первая задача математической статистики — указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;
§ 1.Основные задачи математической статистики
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.
Первая задача математической статистики — указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики — разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:
а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;
б) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.
Современная математическая статистика
разрабатывает способы
Итак, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
2.Генеральная совокупность и выборка.
Пусть требуется исследовать какой-либо признак, свойственный совокупности однородных объектов. Сплошное обследование не всегда целесообразно, а во многих случаях невозможно или бессмысленно. Тогда из всей совокупности объектов случайно отбирают ограниченное количество объектов и подвергают их исследованию. Выборкой (выборочной совокупностью) называют множество случайно отобранных объектов, а всю совокупность объектов, из которых производится выборка, называют генеральной совокупностью. Число объектов совокупности называют объемом этой совокупности. Чтобы по выборке достаточно уверенно судить об изучаемом признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли, то есть в выборке были представлены характерные черты генеральной совокупности, выборка должна быть представительной (репрезентативной). Поэтому случайный отбор – непременное требование к выборке – все объекты генеральной совокупности должны иметь одинаковую вероятность попасть в выборку.
Примечание. Генеральная совокупность может состоять из бесконечного количества объектов.
Определение. Повторной называют выборку, при которой отбираемый объект возвращается в генеральную совокупность перед отбором следующего.
Определение. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. Исследуемые признаки могут быть количественными и качественными (атрибутивными). Количественные признаки подразделяются на дискретные и непрерывные. Значения дискретного признака изображаются отдельными изолированными точками числовой прямой. Возможные значения непрерывного признака сплошь заполняют некоторый промежуток числовой оси.
Исследуемый признак объектов генеральной совокупности математически трактуется как случайная величина ξ, наблюдаемая в опыте. Пусть имеется урна, в которой содержатся карточки с числами X1, X2, …, Xn (2.1). Из нее наудачу вынимают n карточек с числами x1, x2, …, xn (2.2). Генеральной совокупностью можно считать набор чисел (2.1), выборкой – (2.2). Если выборка бесповторная, то каждый упорядоченный набор (Xi1, Xi2,…,Xin), где могут быть повторения, появляется с вероятностью 1/Nn. Если выборка бесповторная, то каждое подмножество {Xi1,Xi2,…,X1n} мощности n из всего множества чисел (2.1) появляется с вероятностью 1/CnN. В случае выборки с возвращением, x1, x2, …, xn являются случайными величинами с законом распределения наблюдаемой случайно величины ξ, каждое из возможных значений которой (2.1) попадает в выборку (2.2) с одной и той же вероятностью 1/N (если все чилса Xi – различны ). В этом случае говорим, что (2.2) – независимая выборка объема n. Упорядочивая элементы выборки по возрастанию, получим вариационный ряд. Введем функцию µn(x), значение которой для каждого действительного x равно числу элементов выборки (2.2), значения которой меньше x. Функцию называют эмпирической функцией распределения, соответствующей данной выборке. Функцию распределения F(x) наблюдаемой случайной величины ξ называют теоретической функцией распределения, а – ее эмпирическим аналогом. Для каждого действительного x, является случайной величиной, возможными значениями которой являются числа 0, , причем (2.3), где k=0,1,2,…,n.
Теорема. ∀ x ∈ R и ∀ ԑ>0.
Доказательство. Из определения и (2.3) следует, что частоста события { ξ <x}- успеха в n независимых испытаниях Бернулли. По закону больших чисел (теорема Бернулли), относительная частота события сходится по вероятности к вероятности этого события. В нашем случае вероятность успеха равна P({ξ <x})=F(x). Таким образом, сходится по вероятности к F(x), то есть выполняется соотношение (2.4). Из этой теоремы следует, что при очень большом объеме выборки значение эмпирической функции распределения в каждой точке может служить приближенным значением теоретической функции F(x) в этой точке.
Примечание. Следует отличать сходимость по вероятности от сходимости по распределению.
Определение. Говорят, что последовательность случайных величин {ξn} сходится по распределению к случайной величине ξ, если , где – функция распределения ξn. , а - функция распределения ξ.
3. Выборочные характеристики.
Эмпирическая функция
Выборочной модой называется наиболее часто встречающееся в выборке значение.
Медианой называются выборочные значения, находящиеся на середине вариационного ряда.
Выборочное среднее: . Если xi встречается ni раз, то формулу можно упростить:
Выборочная дисперсия Dв=, Dв= – если есть одинаковые слагаемые.
Выборочный момент: – выборочный начальный момент k-го порядка.
Центральный момент: – выборочный центральный момент k-го порядка. Эти характеристики называют статистическими аналогами числовых характеристик изучаемой случайной величины ξ.
Теорема 1: Мат. ожидание выборочной среды равно m, где m – мат. ожидание случайной величины ξ. M=m, m=Mξ. Доказательство: пусть дана выборка x1,x2,…,xn. Выборочные значения xi являются случайными, поэтому их можно рассматривать как случайные величины, имеющие тот де закон распределения, что и случайная величина ξ. Используя свойства мат. ожидания случайной величины, получим следующие рассуждения: M=M()=, т. к. Mxi=Mξ=m.
Теорема 2: для выборки с повторениями D=, где D=Dξ. Доказательство: если выборка повторная, то x1,x2,…,xn являются независимыми случайными величинами, причем Dxi=Dξ. Воспользуемся свойствами дисперсии независимой случайной величины: D=D()=.
Теорема 3: если выборка без повторений, то D=*, где D – дисперсия самой случайной величины, N – Объем генеральной совокупности, n – объем выборки, Nn.
Замечание: по теореме Чебышева P(|-M. Если выборка повторная, то правая часть неравенства принимает вид: = при n. Если бесповторная, то: = при Nn, т. к. ==0.
При N множитель при фиксированном n.
При большом объеме N и малом n различие между бесповторной и повторной выборкой мало ощутимо.
4. Статистическое распределение выборки.
Наблюдаемые значения называют вариантами. Располагая варианты в виде неубывающей последовательности, получают вариационный ряд.
Определение. Число , показывающее, сколько раз варианта встречается в вариационном ряду, называется абсолютной частотой значения .
Определение. Относительной частотой значения признака называется отношение соответствующей абсолютной частоты к общему объему выборки, то есть .
Определение. Статистическим распределением выборки называют перечень вариант вариационного ряда и соответствующих им частот (абсолютных или относительных).
Статистическое распределение выборки удобно представить в виде таблиц абсолютных и относительных частот.
Варианта |
… |
|||
Абсолютная частота |
… |
Варианта |
… |
|||
Относительная частота |
… |
Заметим, что – объем выборки; .
Выборочные характеристики удобно вычислить по формулам:
; ; ; и т.д.
Примечание. В математической литературе нередко термином «частота» одни авторы называют абсолютную частоту, а другие – относительную частоту. Мы в дальнейшем будем называть относительною частоту одним словом «частота» в тех случаях, где это не вызывает разноречий.
Статистическое
распределение выборки и
Определение. Полигоном абсолютных частот называется ломаная линия, соединяющая точки . Полигоном относительных частот называется ломаная линия, соединяющая точки .
Определение. Число , показывающее, сколько в вариационном ряду имеется значений признака, меньших , называется накопленной абсолютной частотой. Накопленной отноительной частотой значения признака называется отношение соответствующей накопленной абсолютной частоты к общему объему выборки.
Определение. Ломаную линию, соединяющую точки или , называют линией накопленных частот или кумулятой.
5. Распределения случайных
величин, используемые в
Нормальный закон распределения
Показательное распределение
Распределение Стьюдента
Хи-квадрат распределение
Теорема 1. Если ξ 1, ξ 2, …, ξ n – независимые нормально распределенные случайные величины с параметрами Mξ I = 0, σξ I = 1, то является случайной величиной, имеющее распределение хи-квадрат с n степенями свободы.
Теорема 2. Если ξ 0, ξ 1, ξ 2, …, ξ n – независимые нормально распределенные случайные величины с параметрами Mξ I = 0, σξ I = 1, то случайная величина имеет распределение Стьюдента с n степенями свободы.
Теорема 3. Если ξ 1, ξ 2, …, ξ n1, η 1, η 2, …, η n2 n – независимые нормально распределенные случайные величины с параметрами Mξ I = 0, Mη I = 0, σξ I = 1, ση I = 1 то случайная величина имеет распределение Фишера-Снедекора с n 1, n 2 степенями свободы.
6. Точечные оценки и их свойства.
Во многих случаях вид функции
распределения исследуемой
Например:
Если ξ-результат прямого измерения некоторой физической постоянной при отсутствии систематических ошибок, то можно считать, что ξ имеет нормальное распределение и задача сводится к нахождению 2х параметров этого распределения: a=Mξ и Ϭ=
Другими словами, ни при каком объеме выборки n невозможно найти точное значение θ, а только приближенное его значение θ*, которое называется оценкой параметра θ. θ≈θ*. Оценка параметра является случайной величиной, которая меняется от выборки к выборке. Она зависит как от объема выборки, так и от выбранных значений .
Рассмотрим условия
Оценка θ* параметра θ называется несмещенной , если при любом возможном значении θ, Mθ*=θ
Оценка θ* параметра θ называется состоятельной, если она сходится по вероятности к θ, то есть θ*→θ , то есть =1
Эффективной называют такую оценку, параметры которой при заданном объеме выборки n имеют наименьшую возможную дисперсию.
Рассмотрим независимую выборку
Теорема 1.
Если при n →∞ Mθ*→θ и Dθ*→0, то θ* - состоятельная оценка параметра θ.
Док-во:
Применим неравенство Чебушева: для всех ε>0. Если n→∞, то , получим следует
Это означает, что для любого наперед заданного ε>0 с вероятностью близкой к 1 начиная с некоторого n, выполняется неравенство . С другой стороны, по условию , поэтому для любого ε>0 , будет выполняться неравенство
Рассмотрим
следовательно θ* - состоятельная оценка. Теорема доказана.
Теорема 2. Выборочная средняя является несмещенной и состоятельной оценкой генеральной средней.
Теорема 3. Выборочная дисперсия не является несмещенной оценкой генеральной дисперсии Dξ.
Следствие:
несмещенной оценкой
=Dξ
-исправленная выборочная дисперсия, является несмещенной оценкой Dξ
Информация о работе Основные задачи математической статистики