Математическая статистика и теория вероятности

Автор работы: Пользователь скрыл имя, 09 Декабря 2013 в 21:33, лекция

Краткое описание

Теория вероятностей – раздел математики, изучающий закономерности, проявляющиеся при массовом повторении случайных событий.
Теория вероятностей не изучает уникальные события.
Вероятность – количественная мера объективной оценки наступления некоторого события.

Прикрепленные файлы: 1 файл

Matematicheskaya_statistika_i_teoria_veroyatnosti1.doc

— 461.00 Кб (Скачать документ)
  1. Плотность распределения определена всюду, кроме, возможно, конечного числа точек в которых производная не существует.
  2. F(x)≥0
  3. P(a<X<b) = ∫f(x)dx
  4. Нормированность плотности:

            -∞

              ∫ f(x)dx=1

           +∞

  1. Восстановление функции распределения:

Геометрический смысл плотности:

 

S => P(a≤X≤b)

 

Каждая функция и плотность распределения обязательно относятся к некоторой случайной величине.

Пример: рассмотрим случайную величину, функция распределения которой  определяется формулой:

                0, x<0

F(x)=   x, 0≤x≤1

            x, x>1

Данная случайная величина является непрерывной. Функция F(x) в точках х=0 и х=1 производной не имеет, т.к. график функции имеет излом. Плотность имеет вид:

                0, x<0

F(x)=   1, 0<x<1

            0, x>1

D(f)=(-∞;0) ∩ (0;1) ∩ (1;+∞)

Данная функция распределения  является частным случаем равномерного распределения случайной величины.

 

  1. Числовые характеристики случайной величины.

1)Математическое ожидание – является обобщением понятия среднего арифметического. Обозначение: М(Х).

Вычисляется по формулам:

1Для дискретных  величин:

2Для непрерывных величин:

Размерность математического ожидания совпадает  с размерностью самой случайной  величины. Свойства математического ожидания:

1.М (const)=const

2.M(kx)=kM(x)

3.M(x+y)=M(x)+M(y)

4.Для независимых случайных величин:

M(xy)=M(x)*M(y)

 

2)Дисперсия – характеризует степень разброса значений случайной величины вокруг математического ожидания.

Общая формула:

 

Более удобная  для расчетов формула:

Для дискретных случайных величин:

Для непрерывных случайных величин:

Размерность дисперсии равна квадрату размерности случайной величины.

Свойства  дисперсии:

1D(const)=0

2D(x)≥0

3D(Kx)=k2D(x)

4Для независимых случайных величин:

D(X+Y)=D(X)+D(Y)

5 Среднеквадратическое отклонение – так же характеризует степень разброса и вычисляется по формуле:

Размерность среднеквадратического отклонения совпадает с размерностью случайной  величины.

 

Для любой  случайной величины, величина Х=Х-М(Х), называется центрированной величиной. Её математическое ожидание = 0.

Для любой  случайной величины Х  – величина называется нормированной случайной величиной. Её математическое ожидание = 0, а среднеквадратическое отклонение = 1.

 

4)Мода – наиболее вероятное значение случайной величины.

Мода может  не существовать или быть определена неоднозначно.

 

5)Медиана  – величина а, обладающая свойством Р(Х<a)=P(X>a).

6)Начальный  момент порядка к 

7)Центральный  момент порядка к определяется  выражением 

 

Основные  распределения случайной величины.

1)Дискретные случайные величины.

1.Биномиальное распределение имеет случайная величина, принимающая значения {0, 1, 2,...n} с вероятностями наступления тех событий, о которых говорится в формуле Бернулли , Р – параметр распределения.

Для биномиальной случайной величины Х:

 

2.Распределеие Пуассона имеет случайная величина, принимающая бесконечный ряд значений {0, 1, 2,...n} с вероятностями:

Для данной случайной величины:

D(X)=λ > 0 – параметр распределения.

Данный закон распределения  иногда называется законом редких событий.

 

2)Непрерывные случайные величины.

1Равномерное распределение имеет случайная величина Х, если она принимает значение только из некоторого отрезка [a,b] и её плотность распределения постоянна.

Значение С может быть определено из условия нормированности плотности.

C=const.

Для данной случайной величины М(Х)=а+б/2

 

2Экспоненциальное или показательное распределение имеет непрерывную случайную величину, если её плотность F(x) задается формулой: 

Λ - параметр данного распределения.

Λ>0

М(Х)=∫хλе (в степени –λх)dx = 1/λ

D(x)=∫(x-1/λ) λe(в степени –λх) dx=1/λ2

 

Свойства некоторых специальных  функций.

В теории вероятностей и в математической статистике исключительно важную роль играют функции, обозначаемые φ. Функция φ

 определяется равенством:

φ(х)=1/√2п(е(-х/2))

 

Свойства функции φ(х):

1Д(φ)=(-∞;+∞)

2Функция четная 

3Функция всегда положительная  φ(х)>0

4 φ убывает при х>0 и возрастает при  х<0

5 φ(0)=1/√2п=0,4

6 lim φ(x)=0

7Свойство нормированности, достигающейся выбором множителя 1/√2п: ∫ φ(х)dx=1

8Функция φ(х) имеет перегиб  в точке +-1.

 

 

2Функция Φ(х) определяется равенством:

Φ(х)=∫φ(t)dt

Данный интеграл называется интегралом ошибок.

Свойства функции Φ:

1Д(Φ)= (-∞;+∞)

2Функция нечетная

3Справедливо соотношение:

Ф’(х)= φ(х)

4Ф(х) возрастает на всей числовой  оси

5Ф(0)=0

6Ф(х)>0 при х>0  и Ф(х)<0 при х<0

7lim Ф(х)=+-1/2

 

 

3)Нормальное распределение.

Нормальное распределение играет особую роль в теории вероятностей и математической статистике по следующим причинам:

1Часто возникает в технике,  экономике и естественных науках.

2Сумма большого числа любых  случайных величин из которых  нет явно преобладающих, распределены примерно по нормальному закону.

Непрерывная случайная величина распределена по нормальному закону, если её плотность  имеет вид:

А – математическое ожидание случайной  величины, а σ- случайная величина.

В частном случае при а=0, σ=1 данное распределение называется распределением Гаусса.

Обозначение: Х~N(а, σ).

Случайная величина Х имеет нормальный закон распределения с параметрами а и σ.

 

Графики плотности:

σ.2< σ1

 

Вычислим функцию распределения  для случайной величины, распределенной по нормальному закону.

F(x)=òf(t)dt=ò(1/σ)φ(t-a/σ)dt=1/σòφ(z)σdz=òφ(z)dz=òφ(z)dz+òφ(z)dz=1/2 + Ф(х-а/σ)

 

Из данной формулы вытекает следующая  важная формула. Если Х~N(а, σ), Р(c<X<d)=F(d)-f(c)=Ф(d-a/σ) - Ф(c-a/σ)

В частном случае, при а=0 и σ=1, получаем формулу:

P(c<X<d)=Ф(d) - Ф(c)

Важное практическое значение имеет  правило «трех сигма»:

Вероятность отклонения значений случайной  величины, распределенной по нормальному  закону, вероятность отклонения от математического ожидания на величину, большую трех среднеквадратических отклонений, пренебрежимо мала и составляет менее 0,3%.

Математическое выражение правила:

Х~N(а, σ)

Р( |X-a|>3σ)<0,3%

Некоторые простые свойства нормального  закона:

1 Р(Х-а)1/2, Р(Х<a)=1/2

2 b<a, P(X>b)=P(b<X<+∞)=1/2-Ф(b-a/σ) <1/2

3 Если известно значение а и известно значение P(X>b)=s, sϵ(0:1/2), то можно определить однозначно значение σ для данной случайной величины.

Варьируя значение σ (0; +∞) можем добиться нужного значения площади. Формально решение данной задачи сводится к решению уравнения относительно σ. 1/2-Ф(b-a/σ)=s

 

4 Х1~N(a1,σ1), Х2~N(a2,σ2) => X1+X2~N(a1+a2; √σ1(2)+σ2(2))

5 Х~N(а,σ), kХ~N(kа,kσ)

Некоторые специальные распределения  связаны с нормальным законом.

1Распределение Пирсона (  (хи - квадрат))

Пусть х1, х2, хn~N(0,1) – независимые  случайные величины, тогда случайная  величина вида:   называется распределенной по закону хи - квадрат с n степенями свободы. (df=n)

Плотность данной случайной величины представляется формулой:

Постоянная Сn определяется из условия нормированности плотности.

Основные свойства:

1) ≥0

2)Если  (n) и (m) независимы, то:

(n)+ (m) = (n+m)

Теорема важна для эконометрики.

3) х1, х2, хn~N(0,1)

Если независимы, то случайная величина вида

 

2Распределение Стьюдента (t – распределение).

Пусть Х~N(0,1), (n) – независимые случайные величины, тогда случайная величина вида

называется распределенной по закону Стьюдента с n степенями свободы.

График плотности данного распределения  похож на график плотности нормального  распределения, только более пологий.

3Распределение Фишера (f – распределение)

Пусть (n) и (m) независимые случайные величины. Тогда случайные величины вида

(n)/n/ (m)/m

Называются распределенными по Фишеру с (n;m) степенями свободы.

 

Корреляция – пусть х и  у дискретные случайные величины.

X:

Х|x1 x2 xn

Р|p1 p2 pn

 

Y:

Y|y1 y2 yn

Q|q1 q2 qn

 

Ковариацией случайной величины (х,у) называется величина м((х-м(х))(у-м(у)).

Обозначение К(Х,Y), Кy,х

Для дискретных случайных величин  ковариация принимает вид:

Σin Σjm(xi-M(x))(yi-M(y)sij

Sij=Р(X=xi)(Y=yj)

Если Х и Y независимы, то К(Х,Y)=0

Коэффициент корреляции вычисляется  по формуле:

Коэффициент безразмерный. Для независимых  случайных величин коэффициент  корреляции =0.

Если |r|=1, то это означает наличие явной линейной зависимости между случайными величинами Х и Y.

Y=а+bX

r=1 => b>0

r= -1 => b<0

 

Законы больших  чисел.

Неравенство Чебышева. Неформальное выражение: вероятность того, что  центрированная и нормированная  случайная величина существенно  отклонится от 0, очень мала.

Неравенство имеет смысл при  а>1. Данное неравенство более общее, но менее точное, чем неравенство из правила 3-х сигма.

 

Неравенство Чебышева может эффективно применяться для сумм случайных  величин. Пусть Х1, Х2,..., Хn – независимые, одинаково распределенные случайные величины. Применим неравенство Чебышева к случайным величинам вида:

1/n (X1+X2+…+Xn)

M(1/n(X1+X2+…+Xn))=1/n(M(X1)+M(X2)+...+M(Xn))=M(X)

D(1/n(X1+X2+…+Xn)=1/n2(D(X1)+D(X2)+...+D(Xn))=1/n*D(X)

 

P(|Y-M(X)/(σ(X)/√n)|>t)<1/t2

И эквивалентное ему равенство:

P(|Y-M(X)|>tσ(X)/√n)<1/t2

 

Введем обозначение:

Пусть S=tσ(X)/√n => t=S√n/σ(X)

 

P(|Y-M(X)|>S)<(σ(X)/S√n)2

P(|Y-M(X)|>S)<(σ2(X)/S2√n)

 

Вывод: среднеарифметические случайные  величины очень мало отклоняются  от математического ожидания каждой случайной величины. Вероятность  отклонения убывает обратно пропорционально  числу слагаемых n.

 

Закон больших чисел.

Неформальное выражение закона больших чисел: при многократном повторении многотипных случайных явлений, их усредненные характеристики практически перестают быть случайными и могут быть предсказаны с высокой степенью точности.

 

Формулировка закона больших чисел:

Пусть Х1, Х2,..., Хn – независимые, одинаково распределенные случайные величины, тогда:

Важным частным случаем закона больших чисел является теорема Бернулли: если вероятность наступления А в каждом из n однотипных опытов постоянна и А=р, то справедливо неравенство:

 

Где m – число наступлений событий А в n опытах.

 

Теорема Бернулли позволяет оценить  неизвестную вероятность некоторого события А при наличии результатов  достаточно большого числа опытов n.

Пояснение к теореме Бернулли:

Введем случайную величину

  Xi {1, А наступило

       {0, А не наступило

Индикатор наступления события  А:

х|0   |1             М(Хi)=Р(0*(1-р)+1*р)

р|1-p|p             Х1, Х2,..., Хn=m

Подставляем вместо m и р их выражения, приходим к исходной форме закона больших чисел.

 

Центральная предельная теорема – устанавливает условия, при которых возникает нормальный закон распределения. Эти условия часто выполняются на практике. ЦПТ лежит в основе широкого класса результатов и методов в статистике, эконометрике и д.р. ЦПТ уточняет ЗБЧ и иногда называется его количественной формой.

Неформальное выражение ЦПТ: сумма  большого числа независимых СВ при  неограниченном увеличении числа слагаемых  имеет закон распределения, неограниченно  приближающийся к НЗ при условии, что в сумме нет явно преобладающих  слагаемых.

Формулировка ЦПТ: пусть Х1, Х2,...,Хn – последовательность одинаково распределенных независимых СВ и

Тогда:

 и при этом <d~ Ф(d)-Ф(с).

В частном случае, при c=t, d=t, t>0

<t~Ф(t) –Ф(-t)=2Ф(t)

Более удобный для практики вид:

Важным частным случаем ЦПТ  являются предельные теоремы Муавра – Лапласа. В них рассматриваются  ситуации, связанные с многократно  повторяющимися формулами (при постоянных условиях). Пусть событие А, в каждом из n независимых опытов наступает с вероятностью р. Введем СВ Х, равную числу наступлений события А в n опытах, тогда ,

 

По ЦПТ   ,

следовательно

Локальная предельная теорема.

 Р(Х=m) ~ 1/√npq*Ф(ϻ)

ϻ=m-np/√npq

Точное значение вероятности

Р(Х=m)=(Pn, m (A) и может быть вычислено по формуле Бернулли.

Интегральная предельная теорема

Запись теоремы  в нормализованном виде:

Простые практические правила для применения предельных теорем: при npq>9 данные теоремы дают достаточно точный результат. Достаточно точные результаты дает применение распределения Пуассона.

В партии 1000 единиц товара. Вероятность появления брака  равно 0,01. Найти вероятность: а) Р(m=n), P(m<10), где m – число брака.

Расчет по формуле  Бернулли:

Применяем локальную  предельную теорему:

 

 

 

 

 

 

 

 

 

 

Полезные сайты и материалы:

  • http://www.toehelp.ru
  • http://bankzadach.ru/teoriya-veroyatnostey
  • http://allmatematika.ru
  • http://exir.ru
  • http://integraloff.net/TepBep/
  • http://www.pm298.ru/mverstat.php

 

  • Теория вероятностей. Задачи с решениями.  Золотаревская Д.И. 

 

  • Задачи и упражнения по теории вероятностей.  Вентцель Е.С., Овчаров Л.А.

Информация о работе Математическая статистика и теория вероятности