Автор работы: Пользователь скрыл имя, 08 Декабря 2013 в 12:11, автореферат
Задачу интервального оценивания в самом общем виде можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что этот интервал покроет (накроет) оцениваемый параметр.
Для определения точности оценки θ_n^* в математической статистике пользуются доверительными интервалами, а для определения надежности - доверительными вероятностями. Раскроем сущность этих понятий.
Практическая работа №7
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
Основные понятия и формулы | ||
Доверительный интервал и доверительная вероятность | ||
Точечная оценка оцениваемого параметра Доверительный интервал Доверительная вероятность (надежность) |
[], где = , = | |
Интервальная оценка математического ожидания | ||
Дисперсия известна |
Дисперсия не известна | |
Интервальная оценка среднего квадратичного отклонения | ||
Интервальная оценка вероятности события | ||
Основные умения и навыки:
|
Доверительный интервал и доверительная вероятность
Оценки, рассматриваемые ранее, выражались одним числом и поэтому назывались точечными. Однако в ряде задач требуется не только найти для оцениваемого параметра числовое значение, но оценить его точность и надежность. Такого рода задачи очень важны при малом числе наблюдений, так как конечная оценка в значительной мере является случайной и приближенная замена на может привести к серьезным ошибкам.
Задачу
интервального оценивания в
Для определения точности оценки в математической статистике пользуются доверительными интервалами, а для определения надежности - доверительными вероятностями. Раскроем сущность этих понятий.
Доверительным интервалом для параметра называется такой интервал, относительно которого можно с заранее выбранной вероятностью (близкой к единице), утверждать, что он содержит неизвестное значение параметра . Пусть - несмещенная оценка параметра θ. Требуется оценить возможную при этом ошибку. По определенным правилам находят такое число , чтобы выполнялось соотношение:
или .
Равенство означает, что интервал [], где = , а = , заключает в себе оцениваемый параметр с вероятностью .
называют доверительной вероятностью или надежностью интервальной оценки, а значение - уровнем значимости. Нижняя и верхняя граница доверительного интервала и определяются по результатам наблюдений, следовательно, сам доверительный интервал является случайной величиной. В связи с этим говорят, что доверительный интервал покрывает оцениваемый параметр с вероятностью . Выбор определяется конкретными условиями решаемой задачи. Надежность принято выбирать равной 0,95; 0,99; 0,999 – тогда событие, состоящее в том, что интервал [], покрывает параметр будет практически достоверным.
При этом число характеризует точность интервальной оценки: чем меньше , тем оценка точнее и наоборот.
На
практике часто встречаются нормально
распределенные случайные величины
(или стремящиеся к
Интервальная оценка математического ожидания при известной дисперсии
Пусть случайная величина распределена по нормальному закону, причем математическое ожидание неизвестно, а дисперсия известна. Требуется оценить неизвестное математическое ожидание. По наблюдениям найдем точечную оценку математического ожидания. Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение: .
Доказано, что построение доверительного интервала в этом случае осуществляется по формуле:
,
где – значение стандартной нормальной величины, соответствующее надежности , а – функция Лапласа (см. таблицу Приложения 2). Очевидно, что увеличение надежности приводит к увеличению функции и соответственно увеличению параметра t, что в свою очередь увеличивает величину . То есть увеличение надежности оценки ведет к снижению ее точности (увеличению погрешности).
При этом точность оценки математического ожидания равна: . Очевидно, что с увеличением объема выборки n величина погрешности уменьшается, т.е. точность оценки повышается. Эта формула позволяет определить необходимый объем выборки для оценки математического ожидания с наперед заданной точностью и надежностью: .
Для вычисления значения можно воспользоваться статистической функцией НОРМСТОБР(1– α) мастера функций, где .
Пример 1. Анализ доходности акций на основе случайной выборки за 16 дней показал, что средняя доходность составляет 10,37%. Предполагая, что доходность акций подчиняется нормальному закону распределения с известной дисперсией, равной 4%2, определить:
а) ширину доверительного интервала для средней доходности с надежностью 0,97;
б) надежность того, что точность оценивания составит 0,98%;
в) минимальное число наблюдений, которое необходимо провести, чтобы с вероятностью 0,99 можно было утверждать, что средняя доходность заключена в интервале шириной 3%.
Так как дисперсия нормального распределения известна, по таблице Лапласа (Приложение 2):
а) для значения функции находим значение аргумента = 2,17, откуда ширина доверительного интервала средней доходности () составляет:
б) из оценки точности математического ожидания следует, что ; для значения аргумента находим значение функции Ф(1,96) = 0,475 и = 2∙0,475 = 0,95, т.е. при надежности 0,95 точность оценивания составит 0,98%;
в) для значения функции находим значение аргумента = 2,58 и по формуле определяем: , т.е. необходимо провести 12 измерений для обеспечения заданной точности (3%) и надежности (0,99).
Интервальная оценка математического ожидания при неизвестной дисперсии
Пусть случайная величина распределена по нормальному закону, причем математическое ожидание и дисперсия неизвестны. Требуется оценить неизвестное математическое ожидание. По наблюдениям найдем точечные оценки и S математического ожидания и дисперсии . Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение: .
Доказано, что построение доверительного интервала в этом случае осуществляется по формуле:
,
где – значение функции распределения Стьюдента (t-распределения) (табл. Приложения 3), соответствующее степеням свободы и надежности .
При этом точность оценки математического ожидания равна: .
Для вычисления можно воспользоваться статистической функцией СТЬЮДРАСПОБР(α; n - 1) мастера функций, где .
Пример 2. Анализ доходности акций на основе случайной выборки за 16 дней показал, что средняя доходность составляет 10,37% при рассеянии S=2,5%. Предполагая, что доходность акций подчиняется нормальному закону распределения, определить:
а) верхнюю границу доверительного интервала для средней доходности с надежностью 0,95;
б) надежность того, что средняя доходность заключена в интервале [].
Так как дисперсия нормального распределения неизвестна (и по выборке определена ее точечная оценка) используем функцию распределения Стьюдента (Приложение 3):
а) для заданной надежности 0,95 и числа степеней свободы = 16 – 1 = 15 найдем значение функции (0,95; 15) = 2,15 и верхняя граница доверительного интервала составит:
.
б) поскольку интервал симметричен относительно точечной оценки математического ожидания, точность оценки составляет 12,37 – 10,37 = 2%, тогда из формулы определяем параметр :
и по таблице t-распределения Стьюдента (Приложение 3) для числа степеней свободы = 16 – 1 = 15 берем ближайшее к полученному значению значение надежности 0,99.
Интервальная оценка среднего квадратичного отклонения и дисперсии
Пусть случайная величина распределена по нормальному закону, причем математическое ожидание и дисперсия неизвестны. Требуется оценить неизвестное среднее квадратичное отклонение, используя его точечную оценку S, найденную по выборке. Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение:
(при ).
Поскольку
дисперсия и среднее
Можно доказать, что построение доверительного интервала в этом случае для среднего квадратичного отклонения осуществляется по формуле:
,
где q – значение функции распределения Пирсона (*2-распределения) (Приложение 4), соответствующее степеням свободы и надежности .
При этом точность оценки среднего квадратичного отклонения равна: .
Для построения доверительного интервала для дисперсии нижнюю и верхнюю границу интервала среднего квадратичного отклонения возводят в квадрат.
Для вычисления параметра q можно воспользоваться статистической функцией ХИ2ОБР(α; n - 1) мастера функций, где .
Пример 3. Для анализа производительности труда были отобраны 15 работников предприятия. На основании проведенных испытаний была получена оценка исправленного среднего квадратичного отклонения 20 изд./ч. Предполагая, что производительность труда работников подчиняется нормальному закону распределения определить:
а) с надежностью
0,95 границы доверительного
б) надежность
того, что истинное значение
а) для заданной надежности 0,95 и числа степеней свободы = 15 – 1 = 14 по Приложению 4 найдем значение q = q(0,95;14) = 0,48; тогда границы доверительного интервала соответственно равны:
= и ,
т. е. доверительные интервалы для среднего квадратичного отклонения [10 изд./ч.; 30 изд./ч.] и для дисперсии [108 (изд./ч.)2; 876 (изд./ч.)2].
б) поскольку интервал симметричен относительно точечной оценки среднего квадратичного отклонения точность оценки составляет 34 – 20 = 14 изд./ч., тогда из формулы определяем параметр q:
и по таблице *2-распределения Пирсона (Приложение 4) для числа степеней свободы = 15 – 1 = 14 берем ближайшее к полученному значению q значение надежности 0,99.
Интервальная оценка вероятности события
При рассмотрении точечных оценок было показано, что "хорошей" оценкой вероятности события является частость w = m / n, где m – число испытаний, в которых произошло событие А, а n – общее число независимых испытаний, в каждом из которых событие А может произойти с вероятностью р или не произойти с вероятностью q = 1 – р (т.е. последовательность испытаний Бернулли).
Зададимся вероятностью и найдем границы, чтобы выполнялось соотношение:
.
Можно доказать, что построение доверительного интервала для вероятности в этом случае (при больших значениях n) осуществляется по формуле:
,
где – значение стандартной нормальной величины, соответствующее надежности , а – функция Лапласа (см. таблицу Приложения 2).
При этом точность оценки вероятности равна: .
Пример 4. При проведении анализа эффективности рекламы инструментальных наборов, размещенной в интернете, была организована случайная выборка, объем которой составил 500 человек. В результате проведенного опроса выяснилось, что для 200 человек источником информации послужили объявления, размещенные в сети. В предположении о биномиальном законе распределения определить:
а) с надежностью 0,95 нижнюю границу вероятности того, что один случайно отобранный покупатель воспользовался рекламой в интернете;
б) надежность того, что использование рекламы в интернете будет находиться в интервале [0,30;0,50].
Так как объем выборки достаточно большой, используем для построения доверительного интервала функцию Лапласа (Приложение 2):
а) для заданной надежности 0,95 определим значение функции Ф() = 0,95 /2 = 0,475, по таблицам функции Лапласа находим значение аргумента = 1,96, откуда нижняя граница доверительного интервала вероятности: .
б) поскольку интервал симметричен относительно точечной оценки вероятности точность оценки составляет , откуда , по таблице Приложения 2 найдем значение функции Лапласа Ф(4,56) = 0,499998, но = 2∙0,499998 = 0,999996, т.е. практически достоверное событие.
Задачи для самостоятельной работы
Задача 1. Случайная величина распределена по нормальному закону с дисперсией равной 9. Сделана случайная выборка с возвратом объема n = 25. Найти с надежностью 0,99: а) точность выборочной средней; б) интервальную оценку для неизвестного математического ожидания; в) доверительный интервал, если выборочная средняя равна 20,12.
Информация о работе Доверительный интервал и доверительная вероятность