Автор работы: Пользователь скрыл имя, 14 Октября 2013 в 19:24, курсовая работа
В практических наблюдениях мы обычно имеем совокупность наблюдений х1, х2, ... , хn, на основе которых требуется сделать те или иные выводы. Часто этих наблюдений много, поэтому возникает задача их компактного описания. В идеале таким описанием могло бы быть утверждение, что х1, х2, ... , хn являются выборкой, т.е. независимыми реализациями случайной величины с известным законом распределения F(x).
В практических наблюдениях мы обычно имеем совокупность наблюдений х1, х2, ... , хn, на основе которых требуется сделать те или иные выводы. Часто этих наблюдений много, поэтому возникает задача их компактного описания. В идеале таким описанием могло бы быть утверждение, что х1, х2, ... , хn являются выборкой, т.е. независимыми реализациями случайной величины x с известным законом распределения F(x). Это позволило бы теоретически произвести расчеты всех необходимых исследователю характеристик наблюдаемого явления.
Однако далеко не всегда мы можем утверждать, что х1, х2, ... , хn являются независимыми и одинаково распределенными случайными величинами. Во-первых, это необходимо проверить, а во-вторых, часто заведомо известно, что это не так. Поэтому для компактного описания совокупности наблюдений используют другие методы – методы описательной статистики.
Методами описательной статистики называются методы описания выборок х1, х2, ... , хn с помощью различных показателей и графиков. Достоинство методов описательной статистики в том, что ее простые и довольно информативные статистические показатели избавляют от необходимости просмотра большого количества значений выборки.
Показатели, описывающие выборку можно разбить на несколько групп:
Из перечисленных выше характеристик на практике по традиции чаще всего используют выборочные среднее, медиану и дисперсию (или стандартное отклонение). Однако для получения более точных и достоверных выводов необходимо использовать и другие показатели.
Особое внимание следует обратить на наличие в выборке выбросов – грубых, сильно отличающихся от основной массы, наблюдений. Большинство традиционных статистических методов весьма чувствительны к отклонениям от условий применимости метода. Поэтому выбросы могут не только исказить значение выборочных показателей, но и привести к ошибочным выводам. Подозрение о присутствии таких наблюдений должно возникнуть, если выборочная медиана сильно отличается от выборочного среднего, хотя в целом совокупность симметрична, или, если положение медианы сильно несимметрично относительно минимального и максимального элементов выборки. Проще всего обнаружить выбросы с помощью перехода от выборки к вариационному ряду или гистограмме с большим числом интервалов группировки.
Исходными данными является набор реализаций случайной величины (например, значения какой-либо величины, полученные при измерении). Размер выборки - n шт. Исходные данные оформить в виде таблицы (таблица 1).
Таблица 1 – Исходные данные
Номер реализации |
Значение |
Номер реализации |
Значение |
Номер реализации |
Значение |
Номер реализации |
Значение |
1... |
...n |
Для удобства работы с данными выборку преобразуют в вариационный ряд – ряд, в котором элементы выборки упорядочиваются по возрастанию.
Этапы выполнения:
Таблица 2 – Вариационный ряд с отклонениями относительно x0 = <значение>1
Номер элемента |
Элемент |
Отклонение |
Номер элемента |
Элемент |
Отклонение |
1... |
n |
Этапы выполнения:
n |
r |
40-100 100-500 5000-10000 |
7-9 8-12 10-16 |
При небольших выборках .
Отношение частоты mi к общему числу наблюдений n называется частостью:
Частость представляет собой эмпирическую оценку вероятности попадания результатов наблюдений Хj в i интервал.
Определить частости и результаты занести в таблицу 3.
Полученные результаты проверить по условию .
Эмпирическая плотность вероятностей равна:
Определить эмпирическую плотность вероятности, результаты занести в таблицу 3.
Таблица 3 – Расчетные данные
Номера интервалов |
Границы интервалов, <размерность> |
Частота, mi |
Частость, |
Эмпирическая плотность вероятности pi |
Середина интервала xi | |
xн |
xв | |||||
1... |
||||||
|
|
Для дальнейших геометрических построений необходимы значения середины интервалов xi. Определить их, результаты занести в таблицу 3.
Этапы выполнения2:
Пример полигона приведен на рисунке 1.
Рисунок 1 – Пример полигона
Этапы выполнения:
Пример гистограммы распределения приведен на рисунке 2.
Рисунок 2 – Пример гистограммы распределения
В середине каждого интервала по оси абсцисс ордината возрастает скачком на значение, соответствующее .
Этапы выполнения:
Значения для каждого интервала называют кумулятивной частостью, а сумму - кумулятивной частотой.
Пример гистограммы эмпирической функции распределения приведен на рисунке 3.
Рисунок 3 – Пример эмпирической функции распределения
С помощью гистограммы распределения можно рассчитать параметры распределения:
Однако все расчеты можно значительно упростить, если все отклонения размеров yi выражать относительными величинами в долях ширины интервала Dx (целыми числами), а за начало отсчета отклонений принять условный нуль x0, равный середине интервала, имеющего наибольшую частоту mi:
Относительные начальные моменты в этом случае определяются:
Возвращаясь к размерностям измеряемой величины, получим:
Результаты
расчета относительных
Таблица 4 – Расчетные данные моментов
Номер интервалов |
Середина интервала xi, <размерность> |
yi |
|
|
|
mi |
miyi |
|
|
|
1 ... |
||||||||||
Суммы |
||||||||||
Начальные моменты |
||||||||||
Обозначения |
а1 |
а2 |
а3 |
а4 |
Этапы выполнения:
Полученные результаты свести в таблицу 5 (нечисловые результаты заменить ссылками на рисунки и приложения). На рисунках в приложениях нанести (если возможно) параметры.
Таблица 5 – Показатели описательной статистики для выборки n=< >
Показатель |
Значение |
|
|
|
Приложение 2 Приложение 2 |
|
Приложение 2 Приложение 3 Таблица 3 |