Обработка двумерной случайной выборки

Автор работы: Пользователь скрыл имя, 09 Июня 2013 в 12:14, курсовая работа

Краткое описание

Теория вероятностей является одним из классических разделов математики. Вероятностные и статистические методы в настоящее время глубоко проникли в приложения. Они используются в физике, технике, экономке, биологии и медицине. Особенно возросла их роль в связи с развитием вычислительной техники.

Содержание

Введение…………………………………………………………………..5
1.Обработка одномерной случайной выборки…………………………..6
1.1. Нахождение точечных оценок для не сгруппированной выборки…………………………………………………………………….6
1.2. Нахождение точечных оценок для сгруппированной выборки…………………………………………………………………....7
1.3. Построения гистограммы функций распределения……………............................................................................9
1.4. Расчёт критерия Пирсона…………………………………...15
1.5. Расчёт критерия Колмогорова……………………………...17
2. Обработка двумерной случайной выборки………………………….17
2.1. Построение поля рассеивания, гипотеза о виде корреляционной зависимости……………………………………….…18
2.2. Построение корреляционной таблицы……………………..22
2.3.Расчёт коэффициентов уравнения прямой регрессии……….23
2.4. Нахождение выборочного коэффициента корреляции….….25
2.5.Расчёт коэффициентов уравнения криволинейной регрессии…………………………………………………………………27
2.6. Нахождение корреляционного отношения…………………28
2.7.Расчёт критерия Фишера……………………………………...29
Заключение……………………………………………………………….31
Литература………………………………………………………………..

Прикрепленные файлы: 1 файл

записка тв.docx

— 1.94 Мб (Скачать документ)

 

Содержание

Введение…………………………………………………………………..5

1.Обработка одномерной случайной выборки…………………………..6

1.1. Нахождение  точечных оценок для не сгруппированной  выборки…………………………………………………………………….6

1.2. Нахождение точечных оценок  для сгруппированной выборки…………………………………………………………………....7

1.3. Построения гистограммы функций  распределения……………............................................................................9

1.4. Расчёт критерия Пирсона…………………………………...15

1.5. Расчёт критерия Колмогорова……………………………...17

2. Обработка двумерной случайной выборки………………………….17

2.1. Построение поля рассеивания,  гипотеза о виде корреляционной  зависимости……………………………………….…18

2.2. Построение корреляционной таблицы……………………..22

2.3.Расчёт коэффициентов уравнения прямой регрессии……….23

2.4. Нахождение выборочного коэффициента корреляции….….25

2.5. Расчёт коэффициентов уравнения криволинейной регрессии…………………………………………………………………27

2.6. Нахождение корреляционного отношения…………………28

2.7.Расчёт критерия Фишера……………………………………...29

Заключение……………………………………………………………….31

Литература………………………………………………………………..32

Приложения…………………………………………………………….....33

 

 

 

 

 

 

 

 

 

 

Введение.

Теория вероятностей является одним  из классических разделов математики. Вероятностные и статистические методы в настоящее время глубоко  проникли в приложения. Они используются в физике, технике, экономке, биологии и медицине. Особенно возросла их роль в связи с развитием вычислительной техники.

Например, для изучения физических явлений производят наблюдения или  опыты. Их результаты обычно регистрируют в виде значений некоторых наблюдаемых  величин. При повторении опытов мы обнаруживаем разброс их результатов. Например, повторяя измерения одной и той же величины одним и тем же прибором при  сохранении определенных условий (температура, влажность и т.п.), мы получаем результаты, которые хоть немного, но все же отличаются друг от друга. Даже многократные измерения  не дают возможности точно предсказать  результат следующего измерения. В  этом смысле говорят, что результат  измерения есть величина случайная. Еще более наглядным примером случайной величины может служить  номер выигрышного билета в лотерее. Можно привести много других примеров случайных величин. Все же и в  мире случайностей обнаруживаются определенные закономерности. Математический аппарат  для изучения таких закономерностей  и дает теория вероятностей. Таким  образом, теория вероятностей занимается математическим анализом случайных  событий и связанных с ними случайных величин.

 

 

 

 

 

 

 

1.Обработка одномерной случайной выборки.

1.1. Нахождение  точечных оценок для не сгруппированной  выборки.

Математи́ческое ожида́ние — среднее значение случайной величины, распределение вероятностей случайной величины. Для несгруппированной выборки находится по формуле:

 

где – значение из выборки,   – величина выборки.

Дисперсия - мера разброса данной случайной величины, то есть её отклонения от математического ожидания. Выборочная дисперсия равна:

 

Среднеквадратичное  отклонение (СКО) - показатель рассеивания значений случайной величины относительно её математического ожидания, вычисляется по формуле:

ϭ 

Ассиметрия - величина, характеризующая асимметрию распределения данной случайной величины. Коэффициент асимметрии A статистического распределения определяется по формуле:  

Коэффициент эксцесса - мера остроты пика распределения случайной величины. Эксцесс E статистического распределения определяется по формуле: 

 

 

 

 

 

1.2. Нахождение  точечных оценок для сгруппированной  выборки.

Изначально  вся выборка упорядочивается  по убыванию.

Количество  интервалов, на которые необходимо разбить  полученную выборку определяется по формуле: k = (1 + 3.32 * log10 (n) );

Данные  о выборке Х:

Выборка: 100

Величина: 0,475

Минимум = 0,0191

Максимум = 3,82Количество интервалов: 8

Интервалы: 1) - 12; 2) - 24; 3) - 28; 4) - 23; 5) - 6; 6) - 4; 7) - 2; 8) - 0;

О выборке  У :

Выборка: 100

Величина: 0,406

Минимум = -0,076

Максимум = 3,17

Количество  интервалов: 8

Интервалы: 1) - 2; 2) - 2; 3) - 5; 4) - 13; 5) - 32; 6) - 28; 7) - 9; 8) - 8;

Математическое  ожидание для сгруппированной выборки: 

 

где где , – границы интервала,     – вероятность попадания в этот интервал.

Дисперсия:  

Среднеквадратическое  отклонение:

 

 

 

Ассиметрия:

 

Эксцесс:

 

Погрешностью  является разность значений точечных оценок, полученных для обоих выборок, взятая по модулю:

 ΔМ= |Мнс - Мс|, ΔD= |Dнс - Dс|, Δ ϭ = | ϭ нс - ϭ с|, ΔA= |Aнс - Aс|, ΔE= |Eнс - Eс|.

Таблица со значениями расчётов представлены на рисунке 1.1. и рисунке 1.2.

Рисунок 1.1. Таблица расчета точечных оценок для выборки Х

Рисунок 1.2. Таблица расчета точечных оценок для выборки У

Проанализируем  полученные данные. Маленькая погрешность  расчётов  свидетельствует о правильности вычислений как не сгруппированной, так и в сгруппированной выборках.

 

 

 

1.3. Построения  гистограммы функций распределения.

Гистограмму используют для изображения интервальных рядов. Для построения гистограммы по данным вариационного ряда с равными интервалами, на оси абсцисс откладывают значения величин интервалов, на которые разбита выборка, а на оси ординат - значения частот или относительных частот. Далее строят прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами - отрезки, длины которых вычисляются делением вероятности попадания в данный интервал на длину этого интервала. Самое большое значение на оси У принимает значение 1, т.к. площадь значений должна равняться единице и превышать это значение не может, а самое маленькое равно 0, так как площадь отрицательной быть не может. На оси Х, минимальное значение – значение минимума выборки, максимальное – максимума.     

В результате получают ступенчатую  фигуру в виде сдвинутых друг к  другу прямоугольников.

Для проверки гистограммы, использовались следующие  законы распределения.

Гауссовский нормальный:

 

 

где параметр m — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия.

Гаусовское  стандартное распределение:

 

Экспоненциальный:

 

 

.

Сдвинутый экспоненциальный:

 

Вейбула:

 

 

Релея:

 

 

Равномерный:

 

 

Нормированный равномерный:

 

 

Проанализируем  результаты, построенных гистограмм.

Выборка Х.

Из всех законов распределения нам подходят Гауссовский нормальный, Гауссовский  стандартный, Сдвинутый экспоненциальный.

Рисунок 1.3. Гауссовский нормальный закон распределения для выборки Х.

 

На рисунке 1.3. Гауссовский нормальный закон распределения для выборки Х продемонстрировано  наложение графика Гауссовский нормального распределения на гистограмму, график идеально подходит под распределение.

Следующим будет проверяться гауссовский  стандартный закон.

Рисунок 1.3. Гауссовский стандартный закон распределения для выборки Х.

 

Из рисунка (рисунок 1.3. Гауссовский стандартный закон распределения) видно, что данный закон распределения не подходит.

И последнее  подходящее распределение – это  сдвинутое экспоненциальное.

Рисунок 1.3. Сдвинутый экспоненциальный закон распределения для выборки Х.

 

График (рисунок 1.3. Сдвинутый экспоненциальный закон распределения для выборки Х) не совсем точно накладывается на гистограмму.

Из этого  можно сделать вывод, что это  гауссовский нормальный закон распределения.

Выборка У.

Как и  в выборке Х подходят Гауссовский  нормальный, Гауссовский стандартный, Сдвинутый экспоненциальный законы распределения.

Рассмотрим  гауссовский нормальный закон.

Рисунок 1.3. Гауссовский нормальный закон распределения для выборки У.

 

График  распределения на рисунке 1.3. Гауссовский нормальный закон распределения для выборки У почти совпадает с гистограммой.

Рисунок 1.3. Гауссовский стандартный закон распределения для выборки У.

 

Как видим  из рисунка 1.3. Гауссовский стандартный закон распределения для выборки У  гауссовский стандартный не подходит, как и в предыдущей выборке.

Рассмотрим  сдвинутый экспоненциальный закон.

Рис. 1.3.6.

Рисунок 1.3. Сдвинутый экспоненциальный закон распределения для выборки У.

 

Этот  график (рисунок 1.3 Сдвинутый экспоненциальный закон распределения для выборки У) также не подходит под исходную диаграмму, следовательно, снова наша выборка подчиняется гауссовскому нормальному закону распределения.

 

 

 

 

 

 

 

 

 

 

 

 

1.4. Расчёт критерия Пирсона.

Критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам:

 

Вычисленное значение критерия расч необходимо сравнить с табличным (критическим) значением табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.

Если расч табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

В том случае, если отсутствуют  таблицы для оценки случайности  расхождения теоретических и  эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом , который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения

КРом,

где m - число групп; k = (m - 3 ) - число  степеней свободы при исчислении частот нормального распределения.

Если вышеуказанное отношение < 3, то расхождения эмпирических и  теоретических частот можно считать  случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут  быть достаточно существенными и  гипотезу о нормальном распределении  следует отвергнуть.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.5. Расчёт критерия Колмогорова.

Критерий согласия А.Н. Колмогорова  используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле

 

где D - максимальное значение разности между накопленными эмпирическими  и теоретическими частотами; - сумма эмпирических частот.

По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.

Необходимым условием при использовании  критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).

Расчёт критериев Пирсона и  Колмогорова выборки Х:

Критерий  Пирсона: 6,24

Критерий Колмагорова: 0,0894

Расчёт критериев Пирсона и  Колмогорова выборки У:

Критерий  Пирсона: 183

Критерий Колмагорова: 0,344

Вся информация о выборках также приведена на рисунке 1.5.Обработка однмерной выборки Х в приложении Б и рисунке Рисунок 1.5. Обработка однмерной выборки У в приложении В.

 

 

 

 

2. Обработка двумерной случайной выборки.

2.1. Построение  поля рассеивания, гипотеза о  виде корреляционной зависимости.

Информация о работе Обработка двумерной случайной выборки