Автор работы: Пользователь скрыл имя, 13 Мая 2013 в 14:52, контрольная работа
Задача 1. Задана выборка:...
1) Составить интервальный ряд распределения. 2) Найти выборочные среднее, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициенты вариации, ассиметрии и эксцесса. 3) Построить гистограмму частот. 4) Найти эмпирическую функцию распределения и построить ее график. 5) Проверить гипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона при уровне значимости 0.05. 6) Найти доверительный интервал для оценки неизвестного математического ожидания генеральной совокупности с надежностью 0.95.
Задача 1. Задана выборка:
102 |
90 |
94 |
95 |
95 |
96 |
96 |
105 |
76 |
93 |
102 |
95 |
88 |
103 |
87 |
95 |
88 |
92 |
79 |
93 |
101 |
113 |
92 |
108 |
75 |
86 |
71 |
96 |
84 |
81 |
97 |
83 |
97 |
77 |
94 |
98 |
105 |
112 |
91 |
106 |
87 |
100 |
82 |
85 |
99 |
87 |
88 |
97 |
99 |
105 |
91 |
87 |
99 |
92 |
93 |
85 |
102 |
109 |
96 |
83 |
83 |
93 |
81 |
92 |
111 |
89 |
95 |
78 |
83 |
102 |
101 |
82 |
95 |
92 |
99 |
105 |
69 |
118 |
97 |
84 |
83 |
99 |
103 |
86 |
93 |
87 |
94 |
92 |
87 |
107 |
88 |
97 |
87 |
78 |
100 |
88 |
95 |
95 |
108 |
93 |
1) Составить интервальный ряд распределения.
2) Найти выборочные среднее, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициенты вариации, ассиметрии и эксцесса.
3) Построить гистограмму частот.
4) Найти эмпирическую функцию распределения и построить ее график.
5) Проверить гипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона при уровне значимости 0.05.
6) Найти доверительный интервал для оценки неизвестного математического ожидания генеральной совокупности с надежностью 0.95.
Прежде всего, для упрощения анализа выборки отсортируем ее и вычислим ее основные характеристики. Для этого удобно использовать Excel или подобную программу.
69 |
82 |
85 |
88 |
92 |
93 |
95 |
97 |
101 |
105 |
71 |
82 |
86 |
88 |
92 |
94 |
95 |
98 |
102 |
106 |
75 |
83 |
86 |
88 |
92 |
94 |
96 |
99 |
102 |
107 |
76 |
83 |
87 |
88 |
92 |
94 |
96 |
99 |
102 |
108 |
77 |
83 |
87 |
88 |
92 |
95 |
96 |
99 |
102 |
108 |
78 |
83 |
87 |
89 |
93 |
95 |
96 |
99 |
103 |
109 |
78 |
83 |
87 |
90 |
93 |
95 |
97 |
99 |
103 |
111 |
79 |
84 |
87 |
91 |
93 |
95 |
97 |
100 |
105 |
112 |
81 |
84 |
87 |
91 |
93 |
95 |
97 |
100 |
105 |
113 |
81 |
85 |
87 |
92 |
93 |
95 |
97 |
101 |
105 |
118 |
Таблица 1. Отсортированная выборка
Объем выборки, : 100 Минимальное значение, : 69 Максимальное значение, : 118 Размах, : 49 Среднее арифметическое, : 93.06 Мода (по выборке), : 95 Медиана (по выборке), : 93 |
Мода выборки – это наиболее часто встречающееся значение. Значение 95 – единственное, которое встречается 8 раз (выделено синим цветом).
Медиана выборки – значение, находящееся в середине отсортированной выборки, т.е. либо 50-е, либо 51-е по счету. В нашем случае они оба равны 93 (выделены красным). |
1) Разобьем диапазон значений выборки на интервалы и составим ряд распределения.
Рекомендуемое количество интервалов для интервального ряда, согласно формуле Стерджеса:
Т.е. выборку из 100 значений оптимально разбивать на 7-8 интервалов. Разобьем на 8 интервалов:
Тогда минимально возможная длина интервала (шаг) составит:
И в этом случае начало первого интервала совпадет с первым (минимальным) значением выборки , а конец последнего интервала – с последним значением . При выборе интервалов рекомендуется отступать от первого и последнего значений выборки (если удобно, то на вправо и влево). Кроме того, для удобства можно выбрать целочисленный шаг. Поэтому возьмем в качестве шага целое значение:
В таком случае, 8 интервалов шириной единиц полностью и с запасом покрывают размах выборки . Запас составит единиц, т.е. как раз по слева и справа, как и рекомендовано. Таким образом, отступив от минимального значения на 3.5 единиц вправо, получим начало первого интервала:
Его конец и начало следующего интервала:
Конец второго и начало третьего интервала:
И т.д.
Середины получившихся интервалов:
Пользуясь отсортированной выборкой легко подсчитать частоты для каждого интервала – количество значений, попадающих в интервал. Например, в первый интервал попадают лишь два значения: 69 и 71. Во второй интервал попадает уже 6 значений: 75, 76, 77, 78, 78, 79. И т.д.
Сведем полученные данные в таблицу:
1 |
65,5 |
72,5 |
69 |
2 |
2 |
0,02 |
0,02 |
0,0029 |
2 |
72,5 |
79,5 |
76 |
6 |
8 |
0,06 |
0,08 |
0,0086 |
3 |
79,5 |
86,5 |
83 |
15 |
23 |
0,15 |
0,23 |
0,0214 |
4 |
86,5 |
93,5 |
90 |
28 |
51 |
0,28 |
0,51 |
0,04 |
5 |
93,5 |
100,5 |
97 |
28 |
79 |
0,28 |
0,79 |
0,04 |
6 |
100,5 |
107,5 |
104 |
14 |
93 |
0,14 |
0,93 |
0,02 |
7 |
107,5 |
114,5 |
111 |
6 |
99 |
0,06 |
0,99 |
0,0086 |
8 |
114,5 |
121,5 |
118 |
1 |
100 |
0,01 |
1,00 |
0,0014 |
Таблица 2. Разбиение выборки на интервалы
где
– номер интервала;
– границы интервала;
– середина интервала;
– частота (количество значений, попавших в интервал);
– накопительная сумма частот (сумма частот в -ом и всех предыдущих интервалах);
– относительные частоты;
– эмпирическая функция распределения;
– высота столбцов гистограммы относительных частот.
2) Вычислим характеристики полученного интервального ряда распределения.
Мода интервального ряда вычисляется на основе частот интервала с максимальной частотой (модальный интервал) и соседствующих с ним. Когда модальных интервалов два (как в нашем случае и , и ), то мода равна границе между этими интервалами. Убедимся в этом:
– значение моды, если в качестве модального взять четвертый интервал:
– такое же значение моды, если в качестве модального взять пятый интервал:
Медиана вычисляется на основе медианного интервала – такого, в котором накопительная сумма частот впервые превысила . Таким является 4-ый интервал – в нем , тогда как в предыдущем интервале . Тогда медиану вычисляем по формуле:
Выборочное среднее:
Итак,
.
Вспомним, что эти же характеристики, вычисленные на основе исходной выборки, составили в свою очередь , , , т.е. близки к полученным выше значениям.
Остальные необходимые характеристики вычисляются на основе центральных моментов :
– центральные моменты -го порядка
Тогда
– дисперсия
– среднее квадратическое отклонение
– коэффициент вариации
– коэффициент ассиметрии
– эксцесс
Для удобства сведем вычисление выражений в таблицу:
1 |
2 |
69 |
-24,15 |
1166,445 |
-28169,647 |
680296,969 |
2 |
6 |
76 |
-17,15 |
1764,735 |
-30265,205 |
519048,270 |
3 |
15 |
83 |
-10,15 |
1545,338 |
-15685,176 |
159204,533 |
4 |
28 |
90 |
-3,15 |
277,830 |
-875,165 |
2756,768 |
5 |
28 |
97 |
3,85 |
415,030 |
1597,865 |
6151,782 |
6 |
14 |
104 |
10,85 |
1648,115 |
17882,048 |
194020,218 |
7 |
6 |
111 |
17,85 |
1911,735 |
34124,470 |
609121,785 |
8 |
1 |
118 |
24,85 |
617,523 |
15345,434 |
381334,038 |
Сумма: |
9346,75 |
-6045,375 |
2551934,363 |
Таким образом,
– дисперсия
– среднее квадратическое отклонение
– коэффициент вариации
– коэффициент ассиметрии
– эксцесс
3,4) Построим графики по полученным данным.
Гистограмма относительных частот строится по следующему принципу:
– -ый столбец гистограммы по ширине занимает весь интервал от до , т.е. имеет ширину, равную ;
– высота столбца гистограммы принимается такой, чтобы его площадь была равна относительной частоте (соответствующие значения находятся в последнем столбце таблицы 2).
Рис. 1. Гистограмма относительных частот
Отобразив на графике точки и соединив их ломаной линией, получим график эмпирической функции распределения:
Рис. 2. Эмпирическая функция распределения
5) Проверим гипотезу о нормальном распределении генеральной совокупности.
Коэффициент вариации интервального ряда составил порядка 10%. Такой показатель свидетельствует о достаточной однородности эмпирических данных, позволяющей делать на их основе какие-либо выводы.
Проанализировав построенный нами эмпирический закон распределения, выяснили, что
– (т.е. распределение практически симметрично и не скошено);
– и находятся в пределах от 93 до 93.5 (за исключением , которое отклонилось немного больше).
Подобными свойствами обладает нормальное распределение, для которого ассиметрия и эксцесс равны нулю, а мода и медиана равны математическому ожиданию. Графики на рисунках 1-3 так же визуально похожи на графики нормального распределения.
Поэтому выдвигаем гипотезу о нормальном распределении генеральной совокупности. Т.е. предполагаем, что значения выборки распределены по нормальному закону с математическим ожиданием и средним квадратическим отклонением .
Функция плотности нормального распределения с такими параметрами будет иметь вид:
Ее график на фоне гистограммы частот, построенной ранее:
Проверим гипотезу о нормальном распределении с помощью критерия Пирсона.
Для этого вычислим, какими теоретически должны быть частоты , если бы данные строго соответствовали нормальному распределению с математическим ожиданием и средним квадратическим отклонением .
Вычислим вероятности попадания случайной величины в интервалы по формуле:
,
где
– интегральная функция Лапласа, значения которой находим по таблицам.