Автор работы: Пользователь скрыл имя, 23 Ноября 2014 в 17:01, контрольная работа
В таблице приведено распределение квартир жилого дома по суточному потреблению электроэнергии (кВт.ч.).
Потребление электроэнергии Количество квартир Потребление электроэнергии Количество квартир
Менее 1,25 6 3,75-4,25 126
1,25-1,75 30 4,25-4,75 70
1,75-2,25 113 4,75-5,25 31
2,25-2,75 221 5,25-5,75 14
2,75-3,25 245 5,75-6,25 3
3,25-3,75 189 6,25 и более 2
1. Построить по этим данным гистограмму.
2. Найти эмпирическую функцию распределения и построить ее график.
3. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.
4. Используя критерии - Пирсона по данному вариационному ряду при уровне значимости =0,05, проверить гипотезу о том, что случайная величина X распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Содержание
Вариант 0
В таблице приведено распределение квартир жилого дома по суточному потреблению электроэнергии (кВт.ч.).
Потребление электроэнергии |
Количество квартир |
Потребление электроэнергии |
Количество квартир |
Менее 1,25 |
6 |
3,75-4,25 |
126 |
1,25-1,75 |
30 |
4,25-4,75 |
70 |
1,75-2,25 |
113 |
4,75-5,25 |
31 |
2,25-2,75 |
221 |
5,25-5,75 |
14 |
2,75-3,25 |
245 |
5,75-6,25 |
3 |
3,25-3,75 |
189 |
6,25 и более |
2 |
|
, тыс. руб. | ||||||
| 60-80 |
80- 100 |
100-120 |
120-130 |
130-160 |
160-180 |
180-200 |
80-100 |
6 |
||||||
100-120 |
3 |
4 |
5 |
||||
120-130 |
2 |
7 |
6 |
||||
130-160 |
1 |
8 |
5 |
||||
160-180 |
1 |
2 |
7 |
2 |
|||
180-200 |
5 |
||||||
200-220 |
4 | ||||||
220-230 |
2 |
а) Вычислить групповые средние и , построить корреляционные поля;
б) предполагая, что между х и у существует линейная корреляционная зависимость
найти уравнения прямых регрессии и построить их графики на корреляционных полях;
вычислить коэффициенты корреляции и детерминации, сделать выводы о тесноте и направлении связи;
вычислить среднюю абсолютную процентную ошибку; для коэффициента корреляции генеральной совокупности; определить доверительный интервал, соответствующий доверительной вероятности = 0,05.
1. Построить по этим данным гистограмму.
№ |
интервалы |
|
|
1 |
Менее 1,25 |
1 |
6 |
2 |
1,25-1,75 |
1,5 |
30 |
3 |
1,75-2,25 |
2 |
113 |
4 |
2,25-2,75 |
2,5 |
221 |
5 |
2,75-3,25 |
3 |
245 |
6 |
3,25-3,75 |
3,5 |
189 |
7 |
3,75-4,25 |
4 |
126 |
8 |
4,25-4,75 |
4,5 |
70 |
9 |
4,75-5,25 |
5 |
31 |
10 |
5,25-5,75 |
5,5 |
14 |
11 |
5,75-6,25 |
6 |
3 |
12 |
6,25 и более |
6,5 |
2 |
Гистограмма
2. Найти эмпирическую функцию распределения и построить ее график.
Таблица 1 - Вспомогательная таблица для расчета числовых характеристик выборки
Интервалы |
|
Частоты |
Относительные частоты |
Наколенные относительные частоты | |
Менее 1,25 |
1 |
6 |
0,006 |
0,006 | |
1,25-1,75 |
1,5 |
30 |
0,029 |
0,035 | |
1,75-2,25 |
2 |
113 |
0,108 |
0,142 | |
2,25-2,75 |
2,5 |
221 |
0,210 |
0,353 | |
2,75-3,25 |
3 |
245 |
0,233 |
0,586 | |
3,25-3,75 |
3,5 |
189 |
0,180 |
0,766 | |
3,75-4,25 |
4 |
126 |
0,120 |
0,886 | |
4,25-4,75 |
4,5 |
70 |
0,067 |
0,953 | |
4,75-5,25 |
5 |
31 |
0,030 |
0,982 | |
5,25-5,75 |
5,5 |
14 |
0,013 |
0,996 | |
5,75-6,25 |
6 |
3 |
0,003 |
0,998 | |
6,25 и более |
6,5 |
2 |
0,002 |
1,000 |
Эмпирическая функция распределения F*(y) выборки служит для оценки функции распределения F(y) генеральной совокупности. Функция F*(y) определяет для каждого значения y относительную частоту события Y < y:
где ny – число выборочных значений, меньших y; n – объем выборки. Пятый столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(y), они относятся к верхней границе частотного интервала.
Эмпирическая функция распределения F*(y) имеет вид:
F(y) =
График эмпирической функции распределения F*(y) изображен на рис. 2 (для непрерывных распределений значения F*(y) распространяются на интервалы линейным интерполированием).
Рисунок 2 - График эмпирической функции распределения F*(y)
3. Для вычисления числовых характеристик выборки удобно использовать таблицу 2, где в первых двух столбцах приведены сгруппированные исходные данные, а остальные столбцы служат для вычисления числовых характеристик.
Таблица 2 Таблица для расчета числовых характеристик выборки
Середины интервалов
|
Частоты
|
|
|
|
|
|
1 |
6 |
-2,15 |
-12,9 |
27,735 |
-59,63025 |
128,205038 |
1,5 |
30 |
-1,65 |
-49,5 |
81,675 |
-134,7638 |
222,360188 |
2 |
113 |
-1,15 |
-129,95 |
149,443 |
-171,8589 |
197,637706 |
2,5 |
221 |
-0,65 |
-143,65 |
93,3725 |
-60,69213 |
39,4498813 |
3 |
245 |
-0,15 |
-36,75 |
5,5125 |
-0,826875 |
0,12403125 |
3,5 |
189 |
0,35 |
66,15 |
23,1525 |
8,103375 |
2,83618125 |
4 |
126 |
0,85 |
107,1 |
91,035 |
77,37975 |
65,7727875 |
4,5 |
70 |
1,35 |
94,5 |
127,575 |
172,2263 |
232,505438 |
5 |
31 |
1,85 |
57,35 |
106,098 |
196,2804 |
363,118694 |
5,5 |
14 |
2,35 |
32,9 |
77,315 |
181,6903 |
426,972088 |
6 |
3 |
2,85 |
8,55 |
24,3675 |
69,44738 |
197,925019 |
6,5 |
2 |
3,35 |
6,7 |
22,445 |
75,19075 |
251,889013 |
сумма |
1050 |
- |
0,5 |
829,725 |
352,5463 |
2128,79606 |
Выборочное среднее вычисляют по формуле:
где m – число интервалов, yi – середины интервалов.
у = 3308 / 1050 = 3,15
Выборочное среднее дает усредненное значение времени непрерывной работы станков для данной выборки.
Выборочную дисперсию для сгруппированных данных вычисляют по формуле:
= 829,725 / 1050 = 0,7902
Выборочное среднее квадратическое отклонение находят по формуле:
0,88894
Оно показывает разброс выборочных значений y, относительно выборочного среднего у = 3,15
Выборочные коэффициенты асимметрии и эксцесса вычисляют по формулам:
Используя суммы из последних строк шестого и седьмого столбцов таблицы 2, получим:
352,5463 / 1050*0,888943 = 0,47798
2128,7961/1050*0,888944 -3= 0,2468
говорит о несимметричности полигона (гистограммы) относительно выборочного среднего . Положительный знак свидетельствует о правосторонней асимметрии данного распределения. Положительность показывает, что полигон менее крут, чем нормальная кривая.
Предварительно предполагаем, что СВ Y распределена нормально по совокупности следующих признаков.
Выборочные коэффициенты асимметрии Ау = 0,477989 и эксцесса Эу = -0,2468 отличаются от значений асимметрии и эксцесса для нормального распределения (которые равны нулю) не более, чем на утроенные средние квадратические ошибки их определения.
Гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, назовем нулевой , тогда . Проверим ее с помощью критерия согласия Пирсона. Согласно критерию Пирсона сравниваются эмпирические ni (наблюдаемые) и теоретические npi (вычисленные в предположении нормального распределения) частоты. В качестве критерия проверки нулевой гипотезы принимается СВ
По таблице критических точек распределения χ2 по заданному уровню значимости и числу степеней свободы (S – число интервалов, r – число параметров предполагаемого распределения СВ Y) находится критическое значение .
Если , то считается, что данный критерий не дает оснований для отклонения гипотезы при данном уровне значимости . В противном случае считается, что гипотеза не согласуется с экспериментальными данными и ее отвергают.
Так как предполагается нормальное распределение, имеющее 2 параметра (математическое ожидание a и среднее квадратическое отклонение ), поэтому , тогда число степеней свободы .
Таблица 3 Расчетная таблица для вычисления
Интервалы |
Частоты эмпирические ni |
Вероятности pi |
Теоретические частоты npi |
|
Менее 1,25 |
6 |
0,006 |
5,25 |
0,107143 |
1,25-1,75 |
30 |
0,029 |
29,5 |
0,008475 |
1,75-2,25 |
113 |
0,108 |
111,56 |
0,018587 |
2,25-2,75 |
221 |
0,210 |
219,63 |
0,008546 |
2,75-3,25 |
245 |
0,233 |
255,59 |
0,438781 |
3,25-3,75 |
189 |
0,180 |
189,35 |
0,000647 |
3,75-4,25 |
126 |
0,120 |
128,54 |
0,050191 |
4,25-4,75 |
70 |
0,067 |
65,32 |
0,335309 |
4,75-5,25 |
31 |
0,030 |
28,7 |
0,184321 |
5,25-5,75 |
14 |
0,013 |
12,36 |
0,217605 |
5,75-6,25 |
3 |
0,003 |
2,4 |
0,15 |
6,25 и более |
2 |
0,002 |
1,8 |
0,022222 |
сумма |
1050 |
1 |
1050 |
1,541827 |
В таблице критических точек распределения по уровню значимости и числу степеней свободы найдем критическое значение .
Так как , то считаем, что нет оснований для отклонения нулевой гипотезы при заданном уровне значимости .
Построим график эмпирической функции . Для этого из середины частичных интервалов восстановим перпендикуляры высотой равной pi – вероятностям попадания СВ Y в соответствующий частичный интервал. На рис.3 концы перпендикуляров отмечены точками, полученные точки соединены плавной кривой.
Рисунок 3. Полигон относительных частот и нормальная кривая
Сравнение полигона относительных частот и нормальной кривой показывает, что построенная нормальна кривая удовлетворительно сглаживает полигон.
Найдем интервальные оценки параметров нормального закона распределения. Для нахождения доверительного интервала, покрывающего математическое ожидание СВ У, найдем по таблицам квантилей распределения Стьюдента по заданной доверительной вероятности 0,95 и числу степеней свободы число
Вычислим предельную погрешность интервального оценивания:
1,984*0,88894/32,4037 = 0,0544
Запишем искомый доверительный интервал для мат. ожидания a:
3,15-0,0544<a<3,15+0,0544
3,0956 < a < 3,2044
Если будет произведено достаточное большое число выборок из одной и той же генеральной совокупности, что в 95% выборок доверительный интервал (3,0956;3,2044) покроет математическое ожидание a; и только в 5% выборок математическое ожидание может выйти за границы доверительного интервала.
Для нахождения доверительного интервала, покрывающего неизвестное среднее квадратическое отклонение с заданной вероятностью , найдем по и числу степеней свободы
два числа и .
Искомый доверительный интервал равен:
0.878*0,88894< σ < 1.161*0,88894
0,7805< σ < 1,0321
Если будет произведено достаточно большое число выборок из одной и той же генеральной совокупности, что в 95% выборок доверительный интервал (0,7805; 1,0321) покроет среднее квадратическое отклонение , и только в 5% среднее квадратическое отклонение может выйти за границы доверительного интервала (0,7805; 1,0321).
5. Для исследования зависимости объема производства (У) от основных фондов (X) получены статистические данные по 70 предприятиям за год.
|
, тыс. руб. | ||||||
| 60-80 |
80- 100 |
100-120 |
120-130 |
130-160 |
160-180 |
180-200 |
80-100 |
6 |
||||||
100-120 |
3 |
4 |
5 |
||||
120-130 |
2 |
7 |
6 |
||||
130-160 |
1 |
8 |
5 |
||||
160-180 |
1 |
2 |
7 |
2 |
|||
180-200 |
5 |
||||||
200-220 |
4 | ||||||
220-230 |
2 |
Информация о работе Контрольная работа по дисциплине "Статистика"