Автор работы: Пользователь скрыл имя, 23 Сентября 2013 в 20:11, контрольная работа
Цель: Построить интервальные ряды распределения настрига и длины волоса шерсти, отобразить их графически в виде гистограмм, полигонов и кумулят. Для этого использовать надстройку Анализ данных, Мастер функций и Мастер диаграмм.
Содержание: Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
1. Исходные данные
2. Вариационные ряды распределения. Графическое представление данных.
3. Статистические оценки параметров распределения
Точечные оценки
4. Интервальные оценки. Доверительные интервалы. Ошибки выборочной средней
5. Статистические гипотезы
6. Дисперсионный анализ
7. Корреляционный анализ
8.Описательная статистика
где f - частота вариант.
В интервальном вариационном ряду моду находят по формуле:
где Мо - мода;
хМо - нижняя граница модального интервала;
hМо - величина модального интервала;
fМо - частота модального интервала;
fМо-1 - частота интервала, предшествующего модальному;
fМо+1 - частота интервала, следующего за модальным.
Модальным интервалом является интервал с наибольшей частотой.
Формула расчета медианы в интервальном вариационном ряду:
где Ме - медиана;
хМе - нижняя граница медианного интервала;
hМе - величина медианного интервала;
- сумма частот;
sМе−1 - сумма частот, накопленных в интервалах, предшествующих медианному;
fМе - частота медианного интервала.
Медианным интервалом является интервал, накопленная частота которого равна или не превышает половину суммы частот.
Размах вариации определяется как разница между наибольшим и наименьшим значениями признака:
,
где R - размах вариации;
xmin, xmax - минимальное и максимальное значение признака.
Дисперсию рассчитывают как среднюю арифметическую квадратов отклонений вариант от средней арифметической:
простая ;
взвешенная ,
где - дисперсия.
Среднее квадратическое отклонение равно корню квадратному из дисперсии:
простое ;
взвешенное ,
где - среднее квадратическое отклонение
Коэффициент асимметрии для выборки рассчитывается по формуле:
где As – коэффициент асимметрии;
– момент третьего порядка;
– выборочное среднее квадратическое отклонение;
n – число вариант.
Показатель эксцесса для выборки рассчитывается по формуле:
или ,
где – эксцесс;
– момент четвертого порядка.
Таблицы:
среднее арифметическое |
4,688 |
мода |
4,78 |
медиана |
9,1 |
дисперсия |
0,1536 |
среднее квадратическое отклонение |
0,391918359 |
ассиметрия |
-0,141625282 |
эксцесс |
-1,0586125 |
размах вариации |
1,4 |
Мо=
Ме=
2.Для длины волоса.
среднее арифметическое |
18,516 |
мода |
8,4 |
медиана |
693,1 |
дисперсия |
11,4639 |
среднее квадратическое отклонение |
3,385838 |
ассиметрия |
-0,30499 |
эксцесс |
-0,55234 |
размах вариации |
12,5 |
Мо=
Ме=
Вывод: Полученные данные, свидетельствуют о том, что для настрига мода равна 4,78 медиана 9,1 а для длины шерсти мода равна 8,4 а медиана 693,1. Размах вариации у настрига шерсти 1,4, у длины шерсти 12,5. Дисперсия у настрига шерсти 0,1536, длина шерсти 11,4639. Среднее квадратическое отклонение настрига шерсти 0,391918359, длина шерсти 3,385838 . Ассиметрия настриг шерсти -0,141625282, длина шерсти -0, 30499. И наконец, эксцесс у настрига шерсти -1,0586125и у длины шерсти -0,55234 . Выполнен анализ рядов распределения.
Цель: С помощью выборочного метода рассчитать для каждого ряда распределения предельные ошибки выборочной средней и определить вероятность осуществления заданной ошибки, предполагая, что проводилась бесповторная выборка из стада овец в 500 голов.
Содержание работы: Основной задачей выборочного наблюдения является определение предельной ошибки выборочной средней или доли, которая позволяет найти доверительные пределы генеральной средней или доли. Расчеты проводят на основе фактических данных, полученных в результате выборочного наблюдения.
Выборочный метод исследования, кроме определения необходимой численности выборки и пределов генеральной средней и доли, позволяет определить вероятность осуществления заданной ошибки. Вероятность заданной ошибки определяется с помощью таблицы интеграла вероятностей (прилож. 1) на основе фактического нормированного отклонения, которое рассчитывается по формуле:
В этом случае надо знать предельную и среднюю ошибки выборки.
Таблицы:
Вероятность |
0,95 | |
Нормированное отклонение |
1,96 | |
Поголовье овец, гол. |
25 | |
Средний настиг шерсти, г |
4,688 | |
Среднее квадратическое отклонение настрига шерсти, г |
0,392 | |
Средняя ошибка выборки настрига шести, г |
0,0784 | |
Предельная ошибка выборки настрига шерсти, г |
0,15 | |
генеральная совокупность |
500,00 | |
Средняя ошибка выборки |
0,078384 |
Вероятность |
0,95 |
Нормированное отклонение |
1,96 |
Поголовье овец, гол. |
25 |
Средняя длина волоса, г |
18,516 |
Среднее квадратическое длины волоса, г |
3,385838 |
Средняя ошибка выборки длины волоса, г |
0,677168 |
Предельная ошибка выборки длины волоса, г |
1,327224 |
генеральная совокупность |
500 |
Средняя ошибка выборки |
0,677168 |
Вывод. На основе полученных данных, мы делаем вывод, что средняя ошибка выборки настрига шерсти равна 0,0784, а для длины шерсти равна 0,677168. Предельная ошибка выборки настрига шерсти 0,15. И у длины шерсти 1,327224.
Работа №4. Проверка статистических гипотез.
Цель: Проверить гипотезу соответствия рядов распределения настрига и длины волоса шерсти нормальному закону распределения. Для этого использовать Мастер функций.
Содержание. Критерий c2 как критерий согласия используют при проверке принадлежности эмпирического распределения к теоретическому, например, к нормальному, биноминальному, распределению Пуассона и т. п.
В этом случае значение критерия c2 определяют, исходя из частот (f) эмпирического распределения и частот (fo) теоретического распределения:
.
При этом возможны случаи, когда теоретические частоты заранее известны и когда неизвестны. Во втором случае теоретические частоты определяют на основе теоретического распределения исходя из численности выборки.
При проверке гипотезы о соответствии эмпирического распределения теоретическому сравнивают фактическое значение критерия с табличным . Если меньше , следовательно, эмпирическое распределение соответствует теоретическому. В противном случае эмпирическое распределение не соответствует теоретическому, распределение частот в нем носит другой характер.
Таблицы.
Интервальный ряд распределения настрига шерсти | |||||||
Номер интервала |
Группа овец по величине настрига шерсти |
Фактическое распределение поголовья (эмпирические частоты) |
Середина интервала |
Плотность нормального распределения |
Теоретическое распределение поголовья (теоретические частоты) | ||
1 |
4 |
4,3 |
7 |
4,2 |
|
2,975659503 | |
2 |
4,3 |
4,6 |
3 |
4,5 |
0,846517144 |
6,348878578 | |
3 |
4,6 |
4,9 |
9 |
4,8 |
1,005263981 |
7,539479858 | |
4 |
4,9 |
5,2 |
5 |
5,1 |
0,664438919 |
4,983291894 | |
5 |
5,2 |
5,5 |
1 |
5,4 |
0,244433418 |
1,833250639 | |
6 |
5,5 |
5,8 |
0 |
5,7 |
0,050049147 |
0,3753686 | |
Итого |
25 |
х |
х |
24,05592907 |
Средняя арифметическая |
4,688 |
Среднее квадратическое отклонение |
0,391918359 |
Уровень значимости |
0,05 |
Степени свободы вариации |
5 |
Фактический уровень значимости |
0,14318245 |
Фактическое значение хи-квадрат |
8,246130046 |
Табличное значение хи-квадрат |
11,07049769 |
Постоим полигон распределения для настрига шерсти.
Постоим полигон распределения по длине волоса.
Вывод. Расчеты данной работы показали, что фактический уровень значимости у настрига шерсти = 0,14318245, а у длины волоса =0,599683 . Фактическое значение хи-квадрат у настрига=8,246130046, а у длины – 5,129204.
Поскольку фактическое значение критерия меньше табличного (c2 фактическое<c2 теоретическое), то нулевая гипотеза о соответствии эмпирического распределения теоретическому для настрига шерсти не принимается, т.е. распределение признака «настриг шерсти» не соответствует нормальному закону (a=0,05).
Работа №5. Дисперсионный анализ.
Цель: Используя данные интервального ряда распределения настрига шерсти с помощью дисперсионного анализа рассчитать достоверность разницы в настриге шерстив зависимости от длины волоса шерсти.
Содержание работы:
При группировке данных по одному признаку и случайному, то есть независимому формированию групп, общая вариация раскладывается на групповую и остаточную вариации:
.
Формулы для расчета вариации имеют вид:
общая вариация (сумма квадратов отклонений индивидуальных значений признака от общей средней):
,
где wо - общая вариация;
- общая средняя арифметическая;
xij - варианты;
k - число групп;
ni - численность групп;
N - численность совокупности;
групповая вариация (сумма квадратов отклонений групповых средних от общей средней):
,
где wгр - групповая вариация;
- групповые средние арифметические;
остаточная вариация (сумма квадратов отклонений индивидуальных значений признака от средней по группам):