Автор работы: Пользователь скрыл имя, 10 Июня 2012 в 14:04, курс лекций
Слово «статистика» происходит от латинского status, что означает «состояние и положение вещей». Статистика как наука стала развиваться со второй половины ХVII в., когда сложились в Европе две основные школы: в Англии – математическая школа статистики, в Германии – описательная школа статистики.
٧ по условию задача n = 25 и h=0,1. Находим минимальную варианту выборки x1 = 3,45 и максимальную x25=4,35.
٧ весь промежуток между x1 и x25 разбиваем на частичные промежутки длиной 0,1. Получаем интервальный вариационный ряд: [3,45;3,55), [3,55;3,65), [3,65;3,75), [3,75;3,85), [3,85;3,95), [3,95;4,05), [4,05;4,15), [4,15;4,25), [4,25;4,35]. Итого получаем 9 частичных интервалов.
٧ для каждого частичного интервала находим сумму частот вариант, попавших в k интервал, в первый интервал [3,45;3,55) попала 1 варианта, во второй интервал [3,55;3,65)– 1 варианта, в третий интервал [3,65;3,75) – 3 варианты, в четвертый интервал [3,75;3,85) – 4 варианты, в пятый интервал [3,85;3,95) – 7 вариант, в шестой интервал [3,95;4,05) – 5 вариант, в седьмой интервал [4,05;4,15) – 2 варианты, в восьмой [4,15;4,25) – 1 варианта, в девятый интервал [4,25;4,35] – 1 варианта.
٧ Составляем интервальную таблицу:
[3,45;3,55) | [3,55;3,65) | [3,65;3,75) | [3,75;3,85) |
|
1 | 1 | 3 | 4 |
|
[3,85;3,95) | [3,95;4,05) | [4,05;4,15) | [4,15;4,25) | [4,25;4,35] |
7 | 5 | 2 | 1 | 1 |
Наряду с табличной формой представления статистических данных широко используется графическая форма.
Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин называется диаграммой (греч. Διάγραμμα (diagramma) — изображение, рисунок, чертёж).
Диаграммы в основном состоят из геометрических объектов (точек, линий, фигур различной формы и цвета) и вспомогательных элементов (осей координат, условных обозначений, заголовков и т. п.).
На сегодняшний день существует большое разнообразие типов диаграмм. Анализ литературы показал, что в начальном курсе математики рассматриваются такие типы диаграмм как линейные, столбчатые и круговые.
В курсе математики основой школы рассматриваются такие типы диаграмм, как полигон частот, столбчатые и круговые диаграммы, гистограмма.
Классическими диаграммами являются столбчатые и линейные (полосовые) диаграммы.
Столбчатые диаграммы в основном используются для наглядного сравнения полученных статистических данных или для анализа их изменения за определённый промежуток времени (рис.3).
Рис.3. Столбчатая диаграмма
Построение столбчатой диаграммы заключается в изображении статистических данных в виде вертикальных прямоугольников прямоугольных столбиков. Столбчатая диаграмма состоит из разделенных промежутками прямоугольников с равными основаниями, каждый из которых соответствует одному из значений переменной. Промежутки между прямоугольниками свидетельствуют о дискретности данных.
Разновидностями столбчатых диаграмм являются линейные (полосовые) диаграммы.
Линейная диаграмма – это разновидность столбчатой диаграммы, с той лишь разницей, что изображение статистических данных указывается в виде отрезков (рис.4).
Рассмотрим следующий вид диаграммы – полигон. Распределения дискретных рядов изображаются на графиках, называемых полигонами.
Если на плоскости в прямоугольной системе координат построить точки (xi; ni) (i = 1, 2, …, k) и соединить их последовательно отрезками прямых, то получим ломаную линию, которая называется полигоном частот (рис. 5.).
Покажем на примере как можно строить полигоны. Задано распределение частот выборки объема n=25:
xi | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
ni | 1 | 1 | 2 | 4 | 7 | 6 | 3 | 1 |
Построим полигон частот. Для этого отложим в системе координат
точки с координатами (5;1), (6;1), (7;2), (8;4), (9;7), (10;6), (11;3), (12;1) и соединим их отрезками (рис.5)
Рассмотрим следующий вид диаграммы – гистограмма (от греч. histos, здесь столб + grámma — черта, буква, написание). Распределения интервальных рядов изображаются на диаграммах, называемых гистограммами.
Гистограмма – ступенчатая фигура, представляющая собой прямоугольники одинаковой (единичной) длины, площадь каждого из которых равна кратности варианты, попавшей в этот прямоугольник [30].
Покажем на примере как можно строить гистограммы, воспользовавшись интервальной таблицей частот из предыдущего примера (стр.15).
Для того чтобы построить гистограмму сначала:
٧ найдем длины оснований прямоугольников h=0,1, затем высоты прямоугольников по формуле : , , , , ,, , ..
٧ в системе координат на оси абсцисс отложим частичные интервалы 3,45; 3,55; 3,65; 3,75; 3,85; 3,95; 4,05; 4,15; 4,25; 4,35.
٧ в системе координат на оси ординат откладываем точки 10, 20, 30, 40, 50, 70.
٧ над частичными интервалами строим прямоугольники, высотой равной , гистограмма такая же, как и на рис. 6.
Наглядное представление структуры совокупности данных может быть представлено круговой диаграммой. Представляет собой круг, разделенный на секторы, соответствующие значениям переменной. Секторы раскрашиваются в различные цвета. Например, распределение абитуриентов по полу (рис.7).
Рис.7. Круговая диаграмма
Таким образом, мы рассмотрели такие формы представления статистической информации как табличное и графическое изображение. Описывая графические формы изображения, мы указали пять типов диаграмм: столбчатая, линейная, круговая диаграммы, гистограмма, полигон. Три первых из них изучаются в начальном курсе математики.
3. Числовые характеристики вариационных рядов
Целью описательной статистики помимо обработки эмпирических данных, их систематизации, наглядного представления в форме графиков и таблиц, является и их количественное описание посредством основных статистических показателей.
Часто возникает необходимость сравнивать между собой две или несколько совокупностей статистических данных. Поскольку сравнение производится по какому-то определенному свойству, то для проведения сравнения нужны показатели, характеризующие то или иное свойство совокупности данных одним числом. Такие показатели в статистике получили наименование числовых характеристик.
Простейшими числовыми характеристиками являются характеристики положения (среднее арифметическое, мода, медиана) и характеристики рассеивания (размах, среднее квадратичное отклонение).
Пусть из генеральной совокупности объема N относительно количественного признака Х произведена выборка объема n. Тогда генеральная средняя () вычисляется по формуле
,
где варианты имеют соответственно частоты N1, N2, …, Nk, причем N1 + N2 + … + Nk =N.
Выборочная средняя ( ) имеет формулу
,
где имеют соответственно частоты n1, n2, …, nk, причем n1+n2+…+nk = n.
В школьном курсе математики встречается понятие не выборочной средней, а среднего арифметического, или среднего значения.
Медианой вариационного ряда (Ме) называется то значение случайной величины, которое приходится на середину вариационного ряда. Если число вариант нечетное (n=2k+1), то
Ме= xk+1
Если число вариант четно (n=2k), то формула имеет следующий вид:
Мода М0 – это значение вариант, встречающее в ряду чаще других. В таблице распределения ряда мода – это значение частоты xj, которому соответствует наибольшее значение частоты nj.
Простейшей характеристикой рассеивания является размах. Размах выборки A – разность между наибольшим и наименьшим значениями выборки:
A=mах(хi)-min(xj)
Рассмотрим на примере практический смысл таких статистических показателей как среднее арифметическое и мода:
Пример: В аттестате о среднем образовании у четырех друзей – выпускников школы – оказались следующие оценки:
Ильин: 4,4,5,5,4,4,4,5,5,5,4,4,5,4,4;
Семенов: 3,4,3,3,3,3,4,3,3,3,3,4,4,5,4;
Попов: 5,5,5,5,5,4,4,5,5,5,5,5,4,4,4;
Романов: 3,3,4,4,4,4,4,3,4,4,4,5,3,4,4.
Средний балл каждого выпускника найдем по формуле среднего выборочного: и получим:
Ильин: ;
Семенов: ;
Попов: ;
Романов: .
Укажем наиболее типичную для каждого из них оценку в аттестате. Для этого найдем для каждой совокупности моду, то есть оценку, встречающуюся чаще других:
Ильин: 4 (9 раз из 15);
Семенов: 3 (9 раз из 15);
Попов: 5 (10 раз из 15);
Романов: 4 (10 раз из 15);
Рассмотрим на примере практический смысл таких статистических показателей как размах и медиана:
Пример: Отмечая время (с точностью до минут), которое токари бригады затратили на обработку одной детали, получили такой ряд данных:
30,32,32,38,36,31,32,38,35,36,
Найдем наибольший разброс времени на обработку детали по формуле нахождения размаха выборки: A=mах(хi)-min(xj).
mах(хi)= 42, min(xj)=30, A=42-30=12.
Получаем, что наибольший разброс времени на обработку детали составляет 12 минут.
Найдем время обработки, которое не превысила половина токарей бригады по формуле нахождения медианы четного ряда , так как n=20. Для этого упорядочим ряд данных: 30,31,32,32,32,32,32,32,33,35,
Получаем, что время обработки, которое не превысила половина токарей бригады, составляет 35 минут.
Еще один показатель рассеивания – среднее квадратичное отклонение , определяется по формуле:
где Dв- выборочная дисперсия.
Введение среднего квадратического отклонения объясняется тем, что дисперсия измеряется в квадратных единицах относительно размерности самой случайной величины.
Например, если возможные значения некоторой случайной величины измеряются в метрах, то её дисперсия измеряется в квадратных метрах. В тех случаях, когда нужно иметь числовую характеристику рассеяния возможных значений в той же размерности, что и сама случайная величина, и используется среднее квадратическое отклонение.
Из всех рассмотренных числовых характеристик в начальном курсе математики встречается только среднее арифметическое - выборочная средняя.
15