Статистическая обработка информации

Автор работы: Пользователь скрыл имя, 10 Июня 2012 в 14:04, курс лекций

Краткое описание

Слово «статистика» происходит от латинского status, что означает «состояние и положение вещей». Статистика как наука стала развиваться со второй половины ХVII в., когда сложились в Европе две основные школы: в Англии – математическая школа статистики, в Германии – описательная школа статистики.

Прикрепленные файлы: 1 файл

Статистическая обработка информации.doc

— 281.75 Кб (Скачать документ)

٧     по условию задача n = 25 и h=0,1. Находим минимальную варианту выборки x1 = 3,45 и максимальную x25=4,35.

٧     весь промежуток между x1 и  x25 разбиваем на частичные промежутки длиной 0,1. Получаем интервальный вариационный ряд: [3,45;3,55), [3,55;3,65), [3,65;3,75), [3,75;3,85), [3,85;3,95), [3,95;4,05), [4,05;4,15), [4,15;4,25), [4,25;4,35]. Итого получаем 9 частичных интервалов.

٧     для каждого частичного интервала находим сумму частот вариант, попавших в k интервал, в первый интервал [3,45;3,55) попала 1 варианта, во второй интервал [3,55;3,65)– 1 варианта, в третий интервал [3,65;3,75) – 3 варианты, в четвертый интервал [3,75;3,85) – 4 варианты, в пятый интервал [3,85;3,95) – 7 вариант, в шестой интервал [3,95;4,05) – 5 вариант, в седьмой интервал [4,05;4,15) – 2 варианты, в восьмой [4,15;4,25) – 1 варианта, в девятый интервал [4,25;4,35] – 1 варианта.

٧     Составляем интервальную таблицу:

[3,45;3,55)

[3,55;3,65)

[3,65;3,75)

[3,75;3,85)

 

1

1

3

4

 

[3,85;3,95)

[3,95;4,05)

[4,05;4,15)

[4,15;4,25)

[4,25;4,35]

7

5

2

1

1

 

 

 

Наряду с табличной формой представления статистических данных широко используется графическая форма.

Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин называется диаграммой (греч. Διάγραμμα (diagramma) — изображение, рисунок, чертёж).

Диаграммы в основном состоят из геометрических объектов (точек, линий, фигур различной формы и цвета) и вспомогательных элементов (осей координат, условных обозначений, заголовков и т. п.).

На сегодняшний день существует большое разнообразие типов диаграмм. Анализ литературы показал, что в начальном курсе математики рассматриваются такие типы диаграмм как линейные, столбчатые и круговые.

В курсе математики основой школы рассматриваются такие типы диаграмм, как полигон частот, столбчатые и круговые диаграммы, гистограмма.

Классическими диаграммами являются столбчатые и линейные (полосовые) диаграммы.

Столбчатые диаграммы в основном используются для наглядного сравнения полученных статистических данных или для анализа их изменения за определённый промежуток времени (рис.3).

 

 

 

 

Рис.3. Столбчатая диаграмма

Построение столбчатой диаграммы заключается в изображении статистических данных в виде вертикальных прямоугольников прямоугольных столбиков. Столбчатая диаграмма состоит из разделенных промежутками прямоугольников с равными основаниями, каждый из которых соответствует одному из значений переменной. Промежутки между прямоугольниками свидетельствуют о дискретности данных.

Разновидностями столбчатых диаграмм являются линейные (полосовые) диаграммы.

Линейная диаграмма – это разновидность столбчатой диаграммы, с той лишь разницей, что изображение статистических данных указывается в виде отрезков (рис.4).

 

 

 

 

 

                                         Рис.4. Линейная диаграмма

Рассмотрим следующий вид диаграммы – полигон. Распределения дискретных рядов изображаются на графиках, называемых полигонами.

Если на плоскости в прямоугольной системе координат построить точки (xi; ni) (i = 1, 2, …, k) и соединить их последовательно отрезками прямых, то получим ломаную линию, которая называется полигоном частот (рис. 5.).

Покажем на примере как можно строить полигоны. Задано распределение частот выборки объема n=25:

xi

5

6

7

8

9

10

11

12

ni

1

1

2

4

7

6

3

1

 

 

 

Построим полигон частот. Для этого отложим в системе координат

точки с координатами (5;1), (6;1), (7;2), (8;4), (9;7), (10;6), (11;3), (12;1) и соединим их отрезками (рис.5)

Рассмотрим следующий вид диаграммы – гистограмма (от греч. histos, здесь столб + grámma — черта, буква, написание). Распределения интервальных рядов изображаются на диаграммах, называемых гистограммами.

Гистограмма – ступенчатая фигура, представляющая собой прямоугольники одинаковой (единичной) длины, площадь каждого из которых равна кратности варианты, попавшей в этот прямоугольник [30].

Покажем на примере как можно строить гистограммы, воспользовавшись интервальной таблицей частот из предыдущего примера (стр.15).

Для того чтобы построить гистограмму сначала:

٧         найдем длины оснований прямоугольников h=0,1, затем высоты прямоугольников по формуле : , , , , ,, , ..

٧         в системе координат на оси абсцисс отложим частичные интервалы 3,45; 3,55; 3,65; 3,75; 3,85; 3,95; 4,05; 4,15; 4,25; 4,35.

٧         в системе координат на оси ординат откладываем точки 10, 20, 30, 40, 50, 70.

٧         над частичными интервалами строим прямоугольники, высотой равной , гистограмма такая же, как и на рис. 6.

 

 

 

 

 

 

 

 

 

 

 

Наглядное представление структуры совокупности данных может быть представлено круговой диаграммой. Представляет собой круг, разделенный на секторы, соответствующие значениям переменной. Секторы раскрашиваются в различные цвета. Например, распределение абитуриентов по полу (рис.7).

 

 

Рис.7. Круговая диаграмма

Таким образом, мы рассмотрели такие формы представления статистической информации как табличное и графическое изображение. Описывая графические формы изображения, мы указали пять типов диаграмм: столбчатая, линейная, круговая диаграммы, гистограмма, полигон. Три первых из них изучаются в начальном курсе математики.

3. Числовые характеристики вариационных рядов

Целью описательной статистики помимо обработки эмпирических данных, их систематизации, наглядного представления в форме графиков и таблиц, является и их количественное описание посредством основных статистических показателей.

Часто возникает необходимость сравнивать между собой две или несколько совокупностей статистических данных. Поскольку сравнение производится по какому-то определенному свойству, то для проведения сравнения нужны показатели, характеризующие то или иное свойство совокупности данных одним числом. Такие показатели в статистике получили наименование числовых характеристик.

Простейшими числовыми характеристиками являются характеристики положения (среднее арифметическое, мода, медиана) и характеристики рассеивания (размах, среднее квадратичное отклонение).

Пусть из генеральной совокупности объема N относительно количественного признака Х произведена выборка объема n. Тогда генеральная средняя () вычисляется по формуле

,

где варианты имеют соответственно частоты N1, N2, …, Nk, причем N1 + N2 + … + Nk =N.

Выборочная средняя ( ) имеет формулу

,

где имеют соответственно частоты n1, n2, …, nk, причем n1+n2+…+nk = n.

В школьном курсе математики встречается понятие не выборочной средней, а среднего арифметического, или среднего значения.

Медианой вариационного ряда (Ме) называется то значение случайной величины, которое приходится на середину вариационного ряда. Если число вариант нечетное (n=2k+1), то

Ме= xk+1

Если число вариант четно (n=2k), то формула имеет следующий вид:

Мода М0 – это значение вариант, встречающее в ряду чаще других. В таблице распределения ряда мода – это значение частоты xj, которому соответствует наибольшее значение частоты nj.

Простейшей характеристикой рассеивания является размах. Размах выборки A – разность между наибольшим и наименьшим значениями выборки:

A=mах(хi)-min(xj)

Рассмотрим на примере практический смысл таких статистических показателей как среднее арифметическое и мода:

Пример: В аттестате о среднем образовании у четырех друзей – выпускников школы – оказались следующие оценки:

Ильин: 4,4,5,5,4,4,4,5,5,5,4,4,5,4,4;

Семенов: 3,4,3,3,3,3,4,3,3,3,3,4,4,5,4;

Попов: 5,5,5,5,5,4,4,5,5,5,5,5,4,4,4;

Романов: 3,3,4,4,4,4,4,3,4,4,4,5,3,4,4.

Средний балл каждого выпускника найдем по формуле среднего выборочного: и получим:

Ильин: ;

Семенов: ;

Попов: ;

Романов: .

Укажем наиболее типичную для каждого из них оценку в аттестате. Для этого найдем для каждой совокупности моду, то есть оценку, встречающуюся чаще других:

Ильин: 4 (9 раз из 15);

Семенов: 3 (9 раз из 15);

Попов: 5 (10 раз из 15);

Романов: 4 (10 раз из 15);

Рассмотрим на примере практический смысл таких статистических показателей как размах и медиана:

Пример: Отмечая время (с точностью до минут), которое токари бригады затратили на обработку одной детали, получили такой ряд данных:

30,32,32,38,36,31,32,38,35,36,32,40,42,36,33,35,32,32,40,38.

Найдем наибольший разброс времени на обработку детали по формуле нахождения размаха выборки: A=mах(хi)-min(xj).

mах(хi)= 42, min(xj)=30,  A=42-30=12.

Получаем, что наибольший разброс времени на обработку детали составляет 12 минут.

Найдем время обработки, которое не превысила половина токарей бригады по формуле нахождения медианы четного ряда , так как n=20. Для этого упорядочим ряд данных: 30,31,32,32,32,32,32,32,33,35,|35,36,36,36,38,38,38,40,40,42. В середине ряда видим два числа одинаковых числа 35: .

Получаем, что время обработки, которое не превысила половина токарей бригады, составляет 35 минут.

Еще один показатель рассеивания – среднее квадратичное отклонение , определяется по формуле:

где Dв- выборочная дисперсия.

Введение среднего квадратического отклонения объясняется тем, что дисперсия измеряется в квадратных единицах относительно размерности самой случайной величины.

Например, если возможные значения некоторой случайной величины измеряются в метрах, то её дисперсия измеряется в квадратных метрах. В тех случаях, когда нужно иметь числовую характеристику рассеяния возможных значений в той же размерности, что и сама случайная величина, и используется среднее квадратическое отклонение.

Из всех рассмотренных числовых характеристик в начальном курсе математики встречается только среднее арифметическое - выборочная средняя.

 

15

 



Информация о работе Статистическая обработка информации