Построение и графическое изображение вариационных рядов

Автор работы: Пользователь скрыл имя, 16 Января 2013 в 18:01, контрольная работа

Краткое описание

Excel предлагает широкий диапазон средств для анализа статистических данных. Такие встроенные функции, как СРЗНАЧ, МЕДИАНА, МОДА, могут быть полезны для проведения несложного анализа. Если встроенных статистических функций недостаточно, то можно обратиться к Пакету анализа.
Пакет анализа, являющийся надстройкой, содержит коллекцию функций и инструментов, расширяющих встроенные аналитические возможности Excel. В частности, пакет анализа можно использовать для создания гистограмм, ранжирования данных, извлечения случайных или периодических выборок из выбора данных, проведения регрессионного анализа, получения основных статистических характеристик выборки, генерации случайных чисел с различным распределением и для многих других расчетов.

Содержание

Введение……………………………………………………………………………….3
1. Построение и графическое изображение вариационных рядов…………………4
1.1 Порядок построения вариационных рядов и их графическое изображение…..4
1.2 Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………………………………………………6
2. Статистические характеристики рядов распределения………………………...11
2.1 Показатели центра распределения……………………………………………...11
2.2 Показатели колеблемости признака…………………………………………….12
2.3 Показатели формы распределения……………………………………………...13
2.4 Расчёт статистических характеристик рядов распределения с помощью
Excel………………………………………………………………………………….16
2.5 Статистические оценки параметров распределения…………………………..18
2.6 Проверка гипотезы о законе нормального распределения……………………20
2.7 Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel……………………………….22
3. Корреляционно-регрессионный анализ………………………………………….25
3.1 Определение параметров уравнения регрессии и показателей тесноты
корреляционной связи……………………………………………………………….25
3.2 Оценка значимости уравнения регрессии и параметров тесноты связи……..29
3.3 Корреляционно-регрессионный анализ в Excel………………………………..31
Список литературы…………………………………………………………………..33
Приложение………………………………………………………..............................34

Прикрепленные файлы: 1 файл

РГР по статистике.doc

— 504.00 Кб (Скачать документ)

 

Рассчитаем частоты  для интервального ряда. Слева  от столбца интервалы на одну строку ниже выделяем будущий массив частот, шесть строк (по количеству групп). Вызовем функцию Частота (Frequency). В первом поле выбираем массив исходных данных, во втором поле массив интервалов и нажимаем комбинацию клавиш Shift+Ctrl+Enter. В результате появится пять значений частот.

3. Для построения диаграммы  необходимо найти середины интервалов. Для этого слева от накопленных  частот вводим формулу расчёта  середины интервала: = (ниж+верх)/2. Копируем формулу для всех пяти групп.

Далее выбираем меню «Вставка»  → «Диаграмма». Выбираем вид диаграммы – гистограмма. Выделяем область частот и середины интервалов, нажимаем «ОК».

Полученную диаграмму  редактируем. Щёлкаем правой кнопкой мыши на диаграмме и выбираем «Исходные данные». В появившемся окне выбираем закладку «Ряд». В поле «Значения» выделяем частоты интервального ряда. В поле «Подписи по Х» выделяем значения середин интервалов. Если в поле «Ряд» два названия ряда, то лишний нужно удалить. Нажимаем «ОК».

Далее щёлкаем по гистограмме  правой кнопкой мыши, выбираем «Формат рядов данных». В закладке параметры ставим нулевое значение ширины зазора (рис. 2).

Рис.2. Гистограмма распределения внесенных удобрений на 1 га,кг.в д.в.

 

 

2. СТАТИСТИЧЕСКИЕ  ХАРАКТЕРИСТИКИ РЯДОВ РАСПРЕДЕЛЕНИЯ

2.1. Показатели  центра распределения

 

 

Средней в статистике называется показатель, характеризующий типичный размер признака в совокупности.

Средняя арифметическая вычисляется по формулам:

простая  ;    взвешенная   ,

 

где - среднее значение признака; - варианты; - частоты; - численность совокупности.

Характеристиками вариационных рядов наряду со степенными средними являются мода и медиана.

Мода- величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. В дискретных рядах распределения модой будет варианта с наибольшей частотой.

В интервальном ряду мода определя6ется по формуле:

 

                         ,

 

где -нижняя граница интервала, содержащего моду; - величина модального интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота послемодального интервала.

Медианой в статистике называется варианта, расположенная в середине вариационного ряда. Если ряд дискретный  имеет нечётное число, то медианой будет варианта, расположенная в середине упорядоченного ряда и  её порядковый номер . Если ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух вариант в середине ряда с порядковыми номерами: и .

В интервальном ряду медиана рассчитывается по формуле:

где - нижняя граница медианного интервала; - величина медианного интервала; - сумма накопленных частот, предшествующих медианному интервалу; -частота медианного интервала.

 

 

2.2. Показатели  колеблемости признака.

 

 

Для измерения колеблемости признака применяются абсолютные и относительные показатели вариации.

Размах вариации - это разность между максимальным и минимальным значениями изучаемого признака.

R = xmax-xmin

Среднее линейное отклонение - средняя арифметическая из модулей абсолютных отклонений вариантов от их среднего значения.

  Дисперсия- это средний квадрат отклонений вариантов от их средней арифметической.

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.

Коэффициент осцилляции – отношение размаха вариации к средней арифметической:

%.

Относительное линейное отклонение – отношение среднего линейного отклонения к средней:

%.

 

Коэффициент вариации – отношение среднего квадратического отклонения  к средней:

%.

 

 

 

2.3. Показатели формы распределения.

 

 

 

 

Зависимость распределения  частот от вариации изучаемого признака есть закономерность распределения. Эмпирическое распределение – распределение, полученное в результате обработки данных статистического наблюдения (эмпирического материала). Теоретическое распределение – это распределение частот в гипотетическом вариационном ряду с бесконечно большим числом единиц совокупности и бесконечно малой величиной интервала.

Теоретическая кривая распределения  выражает общую закономерность распределения  в чистом виде при исключении влияния случайных факторов.

В статистике широко известны различные виды распределений - нормальное распределение, биноминальное, распределение Пуассона и др. Наиболее употребительным является нормальное распределение, выражающее закономерности взаимодействия случайных величин. Оно служит удачной моделью, с которой сравнивают анализируемое эмпирическое распределение. Если расхождения не велики, то их объясняют действием случайных факторов и считают данное распределение близким к нормальному. В противном случае делают вывод о несоответствии рассматриваемого распределения нормальному.

В практике статистического исследования встречаются различные типы нормального распределения: 1) одновершинные и многовершинные; 2) симметричные и ассиметричные; 3) островершинные и плосковершинные.

К одновершинным относят распределения, в которых одна центральная варианта имеет наибольшую частоту. Многовершинные  - это распределения с несколькими максимумами частот.

Симметричные – это распределения, в которых частоты вариант, равностоящих от центра, равны между собой. В ассиметричных распределениях частоты убывают от центра вправо и влево с разной скоростью (не равны между собой).

Островершинные – эмпирические распределения, максимальная ордината которых больше максимальной ординаты теоретического распределения. В плосковершинных максимальная ордината эмпирического распределения меньше максимальной ординаты теоретического.

Эмпирические распределения, как правило, ассиметричны, то есть смещены по отношению к центру распределения вправо или влево. Для определения направления и величины этого смещения применяется коэффициент асимметрии. Он может быть рассчитан по формулам:

 

;     или              , где μ3 – центральный момент первого порядка.

Положительная величина коэффициента указывает на правостороннюю асимметрию, отрицательная – на левостороннюю.

Островершинность распределения  характеризуется с помощью коэффициента эксцесса Ех:

, где

  μ4 – центральный момент четвертого порядка:

Этот коэффициент положителен при островершинности и отрицателен при плосковершинности.

 Чтобы определить, насколько близко эмпирическое распределение к нормальному, необходимо произвести выравнивание фактического распределения по кривой нормального распределения. С этой целью рассчитываются теоретические частоты по формуле:

,

где – теоретические частоты; - фактические частоты; - шаг (величина интервала); - нормированные отклонения;   - дифференциальная функция Лапласа (значения даны в приложении 2).

 

 

 

 

 

2.4. Расчёт статистических характеристик рядов распределения с помощью Excel.

 

 

Большинство параметров ряда распределения вычисляется  с помощью функции Описательная статистика.

Откроем лист Excel, скопируем в ячейки А1:А31 данные по качеству почв, вместе с условным обозначение показателя – х, в ячейки В1:В31 данные по урожайности яровой пшеницы на 1 га.

  1. В меню Сервис выберем Анализ данных, затем Описательная статистика и нажмём ОК.
  2. В поле Входной интервал введём адреса ячеек, содержащих исходные данные А1:В31.
  3. Введём данные в поле Выходной интервал; в нашем случае возьмём ячейку $С$1. Вниз и вправо от этой ячейки будут выведены рассчитанные параметры.
  4. Поставим флажки в окошках Метки в первой строке, Итоговая статистика, Уровень надёжности.
  5. Нажмём кнопку ОК.

Справа от исходных данных получим основные характеристики изучаемой  совокупности. Уменьшаем разрядность  до разумных пределов с помощью кнопки 0→00 (уменьшить разрядность). Копируем эти данные и переносим их в РГР в виде таблицы.

 

 

 

 

 

 

 

Таблица 4. Показатели центра, вариации и формы распределения.

Внесено мин.удобрений на 1 га.,кг в д.в.

Урожайность озимой пшеницы,ц/га.

Название показателя

Размер

Название показателя

Размер

Среднее

59,7

Среднее

26,1

Стандартная ошибка

2,0

Стандартная ошибка

0,8

Медиана

60

Медиана

25

Мода

60

Мода

25

Стандартное отклонение

11,0

Стандартное отклонение

4,5

Дисперсия выборки

121,3

Дисперсия выборки

20,4

Эксцесс

-0,7

Эксцесс

-0,2

Асимметричность

0,0

Асимметричность

0,2

Интервал

40

Интервал

17

Минимум

40

Минимум

18

Максимум

80

Максимум

35

Сумма

1732

Сумма

757

Счет

29

Счет

29

Уровень надежности(95,0%)

4,2

Уровень надежности(95,0%)

1,7


 

В данной таблице представлены показатели центра распределения – средняя арифметическая, мода и медиана, показатели вариации – дисперсия и среднее квадратическое отклонение, показатели формы распределения - коэффициенты асимметрии и эксцесса. Среднее – это средняя арифметическая величина, стандартная ошибка – это средняя ошибка выборки, стандартное отклонение – среднее квадратическое отклонение, эксцесс и асимметричность – коэффициенты эксцесса и асимметрии, интервал – разность между максимальным и минимальным значениями признака в совокупности, минимум – минимальное значение признака, максимум – максимальное значение признака, сумма – сумма всех значений признака, счёт – число единиц совокупности.

На основе приведённых  в таблице данных вычислим коэффициент  вариации.

Для внесенных мин.удобрений:

%=4,5/26,1*100%=18%

Для урожайности озимой пшеницы:

%=11,0/59,7*100%=19%

На основе данных таблицы  сформулируем выводы.

Выводы. В данной совокупности сельскохозяйственных предприятий средняя внесенных мин.удобрений составляет 59,7кг.в д.в.,а среднее урожайности озимой пшеницы-26,1ц/га.

Медиана Ме=60 показывает, что половина сельскохозяйственных предприятий вносит мин.удобрений на 1 га.больше 60кг.в д.в., а половина больше 60 кг.в д.в.;Ме=25 покакзывает,что у половины сельскохозяйственных предприятий урожайность озимой пшеницы больше 25 ц/га,ва у половины меньше 25 ц/га.

Коэффициенты вариации свидетельствуют о слабой вариации обоих признаков , так как оба коэффициента меньше 20%.

Коэффициенты эксцесса показывают, что распределение хозяйств по внесению мин.удобрений на 1 га, является плосковершинным (Ех<0), распределение по урожайности озимой пшеницы также плосковершинным (Ех<0).

По коэффициентам асимметрии можно сделать вывод о том, что распределение хозяйств по внесению мин.удобрений на 1 га.имеет правую асимметричность (As>0), распределение хозяйств по урожайности озимой пшеницы правую асимметричность (As>0).

 

 

2.5 Статистические оценки параметров распределения.

 

 

Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.

Статистической  оценкой называется специальная функция, вычисляемая на основании выборочных данных для приближенной замены неизвестного параметра распределения или самого распределения. Различают оценки смещённые и несмещённые, точечные и интервальные.

Информация о работе Построение и графическое изображение вариационных рядов