Построение и графическое изображение вариационных рядов

Автор работы: Пользователь скрыл имя, 16 Января 2013 в 18:01, контрольная работа

Краткое описание

Excel предлагает широкий диапазон средств для анализа статистических данных. Такие встроенные функции, как СРЗНАЧ, МЕДИАНА, МОДА, могут быть полезны для проведения несложного анализа. Если встроенных статистических функций недостаточно, то можно обратиться к Пакету анализа.
Пакет анализа, являющийся надстройкой, содержит коллекцию функций и инструментов, расширяющих встроенные аналитические возможности Excel. В частности, пакет анализа можно использовать для создания гистограмм, ранжирования данных, извлечения случайных или периодических выборок из выбора данных, проведения регрессионного анализа, получения основных статистических характеристик выборки, генерации случайных чисел с различным распределением и для многих других расчетов.

Содержание

Введение……………………………………………………………………………….3
1. Построение и графическое изображение вариационных рядов…………………4
1.1 Порядок построения вариационных рядов и их графическое изображение…..4
1.2 Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………………………………………………6
2. Статистические характеристики рядов распределения………………………...11
2.1 Показатели центра распределения……………………………………………...11
2.2 Показатели колеблемости признака…………………………………………….12
2.3 Показатели формы распределения……………………………………………...13
2.4 Расчёт статистических характеристик рядов распределения с помощью
Excel………………………………………………………………………………….16
2.5 Статистические оценки параметров распределения…………………………..18
2.6 Проверка гипотезы о законе нормального распределения……………………20
2.7 Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel……………………………….22
3. Корреляционно-регрессионный анализ………………………………………….25
3.1 Определение параметров уравнения регрессии и показателей тесноты
корреляционной связи……………………………………………………………….25
3.2 Оценка значимости уравнения регрессии и параметров тесноты связи……..29
3.3 Корреляционно-регрессионный анализ в Excel………………………………..31
Список литературы…………………………………………………………………..33
Приложение………………………………………………………..............................34

Прикрепленные файлы: 1 файл

РГР по статистике.doc

— 504.00 Кб (Скачать документ)

Возможное расхождение  между выборочными и генеральными характеристиками составляет ошибку выборки.

 

Стандартная ошибка выборочной средней определяется по формуле:

Точечной оценкой генеральной  средней является выборочная средняя .

Для определения интервальной оценки необходимо найти доверительный интервал , , где

- предельная ошибка выборочной  средней;

- коэффициент доверия, который  определяют по таблице распределения Стьюдента по заданным    и   при малой выборке при n <= 30.

Для нахождения доверительного интервала в Excel выбираем Статистические функции – Доверит, ОК, в появившемся окне заполняем поля: Альфа- уровень значимости (α = 0,05 или 0,01 для социально-экономических явлений); Стандартное отклонение – среднее квадратическое отклонение; Размер – объём выборки (в нашей работе n=30). Нажимаем ОК, появляется значение функции. Так, для качества почв в поле Альфа ставим уровень значимости α = 0,05; в поле Стандартное отклонение –11,0, в поле Размер – объём выборки 30. При нажатии ОК видим значение 3,936. Это предельная ошибка выборки, с её помощью строим доверительный интервал для генеральной средней: 
                                                59,7-0,732<= <=59,7+0,732

58,968<=

<=60,432

Вывод: с вероятностью 0,95 мы можем утверждать, что генеральная средняя не выйдет за пределы от  58,968 баллов до 60,432 балла.

Аналогичные действия выполним для урожайности озимой пшеницы. В соответствующие поля введём уровень значимости, среднее квадратическое отклонение, объём выборки: 0,05;0,04; 30. Щёлкаем ОК и получаем 0,300. Строим доверительный интервал:

26,1-0,300<=

<=26,1+0,300

25,8<=

<=26,4

Вывод: с вероятностью 0,95 можно утверждать, что генеральная средняя урожайности озимой пшеницы от 25,8ц/га до 26,4ц/га.

 

 

 

2.6. Проверка гипотезы о законе нормального распределения.

 

 

Для объективной оценки степени соответствия эмпирического  распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Смирнова и др. Рассмотрим критерий Пирсона.

Критерий Пирсона  определяется по формуле:

, где         (1)

(хи-квадрат) – Критерий Пирсона;

ni - эмпирические частоты;

nt – теоретические частоты.

Теоретические частоты  вычисляются по формуле:

, где           (2)

– теоретические частоты;

- фактические частоты; - шаг (величина интервала);

- нормированные отклонения;

  - дифференциальная функция  Лапласа (значения даны в приложении 2).

Вычисления выполняются в следующей последовательности:

1). Определяются нормированные  отклонения:

                                     (3)

2). При рассчитанных  значениях t по таблице плотности нормального распределения (значений дифференциальной функции t)= t2/2) отыскиваются значения функции плотности стандартизованного нормального распределения.

3). Вычисляется выражение  .

4). По приведённой выше формуле (1) рассчитывается критерий Пирсона.

5). Подставляя в формулу  t) и , определяют теоретические частоты.

Рассчитанное значение сравнивается с табличным при  соответствующем числе степени  свободы и заданном уровне значимости. Если расчетное значение  χ2 меньше табличного, то делается вывод о несущественности расхождений между эмпирическим и теоретическим распределении (т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, принимается). В противном случае утверждается, что исследуемое эмпирическое распределение имеет отличный от теоретического закон распределения.

Возможен вариант проверки гипотезы соответствия эмпирического  распределения теоретическому с помощью таблиц определения вероятности  Р(χ2). В таблице распределения Пирсона по рассчитанной величине χ2 и числу степеней свободы v=k-1 находим вероятность Р(χ2). При Р>0.5 считается, что эмпирическое и теоретическое распределения близки. В остальных случаях делается вывод о несовпадении эмпирического и теоретического распределений.

 

 

 

2.7. Проверка гипотезы о законе нормального распределения  по критерию Пирсона с помощью табличного процессора Excel.

 

 

Вместо заполнения большого количества таблиц можно воспользоваться  статистическими функциями.

Проверку гипотезы о  законе нормального распределения  выполним на примере интервального  вариационного ряда, построенного в пункте 1.2, и статистических характеристик ряда из пункта 2.4 (Рис. 3).

Рис.3 Хи тест.

Расход кормов на 1 корову ,ц(х)

Фактические частоты, ni

Середины интервала

30,2-33

3

32

33-36

4

34

36-38

5

37

38-41

11

40

41-44

5

42

44-46

2

45

30

х


 

 

 

 

Рис.3 Хи тест (продолжение).

t

φ(ui)

 

Теоретические частоты, nt

-3,66

0,1145

20,31

2,33

-3,54

0,2565

20,31

5,21

-3,35

0,3802

20,31

7,72

-3,16

0,3697

20,31

7,51

-3,03

0,2371

20,31

4,82

-2,84

0,1023

20,31

2,08

х

x

x

x


 

ХИ критическое

11,07

 

Значимость  ХИ

0,6892941

 Нулевая  гипотеза принимается

Хи фактическое

3,0693545

 

 

    1. Находим нормализованные значения признака. Вызываем список функций, выбираем функцию «Нормализация» (Standatrdize). В поле «Х» вводим название ячейки первого интервала, во втором поле среднее значение по выборке, в третьем поле стандартное отклонение выборки. Копируем данную формулу для остальных строк.
    2. По таблице плотности распределения u) находим вероятность распределения этих значений и заполняем следующий столбец.
    3. Следующий столбец заполняем рассчитанным выражением .
    4. Находим теоретические частоты по формуле (2) и заполняем последний 8 столбец.
    5. Далее, для вычисления критерия Пирсона, воспользуемся функцией «Хи2Тест». В поле «Фактический интервал» выделяем массив фактических частот, в поле «Ожидаемый интервал» вводим массив теоретических частот. В результате получаем значимость фактического критерия Пирсона. Чтобы получить фактическое значение критерия Пирсона, воспользуемся функцией «Хи2Обр». В поле «вероятность» вводим полученную значимость критерия (ячейка В11), а в поле «степени свободы» соответствующее число степеней свободы для данной группировки. В данном случае n-1=  (n – число групп).

 
       Полученную в пункте 5 фактическую значимость критерия Пирсона «р» сравниваем с установленным уровнем значимости «α». Если αфакт<α=0,05, то утверждаем, что эмпирическое распределение сходно с теоретическим и гипотеза отвергается. Далее если нужно, мы находим фактическое значение критерия по значимости «α» и числа степеней свободы.

В данном примере (Рис. 3) есть неточность, поэтому результаты оценки являются смещёнными. При теоретических частотах меньше 5, необходимо объединить соседние группы и провести тест заново. Пример представлен на рис. 4.

Рис.4 Хи тест: объединение  групп.

Расход кормов на 1 корову ,ц (х)

Фактические частоты, ni

Середины интервала

30,2-35

6

33

35-39

10

37

39-43

7

41

43-47

7

45

30

х


 

t

φ(ui)

 

Теоретические частоты, nt

-3,58

0,1826

20,31

3,71

-3,33

0,3802

20,31

7,72

-3,08

0,3712

20,31

7,54

-2,82

0,1647

20,31

3,35

ХИ критическое

7,81

 

Значимость  ХИ

0,3453229

 Нулевая  гипотеза принимается

Хи фактическое

2,126551

 

 

Данный пример соответствует  методике проверки гипотезы о законе нормального распределения по критерию Пирсона.

 

 

 

3. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

3.1. Определение параметров уравнения регрессии и показателей и тесноты корреляционной связи.

 

 

Социально-экономические  явления находятся между собой  в сложной взаимосвязи, зависимости. По характеру зависимости статистика различает два вида связей:

1). Функциональную;

2). Корреляционную.

Корреляционная связь  характеризуется тем, что между  изменением независимой переменной (факторного признака) и зависимой переменной нет полного соответствия: каждому значению факторного признака может соответствовать распределение значений результативного.

Корреляционная связь  проявляется лишь в массе случаев – в совокупности достаточно большого объёма. При этом изменение независимой величины ведёт к изменению среднего значения зависимой переменной.

По направлению различают  прямые и обратные связи. При прямой связи с увеличением факторного признака увеличивается результативный. При обратной связи с ростом факторного признака значения результативного уменьшаются.

По аналитическому выражению  связи днлятся на прямолинейные (линейные) и криволинейные (нелинейные). Линейная связь выражается линейной функцией (уравнением прямой), нелинейная – криволинейной в виде параболы, гиперболы, показательной кривой и т.д.

Функция, отображающая корреляционную связь между признаками, называется уравнением регрессии. Уравнение регрессии выражается функцией у=f(x1,x2,…,xn).

Уравнения регрессии  могут иметь следующую форму.

Уравнение прямой:

yx=a0+a1x

Уравнение гиперболы:

yx=a0+a1*1/х

Уравнение параболы второго порядка:

yx=a0+a1x+а2х2

Степенное уравнение:

yx=a0ха1

Показательное уравнение:

yx= a0+ a1х

Многофакторная корреляционная связь чаще всего описывается линейным уравнением множественной регрессии:

yx=a0+a1x+а2х+…+акхк

Параметр а1 в уравнении прямой называется коэффициентом регрессии. Он показывает, на сколько в среднем изменяется величина результативного признака при изменении факторного на единицу. При прямой корреляционной связи коэффициент регрессии имеет положительный знак, при обратной - отрицательный.

Количественная характеристика корреляционной связи даётся с помощью ряда статистических показателей – коэффициентов корреляции, регрессии и т.д.

Наиболее распространенным и совершенным методом изучения корреляционных связей является корреляционно-регрессионный анализ.

Информация о работе Построение и графическое изображение вариационных рядов