Средние величины и показатели вариации

Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа

Краткое описание

Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.

Содержание

Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27

Прикрепленные файлы: 1 файл

Министерство образования и науки РФ.docx

— 374.14 Кб (Скачать документ)

Показатели четвертой итоговой строки являются основой для графического изображения выполненных расчетов на поле корреляции (рис.1).

Соединив между собой средние  значения в каждом интервале отрезками  прямых линий, получаем эмпирическую линию  регрессии y по x, которая показывает как в среднем изменяется y в связи с изменением x.

В нашем примере расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между потерями раб.времени и себестоимостью СМР.

1.5 Расчет теоретической  линии регрессии

Теоретическая линия регрессии  представляет собой такую математически  правильную кривую (либо прямую) линию, которая проходит наиболее близко к  точкам эмпирической линии регрессии  выражает общую закономерность средних  изменений признака в связи со средними изменениями фактора.

В нашем примере характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи y от x .

Параметры искомой прямой (ао1) находим из системы уравненной по способу наименьших квадратов:

(5)

Исходную информацию для решения  системы (5) получаем из таблицы 6, которая  основана на результатах таблицы 5.

Для получения упрощенных вариантов  по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем =269 чел-час., =13 чел-час.

Результатов расчетов по нашему примеру  приведены в таблице 6. 

Таблица 5

Расчет эмпирической линии регрессии  для зависимости y от x

 

Себестоимость СМР, тыс. руб.

x

Потери раб. времени, чел-час

 

Итого

 

y

243

256

269

282

295

 

3

185

 

13

     

1

2

167,8

     

12

 

1

1

150,55

11

11

 

11

11

4

0

133,3

10

10

10

 

10

4

-1

116

 

1-1

     

1

1

Итого

hi

2

4

1

2

2

n = 11

2

1

3

0

3

1

3

0,5

0,75

0

1,5

0,5

 

4

141,9

143,05

133,3

152,8

141,9

 

 

Таблица 6

Расчет  теоретической линии регрессии  для зависимости y от x

Себестоимость СМР, т.р.

 

Потери раб.времени, чел-час

№ столбца

4

1

0

1

4

1

2

3

4

 

-2

-1

0

1

2

li

li

2

li

2

 

x

y

243

256

269

282

295

       

3

185

 

1

     

1

3

9

9

2

167,8

     

1

 

1

2

4

4

1

150,55

1

1

 

1

1

4

4

1

4

0

133,3

1

1

1

 

1

4

0

0

0

-1

116

 

1

     

1

-1

1

1

№ строки

1

Итого

2

4

1

2

2

n=11

-

2

-4

-4

0

2

4

3

8

4

0

2

8

4

1

3

0

3

1

5

-2

-3

0

3

2


 

В качестве проверки  правильного  составление таблицы 6 должно соблюдаться  равенство итогов четвертой строки и второго столбца. Если это условие  не соблюдается, то в расчетах допущена ошибка, которая может привести к  существенным искажениям величины параметров теоретической линии регрессии.

В систему уравнений (5) подставим  результаты, полученные в табл. 6.


= -0,23.

= 0,85.

Параметры и необходимо преобразовать исходя из фактических значений x и y.

Формулы перевода из упрощенных в  реальные координаты:

 (8)

 (9)

где - интервал группировки по функции;

- интервал группировки по  аргументу;

- новое начало отсчета по  функции;

- новое начало отсчета по  аргументу.

По формулам (8), (9) находим:

.

Уравнение теоретической линии  регрессии в реальных коэффициентах  имеет вид y=65,9-0,3x.

В уравнении регрессии первое слагаемое  носит название свободного члена, второе слагаемое называется коэффициентом  регрессии. Он показывает, на сколько  натуральных единиц изменяется в  среднем результативный признак  при изменении факторного признака на единицу.

В нашем примере из уравнения  теоретической линии регрессии  видно, что себестоимость СМР  понижается на 0,3% при увеличении потери раб.времени на 1%.

Себестоимость СМР, не зависящая от рассматриваемых факторов, равна  65,9 тыс.руб.

1.6 Измерение тесноты  связи

Коэффициент корреляции является одним из наиболее совершенных методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.

Коэффициент корреляции может принимать  как положительные, так и отрицательные  значения, т.е. .

При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается  условие, при котором знак при  коэффициенте корреляции должен совпадать со знаком при коэффициенте регрессии а1.

Для расчета коэффициента корреляции существует формула, представленная в  упрощенных координатах признаков x и y.

.  (10)

В нашем примере исходную информацию для нахождения принимаем из таблицы 6.

Выполненные расчеты показывают, что  между себестоимостью СМР и потерями раб.времени существует положительная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y увеличивается.

Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, так как r=-0,29, следовательно, имеем по соотношению Чэддока заметную связь между изучаемыми явлениями.

Имеются и  другие формулы линейного  коэффициента корреляции.

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:

, (11) или  . (12)

Числитель формулы (12), деленный на n, т.е. , представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений.

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле (27) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

В нашей задаче для расчета r построить вспомогательную таблицу 7.

Таблица 7

 

Вспомогательные расчеты линейного коэффициента корреляции

i

xi

yi

1

292

116

625

841

66

3079

2

243

130

576

225

33

2871

3

260

126

49

361

12

2978

4

256

132

121

169

13

3072

5

295

150

784

25

13

4022

6

254

141

169

16

5

3255

7

248

147

361

4

4

3314

8

256

156

121

121

11

3630

9

280

163

169

324

21

4149

10

276

150

49

25

3

3763

11

285

185

324

1600

65

4793

Итого

2945

1596

3348

3711

246

38926


Пользуясь данными табл.7  рассчитать  линейный коэффициент  корреляции по формулам  12 и 13.

В нашей задаче: = 17,4; = =18,36. Тогда по формуле (12) : r = (38926 –145*267)/ (17,4*18,36) = -0,293, то есть связь между потерями раб.времени и себестоимостью СМР очень близка к функциональной.

 

1.7 Общий вывод  по разделу «Корреляционный анализ»

По данным таблицы 2 и 3 мы построили интервальные и дискретные ряды. При помощи таблицы 2 сделали вывод, что ряд распределения  по потери раб.времени показывает, что наиболее характерным является группа с центральным значением интервала 256 чел-час., так как она составляет 36,36% от всего количества потери раб.времени. Ряд распределения по себестоимости СМР, что наиболее характерным является группа с центральным значением интервала 133,3, 150,5 тыс. руб., так как она составляет 36,36% от всего количества себ-ти СМР.

Затем мы строим корреляционную таблицу, которая показывает, что при переходе слева направо в сторону больших значений факторного признака x  соответствующие ряды распределения функционального признака  y смещаются сверху вниз, т.е. в сторону меньших значений функций.

Далее считаем эмпирическую линию  регрессии, которая вновь подтвердила наличие корреляционной зависимости между потерями раб.времени и себестоимостью СМР. В нашем примере из уравнения теоретической линии регрессии видно, что себестоимость СМР понижается на 0,3% при увеличении потери раб.времени на 1%.

Знак при коэффициенте корреляции совпадает со знаком регрессии а1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, т.к. r=-0,29, следовательно, имеем функциональную связь между изучаемыми явлениями.

 

Глава 2. Средние  величины и показатели вариации

Вариант 12

Задача. Имеются следующие данные о количестве регистраций в соц.: 1; 2; 3; 4; 5; 2; 4; 3; 5; 1; 4; 4; 6; 2; 1; 3; 7; 4; 3; 1.

Для анализа распределения кол-ва регистраций в соц.: 1) построить  интервальный ряд распределения; 2) рассчитать модальный, медианный и  средний возраст, установить его  типичность с помощью коэффициентов  вариации.

Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):

n = 1 +3,322 lg N,  (12)

где N – число величин в дискретном ряде.

В нашей задаче n = 1 + 3,322lg20 = 5,3. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5.

Информация о работе Средние величины и показатели вариации