Корреляционный анализ

Автор работы: Пользователь скрыл имя, 24 Октября 2014 в 10:56, курсовая работа

Краткое описание

Для корреляционного анализа зависимости результативного признака y от факторного признака x необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.

Содержание

ВВЕДЕНИЕ__________________________________________________________
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Построение рядов распределения________________________________________
Построение поля корреляции____________________________________________
Построение корреляционной таблицы____________________________________
Расчет и построение эмпирической линии регрессии________________________
Расчет и построение теоретической линии регрессии_______________________
Измерение тесноты связи_______________________________________________
ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ
Групповая дисперсия__________________________________________________
Средняя из групповых_________________________________________________
Межгрупповая дисперсия_______________________________________________
Общая дисперсия______________________________________________________
Среднее квадратическое отклонение______________________________________
Показатель вариации___________________________________________________
Эмпирический коэффициент детерминации_______________________________
Эмпирическое корреляционное отношение________________________________
Анализ выполненных расчетов и вывод__________________________________
АНАЛИЗ ДИНАМИЧЕСКИХ РЯДОВ
Определение данных для 3-го динамического ряда по двум исходным данным______________________________________________________________
Установление вида ряда динамики_______________________________________
Определение среднего уровня динамики__________________________________
Определение показателей изменения уровня ряда динамики__________________
Определение среднего абсолютного прироста______________________________
Определение среднегодовых темпов роста и прироста______________________
Графическое изображение показателей динамических рядов_________________
Анализ полученных показателей динамических рядов_______________________
ЗАКЛЮЧЕНИЕ_______________________________________________________
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ___________________________

Прикрепленные файлы: 1 файл

курсовая статистика новый.doc

— 630.50 Кб (Скачать документ)

 

Результаты расчетов, выполненные в вышеуказанной таблице, позволяют сделать вывод о том, что при переходе слева направо в сторону больших значений факторного признака х соответствующие ряды распределения функционального признака у смещаются сверху вниз, т.е. в сторону меньших значений функций. Следовательно, объем смр находятся в корреляционной зависимости от среднегодовой стоимости производственных фондов.

 

 

1.4 Расчет и построение эмпирической линии регрессии

 

После установления наличия корреляционной зависимости между функциональным и факторным признаками, приступаем к следующему этапу статистического моделирования – к исследованию формы связи.

Под формой корреляционной связи понимают тип аналитической формулы, выражающей зависимость между изучаемыми величинами.

Необходимо установить, какие изменяются средние значения y в связи с изменением x.

Рассчитываем средние величины для каждого ряда распределения по формуле средней взвешенной арифметической величины:

                                                       Σ m y

                                               y =                 

                                                        Σ m


где y – средневзвешенное значение функции;


      у – центральные  значения интервалов по функции;

     m – абсолютные частоты вариантов у.

 

 

 

Для сокращения вычислений при определении средней арифметической можно использовать метод отсчета от условного нуля.

y = y'i iy + cy;


при этом


                                                          y – cy

                                                  y' =


                                                             iy

 

где y' – упрощенные варианты у;

      у – фактические  варианты у;

     сy – новое начало отсчета по оси у (условный нуль);

     iy – интервал группировки по у.

Новое начало отсчета выбираем таким образом, чтобы число наблюдений распределялось примерно поровну между положительным и отрицательным направлениями оси ординат. Условный нуль су = 132 тыс. руб., iy = 8.

 

Расчет эмпирической линии регрессии для зависимости у от х

Объем СМР, тыс. руб.

у'

х

у

Среднегодовая стоимость основных фондов тыс. руб.

Итого

70

76

82

88

94

100

106

112

118

124

130

6

180

16

                   

1

5

172

 

15

                 

1

4

164

   

14

               

1

3

156

                     

0

2

148

                     

0

1

140

                     

0

0

132

                     

0

- 1

124

           

1-1

1-1

     

2

- 2

116

 

1-2

       

1-2

 

1-2

   

3

- 3

108

             

1-3

 

1-3

 

2

- 4

100

                 

1-4

1-4

1

№ строки

1

Итого hi

1

2

1

0

0

0

2

2

1

1

1

n = 11

2

Σ miy'i

6

3

4

0

0

0

-3

-4

-2

-7

-4

Σy’ = -7

3

y'

6

1,5

2

0

0

0

-1,5

-2

-2

-7

-4

 

4

y

180

144

148

132

132

132

120

116

116

76

100

 

 

 

 

1.5 Расчет и построение теоретической линии регрессии

 

Теоретическая линия регрессии представляет собой такую математически правильную кривую (любую прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.

В данном случае характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи у от х    у = а0 + а1х

Параметры искомой прямой (а0, а1) нахожу из системы уравнений по способу наименьших квадратов:

na'0 + a'1Σx' = Σy'1


        a'0Σx' + a'1Σ(x')2 = Σy'ix'

Исходную информацию для решения данной системы получаем из таблицы «Расчет теоретической линии регрессии для зависимости у от х», которая основана на результатах таблицы «Расчет эмпирической линии регрессии для зависимости у от х».

Для получения упрощенных вариантов по факторному признаку используется метод отсчета от условного нуля. В данном примере сх = 112 чел.,                iх = 6. 

Расчет теоретической линии регрессии для зависимости у от х

Объем СМР, тыс. руб.

                                             Среднегодовая стоимость основных  фондов тыс.руб.

№ столбца

y'

x'2

25

16

9

4

1

0

1

4

9

16

25

1

2

3

4

x'

-5

-4

-3

-2

-1

0

1

2

3

4

5

li

liy'

y'2

liy'2

x

y

70

76

83

120

122

112

116

115

119

126

  130

6

180

1

                   

1

6

36

36

5

172

 

1

                 

1

5

25

25

4

164

                     

0

0

16

0

3

156

     

1

             

1

3

9

9

2

148

                     

0

0

4

0

1

140

                     

0

0

1

1

0

132

                     

0

0

0

0

- 1

124

             

1

     

1

-1

1

1

- 2

116

             

1

1

   

2

-4

4

8

- 3

108

   

1

       

1

 

1

 

3

-9

9

27

- 4

100

                 

1

1

2

-8

16

32

 

1

Итого hi

1

1

1

1

0

0

0

3

1

2

1

n = 11

Σy' = -8

-

Σy'2 = 139

 

2

Σ hix'

-5

-4

-3

-2

0

0

0

6

3

8

5

Σ x' = 8

 

3

Σ hix'2

25

16

9

4

0

0

0

12

9

32

25

Σ x'2 = 132

 

4

Σ miy'i

6

5

-3

3

0

0

0

-6

-2

-7

-4

Σy' = -8

 

5

Σ miy'iх'i

-30

-20

9

-6

0

0

0

-12

-6

-28

-20

Σy'х' = -113


 

 

 

 

 

Результаты расчетов приведены в таблице «Расчет теоретической линии регрессии для зависимости у от х».

В систему уравнений подставляем результаты, полученные в таблице «Расчет теоретической линии регрессии для зависимости у от х»:

11a'0 + 8a'1 = -8


        8a'0 + 132 a'1 = –113

В качестве метода решения данной системы принимаем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого 1-ое уравнение системы делим на –8, а 2-ое уравнение – на 132.

       –1,375a'0 – a'1 = 1


            0,061a'0 + a'1 = –0,856

Сложим уравнения полученной системы:

–1,314а'0 = 0,144

Откуда:

а'0 = -0,109

Затем подставляем в уравнение а'0 и находим величину а'1:

–1,375 * (-0,109) – а'1 = 1

а'1 = –0,850

Параметры а'0 и а'1 необходимо преобразовать исходя из фактических значений х и у.

Формулы перевода из упрощенных в реальные координаты:

                                                                           iy

а1 = а'1 *


                       ix

                                     iy 

           a0 = cy + iya'0 – a'1       cx

                                     ix


где iy – интервал группировки по функции;

      ix – интервал группировки по аргументу;

     cy – новое начало отсчета по функции;

     cx – новое начало отсчета по аргументу.

Находим:

а0 = 258,125;        а1 = –1,288

Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид: у = 258,125 – 1,288х.

В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.

Вывод: из уравнения теоретической линии регрессии видно, что объем СМР понижается на 1,288% при увеличении численности на 1%.

Объем СМР, не зависящий от рассматриваемых факторов, равен 1433,7 тыс. руб.

Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.

В данной курсовой проводим на поле корреляции прямую линию.

Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками

 

2. ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Если всю изучаемую совокупность разделить на группы, то можно рассчитать следующие виды дисперсий:

  • групповую дисперсию;
  • среднюю из групповых дисперсий;
  • межгрупповую дисперсию;
  • общую дисперсию по правилу сложения дисперсий.

Рассмотрим на примере влияния численности работников на накладные расходы выше перечисленные виды дисперсий. По данным первого задания работы выделим три группы по результативному признаку – объем смр (тыс.руб.) и вычислим следующее:

2.1 Групповая дисперсия

 

Группировочным или факторным признаком является среднегодовая стоимость основных средств (тыс.руб.), т.е. мы разбиваем изучаемую совокупность на три группы:

  1. Среднегодовая стоимость от 70 до 95 тыс. руб.
  2. Среднегодовая стоимость от 95 до 120 тыс. руб.
  3. Среднегодовая стоимость от 120 и более тыс. руб.

Объемы смр является результативным признаком (у), который зависит от изменения среднегодовой стоимости .

Среднегодовая стоимость от 70 до 95 тыс.руб.

Среднегодовая стоимость от 95 до 120 тыс.руб

Среднегодовая стоимость от 120 и более тыс.руб

Объем смр

yi – y

(yi – y)2

Объем смр

yi – y

(yi – y)2

Объем смр

yi – y

(yi – y)2

1

100

-5,67

32,15

1

118

-31,6

998,56

1

149

–17,34

300,68

2

108

   2,33

5,43

2

152

2,4

2,76

2

170

3,66

13,4

3

109

  3,33

11,09

3

153

3,4

11,56

3

180

13,66

186,6

4

       

160

10,4

108,16

       

5

       

165

15,4

237,16

       

317

 

48,66

748

 

1361,2

499

 

500,68

у

105,67

   

у

149,6

   

у

166,34

   

σ2

   

16,22

σ2

   

272,24

σ2

   

166,89


По третьей группе разброс меньше (отклонение от средней величины 329,68 тыс.руб.)

2.2 Средняя из групповых

 

 Характеризует случайную  вариацию, возникшую под влиянием  других, неучтенных факторов, и не  зависит от условия (факторного  признака – численность работников), положенного в основу группировки.

 Определим среднюю  из групповых дисперсий, которая  показывает вариацию накладных  расходов, вызванную всеми различными  факторами, кроме накладных расходов, но в среднем по всей совокупности  по формуле средней арифметической взвешенной:

∑ σi2 * fi


                                                σ2 =


∑ fi

         16,22*3 + 272,24*5 + 166,89*3


σ2 =                                                         = 173,69


                      3 + 5 + 3

 

2.3 Межгрупповая дисперсия

 

Отражает вариацию изучаемого признака, которая возникает под влиянием признака, положенного в основу группировки (факторный признак – численность работников).

Определим межгрупповую дисперсию, которая характеризует вариацию групповых средних величин, обусловленную различиями групп по численности работников.

∑ (уi – y)2 * fi


                                            δ2 =


∑ fi

где у – средняя по всей изучаемой совокупности


 

 

∑ уi * fi


                                                  у =


∑ fi

       105,67*3 + 149,6*5 + 166,34*3

y =                                                         = 142,18


                   3 + 5 + 3

        (105,67 – 142,18)2 * 3 + (149,6 – 142,18)2 * 5 + (166,34 – 142,18)2 * 3

δ2 =                                                                                                            = 527,94


                                                       3 + 5 + 3

 

2.4 Общая дисперсия

 

Указанные  выше дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме  средней внутригрупповой дисперсии и межгрупповой дисперсии.

Это тождество отражает правило сложения дисперсий. Опираясь на это правило, можно определить, какая доля общей дисперсии складывается под влиянием признака, положенного в основу группировки.

Определим общую дисперсию:


σ2 = σ2 + δ2

σ2 = 173,69 + 527,94 = 701,63

Информация о работе Корреляционный анализ