Взаимосвязанные признаки и графики связи

Автор работы: Пользователь скрыл имя, 25 Сентября 2013 в 00:29, контрольная работа

Краткое описание

При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией.
Для полного усвоения корреляционно-регрессионного анализа в эконо¬мических исследованиях в аналитической части работы будет приведено еще одно решение задачи.
Данная работа посвящена изучению возможности обработки статис-тических данных методами корреляционного и регрессионного анализа
с использованием пакета прикладных программ MicrosoftExcel

Прикрепленные файлы: 1 файл

Prakticheskaya_chast_reshennye_zadachi.docx

— 1.02 Мб (Скачать документ)

Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.

Факторный и результативный признаки либо задаются в условии  задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.

По условию Задания 2 факторным  является признак цена на первичном  рынке жилья (X), результативным – признак среднемесячная прибыль (Y).

Применение метода аналитической  группировки

При использовании  метода аналитической группировки  строится интервальный ряд распределения  единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную  таблицу 3, строим аналитическую группировку, характеризующую зависимость между  факторным признаком Х – Ценой на первичном рынке жилья и результативным признаком Y – Среднемесячной прибыль.

Групповые средние  значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.

Таблица 8

Зависимость суммы прибыли  банков от цены на первичном рынке жилья

Номер группы

Группы цен 
на первичном рынке жилья, тыс. руб./ м2,

х

Число организаций,

fj

Среднемесячная прибыль,

млн руб.

всего

в среднем на одну организацию,

1

2

3

4

5=4:3

1

20,6 – 23,5

6

0,45

0,075

2

23,5 – 26,4

9

1,8

0,2

3

26,4 – 29,3

8

3,57

0,45

4

29,3 – 32,2

4

4,5

1,125

5

32,2 – 35,2

3

3,08

1,03

 

Итого

30

13,4

2,88


 

Вывод. Анализ данных табл. 8 показывает, что с увеличением цены на первичном рынке жилья от группы к группе систематически возрастает и средняя прибыль по каждой группе организация, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического  корреляционного отношения

Для измерения  тесноты и силы связи между  факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .

Эмпирический  коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле

,          (9)

где  – общая дисперсия признака Y,

        – межгрупповая (факторная) дисперсия признака Y.

Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле

,         (10)

где  yi – индивидуальные значения результативного признака;

        – общая средняя значений результативного признака;

         n – число единиц совокупности.

Общая средняя  вычисляется как средняя арифметическая простая по всем единицам совокупности:

               (11)

или как средняя взвешенная по частоте групп интервального ряда:

Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет  по формуле (11):

 тыс. руб./ м2

Для расчета общей дисперсии 

применяется вспомогательная

Таблица 12.

Номер

банка

п/п

Прибыль, млн руб.

1

2

3

4

5

1

0,81

0,36

0,13

0,66

2

0,71

0,26

0,068

0,50

3

0,42

-0,03

0,0009

0,18

4

0,70

0,25

0,063

0,49

5

0,19

-0,26

0,068

0,036

6

0,43

-0,02

0,0004

0,18

7

0,40

-0,05

0,0025

0,16

8

0,42

-0,03

0,0009

0,18

9

0,27

-0,18

0,032

0,073

10

0,46

0,01

0,0001

0,21

11

0,43

-0,02

0,0004

0,18

12

0,34

-0,11

0,012

0,12

13

0,32

-0,13

0,012

0,102

14

0,50

0,05

0,0025

0,25

15

0,11

-0,34

0,116

0,012

16

0,55

0,1

0,01

0,303

17

0,44

-0,01

0,0001

0,19

18

0,61

0,16

0,026

0,37

19

0,25

-0,2

0,04

0,063

20

0,28

-0,17

0,029

0,078

21

0,36

-0,09

0,0081

0,13

22

0,70

0,25

0,06

0,49

23

0,33

-0,12

0,0144

0,11

24

0,68

0,23

0,053

0,46

25

0,56

0,11

0,012

0,31

26

0,47

0,02

0,0004

0,22

27

0,24

-0,21

0,044

0,06

28

0,86

0,41

0,17

0,74

29

0,41

-0,04

0,0016

0,17

30

0,15

-0,3

0,09

0,023

Итого

13,4

-0,1

1,0673

7,05


Расчет общей дисперсии по формуле (10):

Общая дисперсия может  быть также рассчитана по формуле

,

где – средняя из квадратов значений результативного признака,

      – квадрат средней величины значений результативного признака.

Для демонстрационного примера 

Тогда

Межгрупповая  дисперсия измеряет систематическую  вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле

,                (13)

где     –групповые средние,

 – общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для  расчета  межгрупповой  дисперсии  строится  вспомогательная таблица 13 При этом используются  групповые средние значения из табл. 8 (графа 5).

Таблица 13

Вспомогательная таблица  для расчета межгрупповой дисперсии

Группы банков по размеру  кредитных вложений,

млн руб.

Число банков,

Среднее значение

в группе

1

2

3

4

5

20,6 – 23,5

6

0,075

-0,375

0,844

23,5 – 26,4

9

0,2

-0,25

0,563

26,4 – 29,3

8

0,45

0

0

29,3 – 32,2

4

1,125

0,675

1,82

32,2 – 35,2

3

1,03

0,58

1,009

Итого

30

   

4,236


Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического  коэффициента детерминации по формуле (9):

  

или 43,8%

Вывод. 43,8% вариации среднемесячная прибыль организаций обусловлено вариацией ценой на первичном рынке жилья, а 56,2 % – влиянием прочих неучтенных факторов.

Эмпирическое  корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

                          (14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

Таблица 14

Шкала Чэддока

h

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Характеристика

силы связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная


Расчет эмпирического  корреляционного отношения  по формуле (14):

 

Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.

Оценим статистическую значимость коэффициента детерминации .

Показатели  и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации  служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

,

где  n – число единиц выборочной совокупности,

    m – количество групп,

       – межгрупповая дисперсия,

      – дисперсия j-ой группы (j=1,2,…,m),

       – средняя арифметическая групповых дисперсий.

Величина  рассчитывается, исходя из правила сложения дисперсий:

,

где – общая дисперсия.

Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия  для различных комбинаций  значений  , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков,  сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:

 

 

k2

k1

24

25

26

27

28

29

30

31

32

33

34

35

3

3,01

2,99

2,98

2,96

2,95

2,93

2,92

2,91

2,90

2,89

2,88

2,87

4

2,78

2,76

2,74

2,73

2,71

2,70

2,69

2,68

2,67

2,66

2,65

2,64

5

2,62

2,60

2,59

2,57

2,56

2,55

2,53

2,52

2,51

2,50

2,49

2,48

Информация о работе Взаимосвязанные признаки и графики связи