Автор работы: Пользователь скрыл имя, 24 Октября 2014 в 10:56, курсовая работа
Для корреляционного анализа зависимости результативного признака y от факторного признака x необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
ВВЕДЕНИЕ__________________________________________________________
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Построение рядов распределения________________________________________
Построение поля корреляции____________________________________________
Построение корреляционной таблицы____________________________________
Расчет и построение эмпирической линии регрессии________________________
Расчет и построение теоретической линии регрессии_______________________
Измерение тесноты связи_______________________________________________
ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ
Групповая дисперсия__________________________________________________
Средняя из групповых_________________________________________________
Межгрупповая дисперсия_______________________________________________
Общая дисперсия______________________________________________________
Среднее квадратическое отклонение______________________________________
Показатель вариации___________________________________________________
Эмпирический коэффициент детерминации_______________________________
Эмпирическое корреляционное отношение________________________________
Анализ выполненных расчетов и вывод__________________________________
АНАЛИЗ ДИНАМИЧЕСКИХ РЯДОВ
Определение данных для 3-го динамического ряда по двум исходным данным______________________________________________________________
Установление вида ряда динамики_______________________________________
Определение среднего уровня динамики__________________________________
Определение показателей изменения уровня ряда динамики__________________
Определение среднего абсолютного прироста______________________________
Определение среднегодовых темпов роста и прироста______________________
Графическое изображение показателей динамических рядов_________________
Анализ полученных показателей динамических рядов_______________________
ЗАКЛЮЧЕНИЕ_______________________________________________________
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ___________________________
Результаты расчетов, выполненные в вышеуказанной таблице, позволяют сделать вывод о том, что при переходе слева направо в сторону больших значений факторного признака х соответствующие ряды распределения функционального признака у смещаются сверху вниз, т.е. в сторону меньших значений функций. Следовательно, объем смр находятся в корреляционной зависимости от среднегодовой стоимости производственных фондов.
1.4 Расчет и построение эмпирической линии регрессии
После установления наличия корреляционной зависимости между функциональным и факторным признаками, приступаем к следующему этапу статистического моделирования – к исследованию формы связи.
Под формой корреляционной связи понимают тип аналитической формулы, выражающей зависимость между изучаемыми величинами.
Необходимо установить, какие изменяются средние значения y в связи с изменением x.
Рассчитываем средние величины для каждого ряда распределения по формуле средней взвешенной арифметической величины:
y =
где y – средневзвешенное значение функции;
у – центральные
значения интервалов по
m – абсолютные частоты вариантов у.
Для сокращения вычислений при определении средней арифметической можно использовать метод отсчета от условного нуля.
y = y'i iy + cy;
при этом
где y' – упрощенные варианты у;
у – фактические варианты у;
сy – новое начало отсчета по оси у (условный нуль);
iy – интервал группировки по у.
Новое начало отсчета выбираем таким образом, чтобы число наблюдений распределялось примерно поровну между положительным и отрицательным направлениями оси ординат. Условный нуль су = 132 тыс. руб., iy = 8.
Расчет эмпирической линии регрессии для зависимости у от х
Объем СМР, тыс. руб. |
у' |
х у |
Среднегодовая стоимость основных фондов тыс. руб. |
Итого | ||||||||||
70 |
76 |
82 |
88 |
94 |
100 |
106 |
112 |
118 |
124 |
130 | ||||
6 |
180 |
16 |
1 | |||||||||||
5 |
172 |
15 |
1 | |||||||||||
4 |
164 |
14 |
1 | |||||||||||
3 |
156 |
0 | ||||||||||||
2 |
148 |
0 | ||||||||||||
1 |
140 |
0 | ||||||||||||
0 |
132 |
0 | ||||||||||||
- 1 |
124 |
1-1 |
1-1 |
2 | ||||||||||
- 2 |
116 |
1-2 |
1-2 |
1-2 |
3 | |||||||||
- 3 |
108 |
1-3 |
1-3 |
2 | ||||||||||
- 4 |
100 |
1-4 |
1-4 |
1 | ||||||||||
№ строки |
1 |
Итого hi |
1 |
2 |
1 |
0 |
0 |
2 |
2 |
1 |
1 |
1 |
n = 11 | |
2 |
Σ miy'i |
6 |
3 |
4 |
0 |
0 |
0 |
-3 |
-4 |
-2 |
-7 |
-4 |
Σy’ = -7 | |
3 |
y' |
6 |
1,5 |
2 |
0 |
0 |
0 |
-1,5 |
-2 |
-2 |
-7 |
-4 |
||
4 |
180 |
144 |
148 |
132 |
132 |
132 |
120 |
116 |
116 |
76 |
100 |
1.5 Расчет и построение теоретической линии регрессии
Теоретическая линия регрессии представляет собой такую математически правильную кривую (любую прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии, выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.
В данном случае характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи у от х у = а0 + а1х
Параметры искомой прямой (а0, а1) нахожу из системы уравнений по способу наименьших квадратов:
na'0 + a'1Σx' = Σy'1
a'0Σx' + a'1Σ(x')2 = Σy'ix'
Исходную информацию для решения данной системы получаем из таблицы «Расчет теоретической линии регрессии для зависимости у от х», которая основана на результатах таблицы «Расчет эмпирической линии регрессии для зависимости у от х».
Для получения упрощенных вариантов
по факторному признаку используется
метод отсчета от условного нуля. В данном примере сх = 112 чел.,
iх = 6.
Расчет теоретической линии регрессии для зависимости у от х
Объем СМР, тыс. руб. |
|
№ столбца | |||||||||||||||
y' |
x'2 |
25 |
16 |
9 |
4 |
1 |
0 |
1 |
4 |
9 |
16 |
25 |
1 |
2 |
3 |
4 | |
x' |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
li |
liy' |
y'2 |
liy'2 | ||
x y |
70 |
76 |
83 |
120 |
122 |
112 |
116 |
115 |
119 |
126 |
130 | ||||||
6 |
180 |
1 |
1 |
6 |
36 |
36 | |||||||||||
5 |
172 |
1 |
1 |
5 |
25 |
25 | |||||||||||
4 |
164 |
0 |
0 |
16 |
0 | ||||||||||||
3 |
156 |
1 |
1 |
3 |
9 |
9 | |||||||||||
2 |
148 |
0 |
0 |
4 |
0 | ||||||||||||
1 |
140 |
0 |
0 |
1 |
1 | ||||||||||||
0 |
132 |
0 |
0 |
0 |
0 | ||||||||||||
- 1 |
124 |
1 |
1 |
-1 |
1 |
1 | |||||||||||
- 2 |
116 |
1 |
1 |
2 |
-4 |
4 |
8 | ||||||||||
- 3 |
108 |
1 |
1 |
1 |
3 |
-9 |
9 |
27 | |||||||||
- 4 |
100 |
1 |
1 |
2 |
-8 |
16 |
32 | ||||||||||
1 |
Итого hi |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
3 |
1 |
2 |
1 |
n = 11 |
Σy' = -8 |
- |
Σy'2 = 139 | |
2 |
Σ hix' |
-5 |
-4 |
-3 |
-2 |
0 |
0 |
0 |
6 |
3 |
8 |
5 |
Σ x' = 8 | ||||
3 |
Σ hix'2 |
25 |
16 |
9 |
4 |
0 |
0 |
0 |
12 |
9 |
32 |
25 |
Σ x'2 = 132 | ||||
4 |
Σ miy'i |
6 |
5 |
-3 |
3 |
0 |
0 |
0 |
-6 |
-2 |
-7 |
-4 |
Σy' = -8 | ||||
5 |
Σ miy'iх'i |
-30 |
-20 |
9 |
-6 |
0 |
0 |
0 |
-12 |
-6 |
-28 |
-20 |
Σy'х' = -113 |
Результаты расчетов приведены в таблице «Расчет теоретической линии регрессии для зависимости у от х».
В систему уравнений подставляем результаты, полученные в таблице «Расчет теоретической линии регрессии для зависимости у от х»:
11a'0 + 8a'1 = -8
8a'0 + 132 a'1 = –113
В качестве метода решения данной системы принимаем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого 1-ое уравнение системы делим на –8, а 2-ое уравнение – на 132.
–1,375a'0 – a'1 = 1
0,061a'0 + a'1 = –0,856
Сложим уравнения полученной системы:
–1,314а'0 = 0,144
Откуда:
а'0 = -0,109
Затем подставляем в уравнение а'0 и находим величину а'1:
–1,375 * (-0,109) – а'1 = 1
а'1 = –0,850
Параметры а'0 и а'1 необходимо преобразовать исходя из фактических значений х и у.
Формулы перевода из упрощенных в реальные координаты:
а1 = а'1 *
ix
iy
a0 = cy + iya'0 – a'1 cx
где iy – интервал группировки по функции;
ix – интервал группировки по аргументу;
cy – новое начало отсчета по функции;
cx – новое начало отсчета по аргументу.
Находим:
а0 = 258,125; а1 = –1,288
Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид: у = 258,125 – 1,288х.
В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.
Вывод: из уравнения теоретической линии регрессии видно, что объем СМР понижается на 1,288% при увеличении численности на 1%.
Объем СМР, не зависящий от рассматриваемых факторов, равен 1433,7 тыс. руб.
Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.
В данной курсовой проводим на поле корреляции прямую линию.
Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками
2. ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ
Если всю изучаемую совокупность разделить на группы, то можно рассчитать следующие виды дисперсий:
Рассмотрим на примере влияния численности работников на накладные расходы выше перечисленные виды дисперсий. По данным первого задания работы выделим три группы по результативному признаку – объем смр (тыс.руб.) и вычислим следующее:
2.1 Групповая дисперсия
Группировочным или факторным признаком является среднегодовая стоимость основных средств (тыс.руб.), т.е. мы разбиваем изучаемую совокупность на три группы:
Объемы смр является результативным признаком (у), который зависит от изменения среднегодовой стоимости .
№ |
Среднегодовая стоимость от 70 до 95 тыс.руб. |
№ |
Среднегодовая стоимость от 95 до 120 тыс.руб |
№ |
Среднегодовая стоимость от 120 и более тыс.руб | ||||||
Объем смр |
Объем смр |
Объем смр |
|||||||||
1 |
100 |
-5,67 |
32,15 |
1 |
118 |
-31,6 |
998,56 |
1 |
149 |
–17,34 |
300,68 |
2 |
108 |
2,33 |
5,43 |
2 |
152 |
2,4 |
2,76 |
2 |
170 |
3,66 |
13,4 |
3 |
109 |
3,33 |
11,09 |
3 |
153 |
3,4 |
11,56 |
3 |
180 |
13,66 |
186,6 |
4 |
160 |
10,4 |
108,16 |
||||||||
5 |
165 |
15,4 |
237,16 |
||||||||
∑ |
317 |
48,66 |
∑ |
748 |
1361,2 |
∑ |
499 |
500,68 | |||
105,67 |
149,6 |
166,34 |
|||||||||
σ2 |
16,22 |
σ2 |
272,24 |
σ2 |
166,89 |
По третьей группе разброс меньше (отклонение от средней величины 329,68 тыс.руб.)
2.2 Средняя из групповых
Характеризует случайную вариацию, возникшую под влиянием других, неучтенных факторов, и не зависит от условия (факторного признака – численность работников), положенного в основу группировки.
Определим среднюю
из групповых дисперсий, которая
показывает вариацию накладных
расходов, вызванную всеми различными
факторами, кроме накладных расходов,
но в среднем по всей
∑ σi2 * fi
∑ fi
16,22*3 + 272,24*5 + 166,89*3
σ2 =
3 + 5 + 3
2.3 Межгрупповая дисперсия
Отражает вариацию изучаемого признака, которая возникает под влиянием признака, положенного в основу группировки (факторный признак – численность работников).
Определим межгрупповую дисперсию, которая характеризует вариацию групповых средних величин, обусловленную различиями групп по численности работников.
∑ (уi – y)2 * fi
∑ fi
где у – средняя по всей изучаемой совокупности
∑ уi * fi
∑ fi
105,67*3 + 149,6*5 + 166,34*3
y =
3 + 5 + 3
(105,67 – 142,18)2 * 3 + (149,6 – 142,18)2 * 5 + (166,34 – 142,18)2 * 3
δ2 =
3 + 5 + 3
2.4 Общая дисперсия
Указанные выше дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии.
Это тождество отражает правило сложения дисперсий. Опираясь на это правило, можно определить, какая доля общей дисперсии складывается под влиянием признака, положенного в основу группировки.
Определим общую дисперсию:
σ2 = σ2 + δ2
σ2 = 173,69 + 527,94 = 701,63