Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа
Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27
Показатели четвертой итоговой
строки являются основой для графического
изображения выполненных
Соединив между собой средние значения в каждом интервале отрезками прямых линий, получаем эмпирическую линию регрессии y по x, которая показывает как в среднем изменяется y в связи с изменением x.
В нашем примере расчет эмпирической
линии регрессии вновь
1.5 Расчет теоретической линии регрессии
Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.
В нашем примере характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи y от x .
Параметры искомой прямой (ао,а1) находим из системы уравненной по способу наименьших квадратов:
Исходную информацию для решения системы (5) получаем из таблицы 6, которая основана на результатах таблицы 5.
Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем =269 чел-час., =13 чел-час.
Результатов расчетов по нашему примеру
приведены в таблице 6.
Таблица 5
Расчет эмпирической линии регрессии для зависимости y от x
Себестоимость СМР, тыс. руб. |
x |
Потери раб. времени, чел-час |
Итого | ||||||
y |
243 |
256 |
269 |
282 |
295 |
||||
3 |
185 |
13 |
1 | ||||||
2 |
167,8 |
12 |
1 | ||||||
1 |
150,55 |
11 |
11 |
11 |
11 |
4 | |||
0 |
133,3 |
10 |
10 |
10 |
10 |
4 | |||
-1 |
116 |
1-1 |
1 | ||||||
1 |
Итого hi |
2 |
4 |
1 |
2 |
2 |
n = 11 | ||
2 |
1 |
3 |
0 |
3 |
1 |
||||
3 |
0,5 |
0,75 |
0 |
1,5 |
0,5 |
||||
4 |
141,9 |
143,05 |
133,3 |
152,8 |
141,9 |
Таблица 6
Расчет теоретической линии регрессии для зависимости y от x
Себестоимость СМР, т.р. |
Потери раб.времени, чел-час |
№ столбца | |||||||||
4 |
1 |
0 |
1 |
4 |
1 |
2 |
3 |
4 | |||
-2 |
-1 |
0 |
1 |
2 |
li |
li |
li | ||||
x y |
243 |
256 |
269 |
282 |
295 |
||||||
3 |
185 |
1 |
1 |
3 |
9 |
9 | |||||
2 |
167,8 |
1 |
1 |
2 |
4 |
4 | |||||
1 |
150,55 |
1 |
1 |
1 |
1 |
4 |
4 |
1 |
4 | ||
0 |
133,3 |
1 |
1 |
1 |
1 |
4 |
0 |
0 |
0 | ||
-1 |
116 |
1 |
1 |
-1 |
1 |
1 | |||||
№ строки |
1 |
Итого |
2 |
4 |
1 |
2 |
2 |
n=11 |
- |
||
2 |
-4 |
-4 |
0 |
2 |
4 |
||||||
3 |
8 |
4 |
0 |
2 |
8 |
||||||
4 |
1 |
3 |
0 |
3 |
1 |
||||||
5 |
-2 |
-3 |
0 |
3 |
2 |
В качестве проверки правильного составление таблицы 6 должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии.
В систему уравнений (5) подставим результаты, полученные в табл. 6.
Параметры и необходимо преобразовать исходя из фактических значений x и y.
Формулы перевода из упрощенных в реальные координаты:
где - интервал группировки по функции;
- интервал группировки по аргументу;
- новое начало отсчета по функции;
- новое начало отсчета по аргументу.
По формулам (8), (9) находим:
.
Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид y=65,9-0,3x.
В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.
В нашем примере из уравнения теоретической линии регрессии видно, что себестоимость СМР понижается на 0,3% при увеличении потери раб.времени на 1%.
Себестоимость СМР, не зависящая от рассматриваемых факторов, равна 65,9 тыс.руб.
1.6 Измерение тесноты связи
Коэффициент корреляции является одним из наиболее совершенных методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.
Коэффициент корреляции может принимать как положительные, так и отрицательные значения, т.е. .
При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции должен совпадать со знаком при коэффициенте регрессии а1.
Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.
. (10)
В нашем примере исходную информацию для нахождения принимаем из таблицы 6.
.
Выполненные расчеты показывают, что между себестоимостью СМР и потерями раб.времени существует положительная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y увеличивается.
Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, так как r=-0,29, следовательно, имеем по соотношению Чэддока заметную связь между изучаемыми явлениями.
Имеются и другие формулы линейного коэффициента корреляции.
Линейный коэффициент
, (11) или . (12)
Числитель формулы (12), деленный на n, т.е. , представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений.
Линейный коэффициент
В нашей задаче для расчета r построить вспомогательную таблицу 7.
Таблица 7
Вспомогательные расчеты линейного коэффициента корреляции
i |
xi |
yi |
||||
1 |
292 |
116 |
625 |
841 |
66 |
3079 |
2 |
243 |
130 |
576 |
225 |
33 |
2871 |
3 |
260 |
126 |
49 |
361 |
12 |
2978 |
4 |
256 |
132 |
121 |
169 |
13 |
3072 |
5 |
295 |
150 |
784 |
25 |
13 |
4022 |
6 |
254 |
141 |
169 |
16 |
5 |
3255 |
7 |
248 |
147 |
361 |
4 |
4 |
3314 |
8 |
256 |
156 |
121 |
121 |
11 |
3630 |
9 |
280 |
163 |
169 |
324 |
21 |
4149 |
10 |
276 |
150 |
49 |
25 |
3 |
3763 |
11 |
285 |
185 |
324 |
1600 |
65 |
4793 |
Итого |
2945 |
1596 |
3348 |
3711 |
246 |
38926 |
Пользуясь данными табл.7 рассчитать линейный коэффициент корреляции по формулам 12 и 13.
В нашей задаче: = 17,4; = =18,36. Тогда по формуле (12) : r = (38926 –145*267)/ (17,4*18,36) = -0,293, то есть связь между потерями раб.времени и себестоимостью СМР очень близка к функциональной.
1.7 Общий вывод
по разделу «Корреляционный
По данным таблицы 2 и 3 мы построили интервальные и дискретные ряды. При помощи таблицы 2 сделали вывод, что ряд распределения по потери раб.времени показывает, что наиболее характерным является группа с центральным значением интервала 256 чел-час., так как она составляет 36,36% от всего количества потери раб.времени. Ряд распределения по себестоимости СМР, что наиболее характерным является группа с центральным значением интервала 133,3, 150,5 тыс. руб., так как она составляет 36,36% от всего количества себ-ти СМР.
Затем мы строим корреляционную таблицу, которая показывает, что при переходе слева направо в сторону больших значений факторного признака x соответствующие ряды распределения функционального признака y смещаются сверху вниз, т.е. в сторону меньших значений функций.
Далее считаем эмпирическую линию регрессии, которая вновь подтвердила наличие корреляционной зависимости между потерями раб.времени и себестоимостью СМР. В нашем примере из уравнения теоретической линии регрессии видно, что себестоимость СМР понижается на 0,3% при увеличении потери раб.времени на 1%.
Знак при коэффициенте корреляции совпадает со знаком регрессии а1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, т.к. r=-0,29, следовательно, имеем функциональную связь между изучаемыми явлениями.
Вариант 12
Задача. Имеются следующие данные о количестве регистраций в соц.: 1; 2; 3; 4; 5; 2; 4; 3; 5; 1; 4; 4; 6; 2; 1; 3; 7; 4; 3; 1.
Для анализа распределения кол-ва регистраций в соц.: 1) построить интервальный ряд распределения; 2) рассчитать модальный, медианный и средний возраст, установить его типичность с помощью коэффициентов вариации.
Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):
n = 1 +3,322 lg N, (12)
где N – число величин в дискретном ряде.
В нашей задаче n = 1 + 3,322lg20 = 5,3. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5.