Средние величины и показатели вариации

Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа

Краткое описание

Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.

Содержание

Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27

Скачать полностью (305.17 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

Министерство образования и науки РФ.docx

— 374.14 Кб (Скачать документ)

Показатели четвертой итоговой строки являются основой для графического изображения выполненных расчетов на поле корреляции (рис.1).

Соединив между собой средние значения в каждом интервале отрезками прямых линий, получаем эмпирическую линию регрессии y по x, которая показывает как в среднем изменяется y в связи с изменением x.

В нашем примере расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между потерями раб.времени и себестоимостью СМР.

1.5 Расчет теоретической линии регрессии

Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.

В нашем примере характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи y от x .

Параметры искомой прямой (а_о,а₁) находим из системы уравненной по способу наименьших квадратов:

(5)

Исходную информацию для решения системы (5) получаем из таблицы 6, которая основана на результатах таблицы 5.

Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем =269 чел-час., =13 чел-час.

Результатов расчетов по нашему примеру приведены в таблице 6.

Таблица 5

Расчет эмпирической линии регрессии для зависимости y от x

_Се_{бестоимость СМР, тыс. руб.}		x	Потери раб. времени, чел-час						Итого
		y	243	256	269	282	295
	3	185		1³				1
	2	167,8				1²		1
	1	150,55	1¹	1¹		1¹	1¹	4
	0	133,3	1⁰	1⁰	1⁰		1⁰	4
	-1	116		1^-1				1
	1	Итого h_i	2	4	1	2	2	n = 11
	2		1	3	0	3	1
	3		0,5	0,75	0	1,5	0,5
	4		141,9	143,05	133,3	152,8	141,9

Таблица 6

Расчет теоретической линии регрессии для зависимости y от x

Себестоимость СМР, т.р.		Потери раб.времени, чел-час						№ столбца
			4	1	0	1	4	1	2	3	4
			-2	-1	0	1	2	l_i	l_i	²	l_i ²
		x y	243	256	269	282	295
	3	185		1				1	3	9	9
	2	167,8				1		1	2	4	4
	1	150,55	1	1		1	1	4	4	1	4
	0	133,3	1	1	1		1	4	0	0	0
	-1	116		1				1	-1	1	1
№ строки	1	Итого	2	4	1	2	2	n=11		-
	2		-4	-4	0	2	4
	3		8	4	0	2	8
	4		1	3	0	3	1
	5		-2	-3	0	3	2

В качестве проверки правильного составление таблицы 6 должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии.

В систему уравнений (5) подставим результаты, полученные в табл. 6.

= -0,23.

= 0,85.

Параметры и необходимо преобразовать исходя из фактических значений x и y.

Формулы перевода из упрощенных в реальные координаты:

(8)

(9)

где - интервал группировки по функции;

- интервал группировки по аргументу;

- новое начало отсчета по функции;

- новое начало отсчета по аргументу.

По формулам (8), (9) находим:

Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид y=65,9-0,3x.

В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.

В нашем примере из уравнения теоретической линии регрессии видно, что себестоимость СМР понижается на 0,3% при увеличении потери раб.времени на 1%.

Себестоимость СМР, не зависящая от рассматриваемых факторов, равна 65,9 тыс.руб.

1.6 Измерение тесноты связи

Коэффициент корреляции является одним из наиболее совершенных методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.

Коэффициент корреляции может принимать как положительные, так и отрицательные значения, т.е. .

При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции должен совпадать со знаком при коэффициенте регрессии а₁.

Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.

. (10)

В нашем примере исходную информацию для нахождения принимаем из таблицы 6.

Выполненные расчеты показывают, что между себестоимостью СМР и потерями раб.времени существует положительная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y увеличивается.

Знак при коэффициенте корреляции совпадает со знаком регрессии a₁, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, так как r=-0,29, следовательно, имеем по соотношению Чэддока заметную связь между изучаемыми явлениями.

Имеются и другие формулы линейного коэффициента корреляции.

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:

, (11) или . (12)

Числитель формулы (12), деленный на n, т.е. , представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений.

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле (27) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

В нашей задаче для расчета r построить вспомогательную таблицу 7.

Таблица 7

Вспомогательные расчеты линейного коэффициента корреляции

i	x_i	y_i
1	292	116	625	₈₄₁	66	3079
2	243	130	576	₂₂₅	33	2871
3	260	126	49	₃₆₁	12	2978
4	256	132	121	₁₆₉	13	3072
5	295	150	784	₂₅	13	4022
6	254	141	169	₁₆	5	3255
7	248	147	361	₄	4	3314
8	256	156	121	₁₂₁	11	3630
9	280	163	169	₃₂₄	21	4149
10	276	150	49	₂₅	3	3763
11	285	185	324	₁₆₀₀	65	4793
Итого	2945	1596	3348	₃₇₁₁	246	38926

Пользуясь данными табл.7 рассчитать линейный коэффициент корреляции по формулам 12 и 13.

В нашей задаче: = 17,4; =^=18,36. ^{Тогда
по} формуле (12) : r = (38926 –145*267)/ (17,4*18,36) = -0,293, то есть связь между потерями раб.времени и себестоимостью СМР очень близка к функциональной.

1.7 Общий вывод по разделу «Корреляционный анализ»

По данным таблицы 2 и 3 мы построили интервальные и дискретные ряды. При помощи таблицы 2 сделали вывод, что ряд распределения по потери раб.времени показывает, что наиболее характерным является группа с центральным значением интервала 256 чел-час., так как она составляет 36,36% от всего количества потери раб.времени. Ряд распределения по себестоимости СМР, что наиболее характерным является группа с центральным значением интервала 133,3, 150,5 тыс. руб., так как она составляет 36,36% от всего количества себ-ти СМР.

Затем мы строим корреляционную таблицу, которая показывает, что при переходе слева направо в сторону больших значений факторного признака x соответствующие ряды распределения функционального признака y смещаются сверху вниз, т.е. в сторону меньших значений функций.

Далее считаем эмпирическую линию регрессии, которая вновь подтвердила наличие корреляционной зависимости между потерями раб.времени и себестоимостью СМР. В нашем примере из уравнения теоретической линии регрессии видно, что себестоимость СМР понижается на 0,3% при увеличении потери раб.времени на 1%.

Знак при коэффициенте корреляции совпадает со знаком регрессии а₁, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, т.к. r=-0,29, следовательно, имеем функциональную связь между изучаемыми явлениями.

Глава 2. Средние величины и показатели вариации

Вариант 12

Задача. Имеются следующие данные о количестве регистраций в соц.: 1; 2; 3; 4; 5; 2; 4; 3; 5; 1; 4; 4; 6; 2; 1; 3; 7; 4; 3; 1.

Для анализа распределения кол-ва регистраций в соц.: 1) построить интервальный ряд распределения; 2) рассчитать модальный, медианный и средний возраст, установить его типичность с помощью коэффициентов вариации.

Решение. Для построения интервального ряда из дискретного используется формула Стерджесса, с помощью которой определяется оптимальное количество интервалов (n):

n = 1 +3,322 lg N, (12)

где N – число величин в дискретном ряде.

В нашей задаче n = 1 + 3,322lg20 = 5,3. Так как число интервалов не может быть дробным, то округлим его до ближайшего целого числа, т.е. до 5.

Информация о работе Средние величины и показатели вариации