Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа
Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27
Министерство образования и науки РФ
Казанский Государственный Архитектурно-
Кафедра
экономики и
Курсовая работа
по курсу « Статистика»
Выполнил:
Студент гр.1ПМ207
Широкова Е.С.
Проверила:
Гайнуллина Р.Р.
Казань 2012
Содержание
Глава 1. Корреляционный анализ………………………….……………........
1.2 Построение поля корреляции………………………….…………...….
1.3 Построение корреляционной
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи…………………
1.7 Общий вывод по разделу
«Корреляционный анализ»……………..
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины………
Глава 3. Ряды динамики…………………………………….……...……
Общий вывод по разделу динамические ряды…………………………......25
Список использованной
литературы…………………..……...…………..
Глава 1. Корреляционный анализ
1.1 Построение рядов распределения
Вариант 2 (X2,Y3).
Для корреляционного анализа
При построении интервального ряда распределения определяется величина интервала i, вычисляемая по формуле:
где Rmax и Rmin - максимальное и минимальное значение переменной;
n - число интервалов.
Ориентировочно число интервалов определяется по формуле
где N - число наблюдений.
Для выполнения корреляционных расчетов интервальные ряды распределения необходимо представить в дискретной форме.
В связи с этим вместо размерности интервалов принимаем их центральные значения, которые рассчитываются как средние арифметические величины начала и конца интервалов.
1.2 Построение поля корреляции
Первой основной задачей, которую решает теория корреляции, является задача измерения связи. Систематизация статистического материала по двум качественным признакам производится графически путем построения поля корреляции.
Итоговая сумма частот по горизонтальным линиям поле корреляции должна соответствовать абсолютным частотам дискретного ряда распределения функционального признака, а итоговая сумма частот по вертикальным линиям поля корреляции - абсолютным частотам дискретного ряда распределение факторного признака. Общая сумма абсолютных частот точек по всем горизонтальным линиям должна быть равна сумме частот (точек) по всем вертикальным линиям поля корреляции и соответствовать числу единиц статистической совокупности принятой для исследования.
Для того, чтобы показать основные
приемы определения количественной
взаимосвязи признаков с
Исходные данные для типового примера приведены в таблице 1.
Таблица 1
Себестоимость СМР, тыс. руб. |
Потери раб.времени, чел-часов. |
Y3 |
Х2 |
116 |
292 |
130 |
243 |
126 |
260 |
132 |
256 |
150 |
295 |
141 |
254 |
147 |
248 |
156 |
256 |
163 |
280 |
150 |
276 |
185 |
285 |
Построим интервальные ряды распределения по себестоимости СМР и по потери раб.времени. Задаемся числом интервалов
Начальная граница первого интервального ряда равна .
Для себестоимости СМР: , тогда
Для Потери раб.времени: , тогда
Интервальный ряд по функциональному признаку (потери раб.времени): 236,5– 249,5; 249,5 – 262,5; 262,5-275,5; 275,5– 288,5; 288,5– 301,5.
Интервальный ряд по факторному признаку (себестоимость СМР): 107,4 – 124,65; 124,65 – 141,9; 141,9-159,15; 159,15– 176,4; 176,4– 193,65.
Таблица 2
Дискретный ряд распределения по потери раб.времени.
Центральные значения интервалов |
Величина интервалов |
Абсолютные частоты |
Относительные частоты |
Плотность распределения |
243 |
2 |
18,18 |
1,4 | |
256 |
4 |
36,36 |
2,8 | |
269 |
i = 13 |
1 |
9,09 |
0,7 |
282 |
2 |
18,18 |
1,4 | |
295 |
2 |
18,18 |
1,4 | |
Итого |
n = 11 |
100 % |
Таким образом, ряд распределения по потери раб.времени показывает, что наиболее характерным является группа с центральным значением интервала 256 чел-час., так как она составляет 36,36% от всего количества потери раб.времени.
Плотность распределения определяется по формуле:
i
Таблица 3
Дискретный ряд распределения по себестоимости СМР.
Центральные значения интервалов |
Величина интервалов |
Абсолютные частоты |
Относительные частоты |
Плотность распределения |
116 |
1 |
9,09 |
0,5 | |
133,3 |
4 |
36,36 |
2,1 | |
150,55 |
i = 17,25 |
4 |
36,36 |
2,1 |
167,8 |
1 |
9,09 |
0,5 | |
185 |
1 |
9,09 |
0,5 | |
Итого |
n = 11 |
100 % |
Таким образом, ряд распределения по себестоимости СМР показывает, что наиболее характерным является группа с центральным значением интервала 133,3, 150,55 тыс. руб., так как она составляет 36,36% от всего количества себ-ти СМР.
1.3 Построение корреляционной таблицы
Для построения корреляционной таблицы на поле корреляции накладывается координатная сетка, соответствующая интервальным рядам распределения по факториальному и функциональному признакам.
Затем подсчитывается число точек (частот) в каждой клетке координатной сетки. По вертикали ранжированный ряд представляет себестоимость СМР (тыс. руб.), по горизонтали - потери раб.времени (чел-час).
Результаты подсчетов по горизонтали и вертикали записываются в таблицу 4.
Таблица 4
Корреляционная таблица для зависимости y от x
Себестоимость СМР, тыс.руб. |
Потери раб.времени, чел-час | ||||||
x у |
236,5– 249,5 |
249,5 – 262,5 |
262,5-275,5 |
275,5– 288,5 |
288,5– 301,5 |
Итого | |
176,4-193,65 |
1 |
1 | |||||
159,15-176,4 |
1 |
1 | |||||
141,9-159,15 |
1 |
1 |
1 |
1 |
4 | ||
124,65-141,9 |
1 |
1 |
1 |
1 |
4 | ||
107,4-124,65 |
1 |
1 | |||||
Итого |
2 |
4 |
1 |
2 |
2 |
n = 11 |
Результаты расчетов, выполненные в таблице 4 позволяют сделать вывод о том, что при переходе слева направо в сторону больших значений факторного признака x соответствующие ряды распределения функционального признака y смещаются сверху вниз, т.е. в сторону меньших значений функций.
1.4 Расчет эмпирической линии регрессии
После установления наличия корреляционной
зависимости между
Под формой корреляционной связи понимают тип аналитической формулы, выражающей зависимость между изучаемыми величинами.
Необходимо установить, какие изменяются средние значения y в связи с изменением x.
Рассчитываются средние величины для каждого ряда распределения по формуле средней взвешенной арифметической величины:
где:
y - средневзвешенное значение функции;
y - центральные значения интервалов по функции;
m - абсолютные частоты вариантов y.
Для сокращения вычислений при определении средней арифметической можно использовать метод отсчета от условного нуля.
Расчетная формула имеет вид
при этом
где:
- упрощенные варианты y;
y - фактические варианты y;
сy- новое начало отсчета по оси y (условный нуль);
iy - интервал группировки по y.
Новое начало отсчета выбирается таким, образом, чтобы число наблюдений распределялось примерно поровну между положительным и отрицательным направлениями оси ординат.
В нашем примере примем условный нуль в третьем интервале по оси y, тогда сy=133,3тыс.руб., а iy =17,25 тыс.руб. Результаты расчетов представлены в таблице 5.
Упрощенные варианты умножаются на частоты соответствующих клеток корреляционной таблицы и записываются в верхних правых углах каждой клетки.
Первая итоговая строка и итоговый столбец таблицы 5 выражают абсолютные частоты интервальных рядов распределения по функциональному и факторному признакам.
Вторая итоговая строка характеризует сумму произведений, записанных в верхних углах клеток. Третья итоговая строка рассчитывается делением показателей второй строки на первую. В четвертой итоговой строке показаны искомые средние , полученные по формуле (2).