Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа
Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27
После определения оптимального количества интервалов определяем размах интервала по формуле:
h = H / n, (13)
где H – размах вариации, определяемый по формуле (14):
H = Хмах –Хmin, (14)
где Xмax и Xmin — максимальное и минимальное значения в совокупности.
В нашей задаче h = (7-1)/5 = 1,2.
Интервальная группировка
Таблица 1
Вспомогательные расчеты для решения задачи
Xi, см |
fi |
Xi |
Xi*fi |
Xi-X |
(Xi-Х)fi |
(Xi-X)2 |
(Xi-X)2fi |
До 2,2 |
7 |
1,6 |
11,2 |
-1,68 |
11,76 |
2,8 |
19,6 |
2,2-3,4 |
4 |
2,8 |
11,2 |
-0,48 |
1,92 |
0,23 |
0,92 |
3,4-4,6 |
5 |
4 |
20 |
0,72 |
3,6 |
0,5 |
2,5 |
4,6-5,8 |
2 |
5,2 |
10,4 |
1,92 |
3,84 |
3,68 |
7,36 |
Более 5,8 |
2 |
6,4 |
12,8 |
3,12 |
6,24 |
9,7 |
19,4 |
Итого |
20 |
- |
65,6 |
- |
27,36 |
- |
49,78 |
Мода ( )– это наиболее часто повторяющееся значение признака. Для интервального ряда с равными интервалами величина моды определяется по формуле (13):
Формула для вычисления:
, (15)
где – нижняя граница модального интервала; – величина модального интервала; – частоты в модальном, предыдущем и следующем за модальным интервалом соответственно.
Модальный интервал определяется по наибольшей частоте.
В нашей задаче чаще всего повторяется (7 раз) первый интервал кол-ва регистрации в соц. (до 2,2 ), значит, это и есть модальный интервал. Используя формулу (13), определяем точное значение модального количества регистрации:
Мо=1+1,2*(7-0)/(7-0)+(7-4))=1,
Медиана – варианта, которая находится в середине вариационного ряда.
Делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значением признака больше медианы.
Вычисляется медиана по формуле:
(16)
где – нижняя граница медианного интервала;
– медианный интервал;
– половина от общего числа наблюдений;
– сумма наблюдений, накопленная
до начала медианного
fMe – число наблюдений или объем взвешивающего признака в медианном интервале.
Для интервальных рядов распределения с нечетным числом членов ряда медиана будет вариантом, расположенным в середине ряда, т.е. 3,4-4,6:
Ме = 3,4 + 1,2*(20/2-(7+4))/5 = 3,16.
Средняя величина – это обобщающий показатель совокупности, характеризующий уровень изучаемого явления или процесса. Средние величины могут быть простыми и взвешенными. Простая средняя рассчитывается при наличии двух и более статистических величин, расположенных в произвольном (несгруппированном) порядке, по общей формуле (17). Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием общей формулы (18).
= ; (17) = . (18)
При этом обозначено: Xi – значения отдельных статистических величин или середин группировочных интервалов; m - показатель степени, от значения которого зависят виды средних величин. Выбор вида формулы средней величины зависит от содержания осредняемого признака и конкретных данных, по которым ее приходится вычислять. Показатель степени m в общей формуле средней величины оказывает существенное влияние на значение средней величины: по мере увеличения степени возрастает и средняя величина (правило мажорантности средних величин), то есть < < < < . Так, если , то , а если , то .
В нашей задаче, применяя формулу средней арифметической взвешенной и подставляя вместо середины интервалов кол-ва регистраций ХИ, определяем среднее кол-во регистрации: = 65,6/20 = 3,28 . Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3.
Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.
Среднее линейное отклонение определяется по формуле (19):
– взвешенное. (19)
Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (20):
(20)
- взвешенная;
Дисперсия определяется по формуле 21:
– взвешенная. (21)
Коэффициент вариации:
Таким образом, коэффициент вариации равен 48%, что показывает неоднородность совокупности.
Общий вывод к разделу Средние величины и показатели вариации
Для начала определим количество интервалов по формуле Стерджесса, по которой получили n=5. После определения оптимального количества интервалов определяем размах интервала. В нашей задаче h = 1,2.
Интервальная группировка
Далее определяем модальный интервал по наибольшей частоте. В нашей задаче точное значение модального количества регистрации равно 1,84.
После нахождения моды преступаем к определению медианы. Медиана – варианта, которая находится в середине вариационного ряда. В нашей задаче: Ме = 3,16.
Далее мы можем приступить к вычислению средних величин. Для начала, применяя формулу средней арифметической взвешенной и подставляя вместо середины интервалов кол-ва регистраций ХИ, определяем среднее кол-во регистрации: = 65,6/20 = 3,28. Теперь осталось определить типичность или нетипичность найденной средней величины. Это осуществляется с помощью расчета показателей вариации. Чем ближе они к нулю, тем типичнее найденная средняя величина для изучаемой статистической совокупности. При этом критериальным значением коэффициента вариации служит 1/3. Показатели вариации буду находить по сгруппированным данным, т.е. по формуле - взвешенной величины, т.к. одно и то же значение признака в изучаемой совокупности встречается более 1 раза.
Поскольку однородность совокупности существует при условии, что коэффициент вариации менее 33%, а в нашей задаче коэффициент вариации равен 48%, то значит данная совокупность неоднородна.
Глава 3. Ряды динамики
Задача. Вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на 2012 год с вероятностью 95%.
Вариант |
17 |
Год |
Продажа книг, млн. шт |
2006 |
352 |
2007 |
487 |
2008 |
436 |
2009 |
634 |
2010 |
659 |
2011 |
716 |
Решение. Любое изменение уровней ряда динамики определяется базисным (сравнение с первым уровнем) и цепным (сравнение с предыдущим уровнем) способами. Оно может быть абсолютным (разность уровней ряда) и относительным (соотношение уровней).
Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда (1), а цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда (2).
(1) (2)
По знаку абсолютного
В нашей задаче эти изменения определены в 3-м и 4-м столбцах таблицы 1. Для проверки правильности расчетов применяется правило, согласно которому сумма цепных абсолютных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =364 и =364
Базисное относительное изменение представляет собой соотношение конкретного и первого уровней ряда (3), а цепное относительное изменение представляет собой соотношение конкретного и предыдущего уровней ряда (4).
(3) (4)
Относительные изменения уровней
— это по существу индексы динамики,
критериальным значением
В нашей задаче эти изменения определены в 5-м и 6-м столбцах таблицы 1.
Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. При положительном темпе изменения имеет место рост явления, при отрицательном — спад, а при нулевом темпе изменения наблюдается стабильность явления. В нашей задаче темпы изменения определены в 7-м и 9-м столбцах таблицы 1, а в 8-м и 10-м сделан вывод о характере развития изучаемого явления. Для проверки правильности расчетов применяется правило, согласно которому произведение цепных относительных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =2,0322и =2,03.
Таблица 1
Вспомогательные расчеты для решения задачи.
Обобщенной характеристикой
В нашей задаче ряд динамики интервальный, значит, применяем формулу средней арифметической простой: = 3284 / 6 = 547,33 (млн. шт). То есть за период 2006-2011г. в среднем продажа книг увеличилась на 547,33 млн. шт.
Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели – среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.
Базисное среднее абсолютное изменение – это частное от деления последнего базисного абсолютного изменения на количество изменений уровней (5). Цепное среднее абсолютное изменение уровней ряда – это частное от деления суммы всех цепных абсолютных изменений на количество изменений (6).
Б = (5) Ц = (6)
По знаку средних абсолютных
изменений также судят о
Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (7), а цепное среднее относительное изменение – по формуле (8):
Б= = (7) Ц= (8)
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашей задаче = = 1,09, то есть ежегодно продажа книг увеличивается в 1, 09 раза.
Вычитанием 1 из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики. В нашей задаче = 1, 09 – 1 = 0, 09, то есть ежегодно продажа книг растет на 9%.
Проверка ряда динамики на наличие в нем тренда (тенденции развития ряда) возможна несколькими способами (метод средних, Фостера и Стюарта, Валлиса и Мура и пр.), но наиболее простым является графическая модель, где на графике по оси абсцисс откладывается время, а по оси ординат – уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. Тренд может представлять собой прямую линию, параболу, гиперболу и т.п. В итоге приходим к трендовой модели вида: