Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 20:30, курсовая работа
Для корреляционного анализа зависимости результативного признака y от факторного признака х необходима статистическая обработка данных. Первоначально систематизация статистического материала производится по величине изучаемого признака в порядке убывания или возрастания, то есть необходимо произвести ранжирование рядов распределения.
Глава 1. Корреляционный анализ………………………….……………........2
Построение рядов распределений…………………………………….…..2
1.2 Построение поля корреляции………………………….…………...….....2
1.3 Построение корреляционной таблицы…………………….………….....5
1.4 Расчет эмпирической линии регрессии…………………………....….....5
1.5 Расчет теоретической линии регрессии………………………….…...….7
1.6 Измерение тесноты связи……………………….…………………….…11
1.7 Общий вывод по разделу «Корреляционный анализ»……………..….13
Глава 2. Средние величины и показатели вариации………………………14
Общий вывод к разделу ср.величины……………………………………....17
Глава 3. Ряды динамики…………………………………….……...……......18
Общий вывод по разделу динамические ряды…………………………......25
Список использованной литературы…………………..……...…………....27
, (9)
где – математическая функция развития; – случайное или циклическое отклонение от функции; t – время в виде номера периода (уровня ряда). Цель такого метода – выбор теоретической зависимости в качестве одной из функций:
– прямая линия; – гипербола; – парабола; – степенная; – ряд Фурье.
Для выявления тренда (тенденции развития ряда) в нашей задаче построим график Y(t) (рис.1):
Рис 1. График динамики объема продажи книг за 2006-2012гг.
Из данного графика видно, что
есть все основания принять
Определение параметров в этих функциях может вестись несколькими способами, но самые незначительные отклонения аналитических (теоретических) уровней ( – читается как «игрек, выравненный по t») от фактических ( ) дает метод наименьших квадратов – МНК. При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней от теоретических уровней :
. (10)
В нашей задаче при выравнивании по прямой вида параметры и отыскиваются по МНК следующим образом. В формуле (9) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений:
(11)
где n – количество уровней ряда; t – порядковый номер в условном обозначении периода или момента времени; y – уровни эмпирического ряда.
Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда. Например, при нечетном числе уровней серединная точка (год, месяц) принимается за нуль. Тогда предшествующие периоды обозначаются соответственно –1, –2, –3 и т.д., а следующие за средним (центральным) – соответственно 1, 2, 3 и т.д. При четном числе уровней два серединных момента (периода) времени обозначают –1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д.
При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:
(12)
Как видим, при такой нумерации периодов параметр представляет собой средний уровень ряда. Определим по формуле (12) параметры уравнения прямой, для чего исходные данные и все расчеты необходимых сумм представим в таблице 2.
Из таблицы получаем, что = 547,3и = 1293/70 = 18. Отсюда искомое уравнение тренда =547,3+18t. В 6-м столбце таблицы 2 приведены трендовые уровни, рассчитанные по этому уравнению. Для иллюстрации построим график эмпирических (маркеры-кружочки) и трендовых уровней (рис.2).
Рис.2. График эмпирических и трендовых уровней объема продажи книг .
По полученной модели для каждого периода (каждой даты) определяются теоретические уровни тренда ( ) и оценивается надежность (адекватность) выбранной модели тренда. Оценку надежности проводят с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическими значениями FТ (приложение 1). При этом расчетный критерий Фишера определяется по формуле:
, (13)
где k – число параметров (членов) выбранного уравнения тренда; ДА – аналитическая дисперсия, определяемая по формуле (15); До – остаточная дисперсия (16), определяемая как разность фактической дисперсии ДФ (14) и аналитической дисперсии:
; (14)
; (15)
. (16)
Сравнение расчетного и теоретического значений критерия Фишера ведется обычно при уровне значимости с учетом степеней свободы и . Уровень значимости связан с вероятностью следующей формулой . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.
Таблица 2
Вспомогательные расчеты для решения задачи
Год |
Y |
t |
t^2 |
tY |
Y' |
(Y-Y')^2 |
(Y'-Yср)^2 |
(Y-Yср)^2 |
2006 |
352 |
-5 |
25 |
-1760 |
457,3 |
11088,09 |
8105,4009 |
38153,8089 |
2007 |
487 |
-3 |
9 |
-1461 |
493,3 |
39,69 |
2919,2409 |
3639,7089 |
2008 |
436 |
-1 |
1 |
-436 |
529,3 |
8704,89 |
325,0809 |
12394,3689 |
2009 |
634 |
1 |
1 |
634 |
565,3 |
4719,69 |
325,0809 |
7511,6889 |
2010 |
659 |
3 |
9 |
1977 |
601,3 |
3329,29 |
2912,7609 |
12470,1889 |
2011 |
716 |
5 |
25 |
2339 |
637,3 |
6193,69 |
8094,6009 |
28449,5689 |
Итого |
3284 |
0 |
70 |
1293 |
3283,8 |
34075,34 |
22682,165 |
102619,333 |
Проверим тренд в нашей задаче на адекватность по формуле (13), для чего в 7-м столбце таблицы 6 рассчитан числитель остаточной дисперсии, а в 8-м столбце – числитель аналитической дисперсии. В формуле (13) можно использовать их числители, так как оба они делятся на число уровней n (n сократятся): FР = 12 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ= 7,71 находим по приложению 1 в 1-ом столбце [ = k–1 = 1] и 4-й строке [ = n – k = 6-2=4]).
При составлении
прогнозов уровней социально-
, (17)
где – точечный прогноз, рассчитанный по модели тренда; – коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n–1 (приложение 2); – ошибка аппроксимации, определяемая по формуле (18):
, (18)
где и – соответственно фактические и теоретические (трендовые) значения уровней ряда динамики; n – число уровней ряда; k – число параметров (членов) в уравнении тренда. Определим доверительный интервал в нашей задаче на 2012 год с уровнем значимости = (1–0,05) = 0,95. Для этого найдем ошибку аппроксимации по формуле (18): =92,3. Коэффициент доверия по распределению Стьюдента = 2,5706 при = 6 – 1=5.
Прогноз на 2012год с вероятностью 95% осуществим по формуле (17):
Y2012=(547,3+18*7) 2,57*92,3 или 436,1 <Y2012< 910,5 (млн. шт).
Общий вывод по разделу «Динамические ряды»
Для анализа динамических рядов необходимо определить показатели изменения уровня ряда динамики: базисные и цепные абсолютные приросты, темпы роста и прироста, абсолютное значение прироста. В нашей задаче абсолютное изменение равняется: =364 и =364. Следовательно, характер развития явления: при > 0 — рост.
Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. В нашей задаче темпы изменения определены: =2,033и =2,03. Следовательно, при положительном темпе изменения имеет место рост явления.
В нашей задаче ряд динамики интервальный, значит, применяем формулу средней арифметической простой: = 3284 / 6 = 547,33 (млн. шт). То есть за период 2006-2011г. в среднем продажа книг увеличилась на 492,8 млн. шт.
Далее рассчитываем абсолютное изменение. Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными. В нашей задаче = 547,3 / (6-1) = 109,5. По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост.
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. В нашей задаче = 1,09, то есть ежегодно продажа книг увеличивается в 1,09 раза.
В нашей задаче = 1, 09 – 1 = 0, 09, то есть ежегодно продажа книг растет на 9%.
Затем, вычислив основные показатели динамических рядов, можно начать построение тренда. На графике по оси абсцисс откладывается время, а по оси ординат – уровни ряда. Соединив полученные точки линиями, в большинстве случаев можно выявить тренд визуально. В нашем случае есть все основания принять уравнение тренда в виде линейной функции.
Далее получаем, что = 547,3и = 18. Отсюда искомое уравнение тренда =547,3+18t. По полученной модели для каждого периода (каждой даты) определяются теоретические уровни тренда ( ) и оценивается надежность (адекватность) выбранной модели тренда. При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд. В нашем случае FР = 12 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования.
При составлении
прогнозов уровней социально-
Литература
1. Полисюк Г.Б. Экономико-
2. Спирин А.А., Башина О.Э.Общая теория статистики, М.:”Финансы и статистика”, 1994.
3. Практикум по общей теории
статистики/ Под редакцией Н.Н.Ряузова-2е
издание, переработанное и
4. Харисова Г.М. Методическое
указание для практически
5. Гусаров В.М. Теория