Автор работы: Пользователь скрыл имя, 30 Мая 2013 в 11:38, контрольная работа
Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости α = 0,05. Сделать выводы.
Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.
Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.
Выполнить прогноз прибыли y при прогнозном значении x, составляющем 113% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости α = 0,05. Сделать выводы.
Задания:
Решение:
1. Построим поле корреляции (рис. 1.)
Рис. 1. Корреляционное поле
По виду расположения точек можно предположить, что имеется слабая положительная корреляционная зависимость.
1а. Построению обратной модели
y=1/(a+b*x)
предшествует процедура линеаризации. В данном случае линеаризация производится путем обращения результативного фактора:
1/y = a+b*x
По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
где ν = 1/y. Таким образом, обратная модель свелась к линейной модели с ее методами оценивания параметров и проверки гипотез.
Составим следующую расчетную таблицу.
Таблица 2
Расчетная таблица
№ |
x |
v=1/y |
xv |
x2 |
v2 |
ei =yi- |
A |
ei2 |
(y- | |
1 |
554,00 |
0,0033 |
1,8344 |
306916,00 |
0,00001096 |
0,0029 |
41,589 |
0,1377 |
1729,65 |
9933,44 |
2 |
560,00 |
0,0028 |
1,5556 |
313600,00 |
0,00000772 |
0,0029 |
-14,403 |
0,0477 |
207,45 |
1736,11 |
3 |
545,00 |
0,0032 |
1,7581 |
297025,00 |
0,00001041 |
0,0029 |
30,621 |
0,1014 |
937,65 |
8402,78 |
4 |
672,00 |
0,0024 |
1,6193 |
451584,00 |
0,00000581 |
0,0026 |
-27,094 |
0,0897 |
734,08 |
177,78 |
5 |
796,00 |
0,0022 |
1,7611 |
633616,00 |
0,00000489 |
0,0022 |
-3,273 |
0,0108 |
10,71 |
2533,44 |
6 |
777,00 |
0,0020 |
1,5478 |
603729,00 |
0,00000397 |
0,0023 |
-63,801 |
0,2113 |
4070,51 |
10066,78 |
7 |
632,00 |
0,0028 |
1,7803 |
399424,00 |
0,00000793 |
0,0027 |
16,656 |
0,0552 |
277,43 |
2177,78 |
8 |
688,00 |
0,0024 |
1,6538 |
473344,00 |
0,00000578 |
0,0025 |
-21,189 |
0,0702 |
448,97 |
205,44 |
9 |
830,00 |
0,0020 |
1,6567 |
688900,00 |
0,00000398 |
0,0021 |
-32,115 |
0,1063 |
1031,36 |
9867,11 |
10 |
577,00 |
0,0025 |
1,4318 |
332929,00 |
0,00000616 |
0,0028 |
-51,585 |
0,1708 |
2661,06 |
1,78 |
11 |
949,00 |
0,0022 |
2,0541 |
900601,00 |
0,00000469 |
0,0018 |
94,362 |
0,3125 |
8904,21 |
3640,11 |
12 |
562,00 |
0,0029 |
1,6433 |
315844,00 |
0,00000855 |
0,0029 |
4,271 |
0,0141 |
18,24 |
3560,11 |
Итого |
8142,00 |
0,0307 |
20,30 |
5717512,00 |
0,00008084 |
1,3277 |
21031,3332 |
52302,67 | ||
Среднее значение |
678,50 |
0,0026 |
1,6913 |
476459,3333 |
0,000007 |
0,1106 |
По таблице 2 вычислим коэффициенты b, c:
В результате, получим линейное уравнение:
ν = 0,004472 - 0,00000282*x.
Выполнив его обращение, находим искомое уравнение обратной регрессии:
y = 1/(0,004472 - 0,00000282*x)
Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата y.
Рис. 2. Уравнение обратной регрессии и корреляционное поле
1б. Построению
y=a+b*ln x
предшествует процедура линеаризации путем преобразования u = ln x. В результате получается линейное уравнение регрессии:
y = a+b*u.
Составим следующую расчетную таблицу.
Таблица 3
Расчетная таблица
№ |
u=ln x |
y |
yu |
u2 |
y2 |
ei=yi- |
A |
ei2 |
(y- | |
1 |
6,32 |
302 |
1907,78 |
39,91 |
91204 |
341,6977 |
-39,698 |
0,1314 |
1575,9097 |
9933,44 |
2 |
6,33 |
360 |
2278,06 |
40,04 |
129600 |
345,1676 |
14,832 |
0,0412 |
220,0004 |
1736,11 |
3 |
6,30 |
310 |
1953,24 |
39,70 |
96100 |
336,4218 |
-26,422 |
0,0852 |
698,1133 |
8402,78 |
4 |
6,51 |
415 |
2701,76 |
42,38 |
172225 |
403,8962 |
11,104 |
0,0268 |
123,2946 |
177,78 |
5 |
6,68 |
452 |
3019,18 |
44,62 |
204304 |
458,4435 |
-6,444 |
0,0143 |
41,5188 |
2533,44 |
6 |
6,66 |
502 |
3341,03 |
44,29 |
252004 |
450,6616 |
51,338 |
0,1023 |
2635,6343 |
10066,78 |
7 |
6,45 |
355 |
2289,36 |
41,59 |
126025 |
384,1283 |
-29,128 |
0,0821 |
848,4580 |
2177,78 |
8 |
6,53 |
416 |
2718,06 |
42,69 |
173056 |
411,4757 |
4,524 |
0,0109 |
20,4690 |
205,44 |
9 |
6,72 |
501 |
3367,43 |
45,18 |
251001 |
471,9165 |
29,084 |
0,0581 |
845,8513 |
9867,11 |
10 |
6,36 |
403 |
2562,21 |
40,42 |
162409 |
354,8006 |
48,199 |
0,1196 |
2323,1813 |
1,78 |
11 |
6,86 |
462 |
3167,20 |
47,00 |
213444 |
515,0745 |
-53,075 |
0,1149 |
2816,9038 |
3640,11 |
12 |
6,33 |
342 |
2165,37 |
40,09 |
116964 |
346,3160 |
-4,316 |
0,0126 |
18,6274 |
3560,11 |
Итого |
78,04 |
4820,00 |
31470,68 |
507,91 |
1988336,00 |
0,80 |
12167,96 |
52302,67 | ||
Среднее значение |
6,50 |
401,67 |
2622,56 |
42,33 |
165694,67 |
0,07 |
По таблице 3 вычислим коэффициенты b, a:
В результате, получим линейное уравнение:
y = -1639,16 + 322,12*u.
Возвращаясь к переменной x получим искомое уравнение полулогарифмической регрессии:
y = -1639,16 + 322,12*ln x.
Подставляя в данное уравнение фактические значения x, получаем теоретические значения результата y.
Рис. 3. Уравнение полулогарифмической регрессии и корреляционное поле
2. Средний коэффициент эластичности
показывает, насколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора на 1% от своего среднего значения.
Для обратной функции y=1/(a+b*x).
В нашем случае, = 0,75.
Для полулогарифмической функции y=a+b*ln x
Таким образом, при росте выплат на 1%, потребительские расходы вырастут на 0,75% для обратной модели и возрастут на 0,79% для полулогарифмической модели.
Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:
В рассматриваемом случае по данным таблиц 2 и 3 находим для обратной регрессии = 11,06%, для полулогарифмической - = 7%.
Качество построенной модели оценивается как хорошее, если не превышает 8-10%. Из рассмотренных моделей полулогарифмическую модель можно оценить как хорошо описываемую имеющиеся статистические данные, модель обратной регрессии – как удовлетворительную.
Коэффициент детерминации
Характеризует долю дисперсии результативного признака, объясняемую регрессией, в общей дисперсии результативного признака. По данным таблиц 2 и 3 получаем = 0,5979 для обратной регрессии и = 0,7674 для полулогарифмической регрессии.
Наибольшее значение коэффициент детерминации имеет для полулогарифмической модели ( = 0,7674). Он показывает, что уравнение регрессии на 76,74% объясняет вариацию значений признака y.
3. Из всех построенных моделей регрессии наиболее оптимальными характеристиками обладает модель полулогарифмической регрессии:
y=a+b*ln x
Оно имеет наименьшую ошибку аппроксимации ( =7%), и наибольший индекс детерминации ( = 0,7674).
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Прогнозное значение yp определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения xp. В нашем случае прогнозное факторного признака равно 1,1*678,5 = 746,35 тыс. руб. Тогда прогнозное значение результативного признака составит (y=a+b*ln x) 437,7 тыс.руб.
Вычислим среднюю стандартную ошибку прогноза для переменной y по следующей формуле:
и
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит (t=T(0,05; 12-2)=2,23):
Доверительный интервал прогноза
Выполненный прогноз
объема продаж надежен (γ=0,95), но неточен, т.к. диапазон верхней и
нижней границ доверительного интервала
составил (437,7+81,8)/(437,7-81,8)=1,
Имеются данные об объемах экспорта из Российской Федерации (млрд.долл., цены Фондовой Общероссийской биржи (ФОБ)) за 1994-1999 гг.
Таблица 1
Исходные данные
Номер квартала |
Экспорт, млрд. долл., цены ФОБ |
Номер квартала |
Экспорт, млрд. долл., цены ФОБ |
1 |
4087 |
13 |
6975 |
2 |
4737 |
14 |
6891 |
3 |
5768 |
15 |
7527 |
4 |
6005 |
16 |
7971 |
5 |
5639 |
17 |
5875 |
6 |
6745 |
18 |
6140 |
7 |
6311 |
19 |
6248 |
8 |
7107 |
20 |
6041 |
9 |
5741 |
21 |
4626 |
10 |
7087 |
22 |
6501 |
11 |
7310 |
23 |
6284 |
12 |
8600 |
24 |
6707 |
Задания:
Решение:
1. Построим график временного ряда по данным таблицы 1.
Рис. 1. График временного ряда.
По графику можно сделать вывод о наличии циклических процессов в динамическом ряду с периодичностью в 4 квартала (1 год). В течении каждого года уровни ряда в целом растут, достигая пиковых значений к концу года, после чего происходит резкий спад и выход на новый тренд роста в следующем году.
2. Мультипликативную модель можно представить формулой:
F = T х S x E,
где:
F – прогнозируемое значение;
Т – тренд;
S – сезонная компонента;
Е – ошибка прогноза.
Алгоритм построения модели следующий:
Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и, разделив полученные суммы на 4, найдем скользящие средние. Отметим, что полученные таким образом выровненные значения уже не содержат сезонной компоненты. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрирование скользящей средней. Найдем оценки сезонной компоненты как частное между фактическими уровнями ряда и центрированными скользящими средними. Результаты расчетов представим в таблице 2.
Таблица 2
Расчет оценок сезонной компоненты в мультипликативной модели
№ квартала |
Уровень |
Скользящая средняя за 4 месяца |
Центрированная скользящая средняя |
Оценка сезонной компоненты |
1 |
4087 |
|||
2 |
4737 |
5149,25 |
||
3 |
5768 |
5537,25 |
5343,25 |
1,0795 |
4 |
6005 |
6039,25 |
5788,25 |
1,0374 |
5 |
5639 |
6175 |
6107,125 |
0,9233 |
6 |
6745 |
6450,5 |
6312,75 |
1,0685 |
7 |
6311 |
6476 |
6463,25 |
0,9764 |
8 |
7107 |
6561,5 |
6518,75 |
1,0902 |
9 |
5741 |
6811,25 |
6686,375 |
0,8586 |
10 |
7087 |
7184,5 |
6997,875 |
1,0127 |
11 |
7310 |
7493 |
7338,75 |
0,9961 |
12 |
8600 |
7444 |
7468,5 |
1,1515 |
13 |
6975 |
7498,25 |
7471,125 |
0,9336 |
14 |
6891 |
7341 |
7419,625 |
0,9288 |
15 |
7527 |
7066 |
7203,5 |
1,0449 |
16 |
7971 |
6878,25 |
6972,125 |
1,1433 |
17 |
5875 |
6558,5 |
6718,375 |
0,8745 |
18 |
6140 |
6076 |
6317,25 |
0,9719 |
19 |
6248 |
5763,75 |
5919,875 |
1,0554 |
20 |
6041 |
5854 |
5808,875 |
1,0400 |
21 |
4626 |
5863 |
5858,5 |
0,7896 |
22 |
6501 |
6029,5 |
5946,25 |
1,0933 |
23 |
6284 |
|||
24 |
6707 |