Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа
Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .
Параметры уравнения
множественной регрессии
На основе расчетов, представленных в таблице 2, получили следующую систему:
Эту систему решаем методом обратной матрицы
a0 = 2,524 a1 = 0,674 a2 = 0,157
Уравнение множественной регрессии имеет вид:
ŷ = 2,524 + 0,674 х1 + 0,157х2
Парные коэффициенты корреляции найдем по формулам:
где среднее квадратическое отклонение находится
; ;
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в модель.
= 0,384; = 0,408; = 0,650
Практическая значимость
уравнения множественной
Коэффициент множественной корреляции:
=> близко к 1, поэтому очень близкая зависимость между факторами и результатом.
Качество построенной модели в целом оценивает коэффициент детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:
R2yx1x2 = 0,896 0,8<R2yx1x2< 0,95 удовлетворительная аппроксимация
Значимость уравнения
множественной регрессии в
Fрасч = 30,116; Fтаб = 4,74
Так как Fрасч > Fтаб , то уравнение регрессии можно признать адекватным.
Значимость коэффициентов а1 и а2 определяется по t-критерию Стьюдента:
ta1 = 1,099; ta2 = 1,181; tтабл = 2,306
Так как tрасч < tтабл, то коэффициенты регрессии не значимы.
Средняя ошибка аппроксимации: Ā = 1/n ∙ ∑|y - ŷ|/y ∙ 100% = 3,31 %
Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.
Во множественной регрессии коэффициенты «чистой» регрессии аj связаны со стандартизованными коэффициентами регрессии βj следующим образом:
1= 0,461; 2 = 0,496
Средние коэффициенты эластичности рассчитаем по формуле:
0,433; 0,360
Коэффициенты ∆ позволяют оценить долю вклада анализируемых факторов х1 и х2 в суммарном влиянии всех отобранных факторов:
∆1 = 0,482; ∆2 = 0,518
Доверительные интервалы прогноза:
ŷх ± tα · σŷ ; ŷх ± 3,208
Прогнозное значение ŷх в точке х будет находится в интервале:
8,992 ≤ ŷх ≤ 15,408
Проверка результатов:
Корреляционный анализ служит для выявления взаимосвязей между выборками.
Таблица 11 Корреляционный анализ
y |
x1 |
x2 | |
y |
1 |
||
x1 |
0,956828 |
1 |
|
x2 |
0,93548 |
0,936971 |
1 |
Регрессионный анализ используется для определения общего вида уравнения регрессии, оценки параметров этого уравнения, а также проверки различных статистических гипотез относительно регрессии.
Таблица 12 Регрессионная статистика
Регрессионная статистика | |
Множественный R |
0,94651 |
R-квадрат |
0,895882 |
Нормированный R-квадрат |
0,866134 |
Стандартная ошибка |
0,566814 |
Наблюдения |
10 |
Таблица 13 Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
2 |
19,35105 |
9,675525 |
30,11568 |
0,000364 |
Остаток |
7 |
2,248951 |
0,321279 |
||
Итого |
9 |
21,6 |
Таблица 14 Параметры модели и их статистические оценки
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 98% |
Верхние 98% | |
Y-пересечение |
2,524423 |
1,665284 |
1,515912 |
0,173322 |
-1,41335 |
6,46219 |
Переменная х1 |
0,674282 |
0,613505 |
1,099065 |
0,308097 |
-0,77643 |
2,12499 |
Переменная х2 |
0,156757 |
0,13269 |
1,181382 |
0,276027 |
-0,157 |
0,47051 |
ВРЕМЕННЫЕ РЯДЫ
Задача 3. В целях прогнозирования объёма продаж компании на будущие периоды были собраны данные за 9 лет по следующим показателям: Y(t) – объем продаж; x(t) –индекс потребительских цен.
Требуется:
1. Проверить наличие тренда для Y(t), использовать при этом метод Фостера-Стьюарта.
2. Построить для временного ряда Y(t): модель линейной кривой роста Y(t)=a0+a1t, линейную однофакторную модель регрессии Y(t)=ao+a1X(t).
3. Оценить качество построенных моделей, проведя их исследование на адекватность и точность. Адекватность модели определить на основе проверки случайности остаточной суммы (метод пик), наличия нормального закона распределения (критерий размаха), независимости уровней ряда остатков (метод Дарбина-Уотсона).
4. Для модели регрессии дополнительно рассчитать парный коэффициент корреляции, коэффициент детерминации, коэффициент эластичности и β – коэффициент, раскрыть их экономический смысл.
5. Построить точечный и доверительный прогноз на два шага вперед (для t=10;11) для Y(t) по адекватным моделям.
6. Построить графики моделей.
7. Дать сравнительную характеристику моделей, выбрать лучшую.
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Y(t) |
35 |
37 |
40 |
41 |
45 |
51 |
52 |
55 |
57 |
X(t) |
65 |
67 |
63 |
60 |
56 |
53 |
57 |
59 |
51 |
Основные характеристики уровня ряда:
1. Средняя арифметическая: = 45,89
Среднеквадратическое отклонение: σ = √ ∑(Y(t) - Y)/ n = 7,65
Дисперсия: D = ∑(Y(t) - Y)2/ n = 58,54
Несмещенная состоятельная
оценка среднеквадратического
S = √ ∑(Y(t) - Y))2/ (n-1) = 65,86
Рисунок 2 - График объема продаж
Для выявления тренда в ряду динамики используется метод Фостера-Стьюарта: Выдвигается гипотеза H0, состоящая в том, что во временном ряде тренд отсутствует и в среднем значении, и в дисперсии.
Выполним сравнение
каждого уровня ряда с предыдущим
и определим две последовательн
Вычислим величины Kt и Lt, характеризующие изменение временного ряда и дисперсии:
Величина Kt характеризует изменение временного ряда, она может принимать значение от 0 (когда все уровни ряда равны) до n – 1 (ряд монотонный). Величина Lt характеризует изменение дисперсии временного ряда и изменяется от – (n – 1) (когда ряд монотонно убывает) до (n – 1) (когда ряд монотонно возрастает). Эти величины являются случайными с математическим ожиданием μ для значения Kt и 0 для значения Lt.
Таблица 15 Расчет показателей линейной модели
t |
Y(t) |
U(t) |
V(t) |
K(t) |
L(t) | |
1 |
35 |
- |
- |
- |
- | |
2 |
37 |
1 |
0 |
1 |
1 | |
3 |
40 |
1 |
0 |
1 |
1 | |
4 |
41 |
1 |
0 |
1 |
1 | |
5 |
45 |
1 |
0 |
1 |
1 | |
6 |
51 |
1 |
0 |
1 |
1 | |
7 |
52 |
1 |
0 |
1 |
1 | |
8 |
55 |
1 |
0 |
1 |
1 | |
9 |
57 |
1 |
0 |
1 |
1 | |
Итого |
413 |
8 |
0 |
8 |
8 |
В данном случае Ut = 8, Vt = 0.
Проверим гипотезу с помощью критерия Стьюдента для средней и для дисперсии:
где μk – математическое ожидание величины k для случайного временного ряда; μe – математическое ожидание случайной величины e для случайного временного ряда;σk – среднеквадратичное отклонение величины K для случайного временного ряда; σe – среднеквадратичное отклонение случайной величины e для случайного временного ряда.
Для N = 9 известны следующие данные: μk = 3,703; μe = 0; σk = 1,242; σe = 1,927.
Получим: tk = 3,459; te = 4,151
Полученные значения tk, te необходимо сравнить с табличными значениями критерия Стьюдента tтабл.
Критическое число t1-L, N-2 = 2,37. (Число степеней свободы df= 7 при уровне значимости α = 0,05)
Так как tk = 3,459 > tтабл = 2,37, то с вероятностью 0,95 гипотеза об отсутствии тренда в дисперсии отклоняется. Так как te = 4,151 > tтабл = 2,37, то с вероятностью 0,95 отклоняется гипотеза об отсутствии тренда и в среднем значении.
Вывод: Тренд присутствует с вероятностью 0,95. Так как вероятность присутствия тренда высока, имеет смысл строить модель и делать прогнозы.
Линейная модель: Y = a0+a1 ∙ t
Таблица 16 Расчет показателей линейной модели
t |
Y(t) |
yp |
εt | ||||
1 |
35 |
-4 |
16 |
-10,89 |
43,56 |
34,16 |
0,84 |
2 |
37 |
-3 |
9 |
-8,89 |
26,67 |
37,09 |
-0,09 |
3 |
40 |
-2 |
4 |
-5,89 |
11,78 |
40,02 |
-0,02 |
4 |
41 |
-1 |
1 |
-4,89 |
4,89 |
42,96 |
-1,96 |
5 |
45 |
0 |
0 |
-0,89 |
0,00 |
45,89 |
-0,89 |
6 |
51 |
1 |
1 |
5,11 |
5,11 |
48,82 |
2,18 |
7 |
52 |
2 |
4 |
6,11 |
12,22 |
51,76 |
0,24 |
8 |
55 |
3 |
9 |
9,11 |
27,33 |
54,69 |
0,31 |
9 |
57 |
4 |
16 |
11,11 |
44,44 |
57,62 |
-0,62 |
Итого |
413 |
0 |
60 |
0 |
176,00 |
413,00 |
0 |
Среднее значение |
45,9 |
0 |
6,67 |
0 |
19,56 |
45,89 |
0 |