Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа

Краткое описание

Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

Скачать полностью (163.05 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

teoria.doc

— 601.50 Кб (Скачать документ)

Для вычисления коэффициентов используется МНК.

a₁= 2,933; a₀= 31,222

Уравнение тренда имеет вид: Y(t) = 31,222 + 2,933 ∙ t

Оценка качества (адекватности) построенной линейной модели тренда.

Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна.

Проверка адекватности модели реальному явлению является важным этапом прогнозирования социально - экономических процессов. Для этого исследуют ряд остатков , т.е. отклонения расчетных значений от фактических данных.

Таблица 17 Расчет случайной величины

t	E(t)	Точки поворота	E²(t)	(E(t)- E(t+1))²	\|E(t)\|/Y(t)
1	0,84		0,71	0,871	2,41%
2	-0,09	*	0,01	0,004	0,24%
3	-0,02	*	0,00	3,738	0,06%
4	-1,96	*	3,82	1,138	4,77%
5	-0,89		0,79	9,404	1,98%
6	2,18	*	4,74	3,738	4,27%
7	0,24	*	0,06	0,004	0,47%
8	0,31	*	0,10	0,871	0,57%
9	-0,62		0,39		1,09%
∑	0,00	6	10,62	19,77	15,85%

1. Проверка условия случайности возникновения отдельных отклонений от тренда.

Для проверки случайности уровней ряда может быть использован критерий «пиков», или критерий поворотных точек.

Рисунок 3 - График случайной величины ε_t

Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как

где р – фактическое количество поворотных точек в случайном ряду; 1,96 – квантиль нормального распределения для 5%-го уровня значимости. Квадратные скобки здесь так же означают, что от результата вычисления следует взять целую часть.

p₀= [1,95] = 1.

Случайная величина E(t) содержит как положительные, так и отрицательные значения. Число поворотных точек p = 6.

Так как неравенство p = 6 > p_o = 1 соблюдается, то ряд остатков можно считать случайным (т.е. он содержит регулярную компоненту).

2. Проверка соответствия ряда остатков нормальному закону распределения важна с точки зрения правомерности построения доверительных интервалов прогноза. Для проверки используется критерий размаха (RS- критерий):

где и - максимальный и минимальный уровни ряда остатков;

- несмещенная оценка среднеквадратического отклонения ряда остатков

S = 1,152; RS = (2,18 - (-1,96))/1,152 = 3,587

Так как расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности: RS = 3,587 > 3,54, то гипотеза о нормальном распределении ряда остатков не принимается. (Для n = 9 и 5%-ного уровня значимости α интервал равен (2,58; 3,54)).

3. Для проверки отсутствия автокорреляции используется критерий Дарбина-Уотсона.

Под автокорреляцией понимается зависимость последующих уровней ряда от предыдущих.

При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия Дарбина–Уотсона по формуле:

d₀ = 19,77/10,62 = 1,861

d₀ = 1,861 < 2, d = = 1,861. Значение случайной величины d сравнивается с критическими числами d₁ = 1,08; d₂ = 1,36. Исходя из неравенства d = 1,861 > d₂ = 1,36, автокорреляция ряда отсутствует.

Так как все пункты проверки, кроме второго, дают положительный результат, то выбранная трендовая модель является не полностью адекватной. Необходимо осуществить оценку точности модели прогноза.

Оценка точности линейной модели тренда.

Вычислим среднюю относительную ошибку модели:

средняя относительная ошибка: Е_отн = 1/ n ∙ ∑|Е_max| / Y_t ∙100%

Е_отн = 1,76 %

Модель имеет удовлетворительный уровень точности, так как средняя относительная ошибка: Е_отн = 1,76 % не превышает 8-10%. Следовательно, линейную модель можно использовать для построения прогнозных оценок.

Построим точечный и доверительный прогноз на два шага вперед для Y(t). Для точечного прогноза необходимо подставить вместо значения t в уравнение модели Y(t) = 31,222 + 2,933 ∙ t значения t =10;11

Y_p(10) = 31,222 + 2,933 ∙ 10 = 60,56

Y_p(11) = 31,222 + 2,933 ∙ 11 = 63,49

Для доверительного прогноза необходимо вычислить U = S ∙ t_{1-L, N-2} = 2,73.

S = 1,152; t_{1-L, N-2} = 2,37

Y_p(10) (60,56 - 2,73; 60,56 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (57,82; 63,29).

Y_p(11) (63,49 - 2,73; 63,49 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (60,76; 66,22).

Для проверки используем надстройку Excel «Анализ данных». В диалоговом окне Анализ данных необходимо выбрать инструмент Регрессия. В диалоговом окне Регрессия в поле Входной интервал Y нужно ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х - адрес диапазона, который содержат значения независимой переменной t Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.

Рисунок 4 - Диалоговое окно Регрессия

Таблица 18 Проверка расчетов с помощью Excel

	Коэффициенты		Стандартная ошибка	t-статистика
Y-пересечение	A₀	31,22222	0,89492	34,88828
t	A₁	2,933333	0,159031	18,44499

Таблица 19 Вывод остатка

Наблюдение	Предсказанное Y(t)	Остатки
1	34,15556	0,844444
2	37,08889	-0,08889
3	40,02222	-0,02222
4	42,95556	-1,95556
5	45,88889	-0,88889
6	48,82222	2,177778
7	51,75556	0,244444
8	54,68889	0,311111
9	57,62222	-0,62222

Во втором столбце таблицы 17 содержатся коэффициенты уравнения регрессии a₀, a₁, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом – t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Предсказанные значения и остатки полностью совпадают с рассчитанными.

Регрессионная модель: Y(t) = a₀+a₁ ∙ x(t)

Таблица 20 Расчет показателей регрессионной модели

t	Y(t)	X(t)			²	²	∙	Y_p(t)
1	35	65	6	-10,89	118,57	36	-65,333	38,22
2	37	67	8	-8,89	79,01	64	-71,111	35,66
3	40	63	4	-5,89	34,68	16	-23,556	40,78
4	41	60	1	-4,89	23,90	1	-4,889	44,61
5	45	56	-3	-0,89	0,79	9	2,667	49,72
6	51	53	-6	5,11	26,12	36	-30,667	53,56
7	52	57	-2	6,11	37,35	4	-12,222	48,45
8	55	59	0	9,11	83,01	0	0,000	45,89
9	57	51	-8	11,11	123,46	64	-88,889	56,11
Итого	413	531	0	0,00	526,89	230	-294,000	413,00
Среднее значение	45,9	59	0	0,00	58,54	25,56	-32,667	45,89

Для вычисления коэффициентов используются формулы:

a₁ = ∑(

)/ ² a₀ = y - a₁ ∙ x

a₁= -1,278; a₀= 121,31

Уравнение регрессии имеет вид: Y(t) = 121,31 - 1,278 ∙ x (t)

Коэффициент a₁= - 1,278 выражает величину изменения признака y при изменении фактора x на 1 единицу измерения (%). Так как a₁ < 0, между факторами существует обратная связь.

Величина влияния фактора x на y оценивается с помощью коэффициента корреляции (связи). Коэффициент корреляции Rxy = - 0,713. Таким образом, связь между y и x обратная, устойчивая, высокая.

Покажем, что построенная модель адекватна и может быть использована для прогноза.

Таблица 21 Расчет случайной величины

t	E(t)	Точки поворота	E²(t)	(E(t)- E(t +1))²	\|E(t)\|/Y(t)
1	-3,22		10,36	20,762	9,20%
2	1,34	*	1,79	4,465	3,61%
3	-0,78		0,60	8,036	1,94%
4	-3,61		13,04	1,239	8,81%
5	-4,72	*	22,31	4,688	10,50%
6	-2,56		6,55	37,369	5,02%
7	3,55		12,64	30,875	6,84%
8	9,11	*	83,01	67,669	16,57%
9	0,89		0,78	-	1,55%
∑	0,00	3	151,08	175,10	64,03%

Информация о работе Парная регрессия и корреляция