Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа

Краткое описание

Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

Прикрепленные файлы: 1 файл

teoria.doc

— 601.50 Кб (Скачать документ)

 

Параметры уравнения  множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии.

На основе расчетов, представленных в таблице 2, получили следующую систему:

Эту систему решаем методом  обратной матрицы

a0 = 2,524 a1 = 0,674 a2 = 0,157

Уравнение множественной  регрессии имеет вид:

ŷ = 2,524 + 0,674 х1 + 0,157х2

Парные коэффициенты корреляции найдем по формулам:

где среднее квадратическое отклонение находится

; ;

Частные коэффициенты корреляции характеризуют тесноту связи  между результатом и соответствующим фактором при устранении влияния других факторов, включенных в модель.

= 0,384; = 0,408; = 0,650

Практическая значимость уравнения множественной регрессии  оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, т.е. оценивает тесноту связи совместного влияния факторов на результат.

Коэффициент множественной  корреляции:

=> близко к 1, поэтому очень близкая зависимость между факторами и результатом.

Качество построенной  модели в целом оценивает коэффициент  детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:

R2yx1x2 = 0,896  0,8<R2yx1x2< 0,95 удовлетворительная аппроксимация

Значимость уравнения  множественной регрессии в целом, оценивается с помощью F-критерия Фишера по формуле:

Fрасч = 30,116; Fтаб = 4,74

Так как Fрасч > Fтаб , то уравнение регрессии можно признать адекватным.

Значимость коэффициентов а1 и а2 определяется по t-критерию Стьюдента:

ta1 = 1,099; ta2 = 1,181; tтабл = 2,306

Так как tрасч < tтабл, то коэффициенты регрессии не значимы.

Средняя ошибка аппроксимации: Ā = 1/n ∙ ∑|y - ŷ|/y ∙ 100% = 3,31 %

Так как допустимый предел значений не более 8-10%, качество модели по данному показателю удовлетворительное.

Во множественной регрессии  коэффициенты «чистой» регрессии аj связаны со стандартизованными коэффициентами регрессии βj следующим образом:

1= 0,461; 2 = 0,496

Средние коэффициенты эластичности рассчитаем по формуле:

0,433; 0,360

Коэффициенты ∆ позволяют оценить долю вклада анализируемых факторов х1 и х2 в суммарном влиянии всех отобранных факторов:

1 = 0,482; 2 = 0,518

Доверительные интервалы  прогноза:

ŷх ± tα · σŷ ; ŷх ± 3,208

Прогнозное значение ŷх в точке х будет находится в интервале:

8,992 ≤ ŷх ≤ 15,408

Проверка результатов:

Корреляционный анализ служит для выявления взаимосвязей между выборками.

Таблица 11 Корреляционный анализ

 

y

x1

x2

y

1

   

x1

0,956828

1

 

x2

0,93548

0,936971

1


 

Регрессионный анализ используется для определения общего вида уравнения регрессии, оценки параметров этого уравнения, а также проверки различных статистических гипотез относительно регрессии.

Таблица 12 Регрессионная  статистика

Регрессионная статистика

Множественный R

0,94651

R-квадрат

0,895882

Нормированный R-квадрат

0,866134

Стандартная ошибка

0,566814

Наблюдения

10


 

Таблица 13 Дисперсионный  анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

19,35105

9,675525

30,11568

0,000364

Остаток

7

2,248951

0,321279

   

Итого

9

21,6

     

 

Таблица 14 Параметры модели и их статистические оценки

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 98%

Верхние 98%

Y-пересечение

2,524423

1,665284

1,515912

0,173322

-1,41335

6,46219

Переменная х1

0,674282

0,613505

1,099065

0,308097

-0,77643

2,12499

Переменная х2

0,156757

0,13269

1,181382

0,276027

-0,157

0,47051


 

 

 

 

 

 

 

 

 

 

ВРЕМЕННЫЕ РЯДЫ

 

Задача 3. В целях прогнозирования объёма продаж компании на будущие периоды были собраны данные за 9 лет по следующим показателям: Y(t) – объем продаж; x(t) –индекс потребительских цен.

Требуется:

1. Проверить наличие тренда для Y(t), использовать при этом метод Фостера-Стьюарта.

2. Построить для временного ряда Y(t): модель линейной кривой роста Y(t)=a0+a1t, линейную однофакторную модель регрессии Y(t)=ao+a1X(t).

3. Оценить качество построенных моделей, проведя их исследование на адекватность и точность. Адекватность модели определить на основе проверки случайности остаточной суммы (метод пик), наличия нормального закона распределения (критерий размаха), независимости уровней ряда остатков (метод Дарбина-Уотсона).

4. Для модели регрессии дополнительно рассчитать парный коэффициент корреляции, коэффициент детерминации, коэффициент эластичности и β – коэффициент, раскрыть их экономический смысл.

5. Построить точечный и доверительный прогноз на два шага вперед (для t=10;11) для Y(t) по адекватным моделям.

6. Построить графики моделей.

7. Дать сравнительную характеристику моделей, выбрать лучшую.

 

t

1

2

3

4

5

6

7

8

9

Y(t)

35

37

40

41

45

51

52

55

57

X(t)

65

67

63

60

56

53

57

59

51


 

Основные характеристики уровня ряда:

1. Средняя арифметическая: = 45,89

Среднеквадратическое  отклонение: σ = √ ∑(Y(t) - Y)/ n = 7,65

Дисперсия: D =  ∑(Y(t) - Y)2/ n = 58,54

Несмещенная состоятельная  оценка среднеквадратического отклонения:

S = √ ∑(Y(t) - Y))2/ (n-1) = 65,86

Рисунок 2 - График объема продаж

Для выявления тренда в ряду динамики используется метод Фостера-Стьюарта: Выдвигается гипотеза H0, состоящая в том, что во временном ряде тренд отсутствует и в среднем значении, и в дисперсии.

Выполним сравнение  каждого уровня ряда с предыдущим и определим две последовательности:

Вычислим величины Kt и Lt, характеризующие изменение временного ряда и дисперсии:

Величина Kt характеризует изменение временного ряда, она может принимать значение от 0 (когда все уровни ряда равны) до n – 1 (ряд монотонный). Величина Lt характеризует изменение дисперсии временного ряда и изменяется от – (n – 1) (когда ряд монотонно убывает) до (n – 1) (когда ряд монотонно возрастает). Эти величины являются случайными с математическим ожиданием μ для значения Kt и 0 для значения Lt.

Таблица 15 Расчет показателей линейной модели

t

Y(t)

U(t)

V(t)

K(t)

L(t)

1

35

-

-

-

-

2

37

1

0

1

1

3

40

1

0

1

1

4

41

1

0

1

1

5

45

1

0

1

1

6

51

1

0

1

1

7

52

1

0

1

1

8

55

1

0

1

1

9

57

1

0

1

1

Итого

413

8

0

8

8


 

В данном случае Ut = 8, Vt = 0.

Проверим гипотезу с помощью критерия Стьюдента для средней и для дисперсии:

где μk – математическое ожидание величины k для случайного временного ряда; μe – математическое ожидание случайной величины e для случайного временного ряда;σk – среднеквадратичное отклонение величины K для случайного временного ряда; σe – среднеквадратичное отклонение случайной величины e для случайного временного ряда.

Для N = 9 известны следующие данные: μk = 3,703; μe = 0; σk = 1,242; σe = 1,927.

Получим:                 tk = 3,459;              te = 4,151

Полученные значения tk, te необходимо сравнить с табличными значениями критерия Стьюдента tтабл.

Критическое число t1-L, N-2 = 2,37. (Число степеней свободы df= 7 при уровне значимости α = 0,05)

Так как tk = 3,459 > tтабл = 2,37, то с вероятностью 0,95 гипотеза об отсутствии тренда в дисперсии отклоняется. Так как te = 4,151 > tтабл = 2,37, то с вероятностью 0,95 отклоняется гипотеза об отсутствии тренда и в среднем значении.

Вывод: Тренд присутствует с вероятностью 0,95. Так как вероятность присутствия тренда высока, имеет смысл строить модель и делать прогнозы.

Линейная модель: Y = a0+a1 ∙ t

Таблица 16 Расчет показателей линейной модели

t

Y(t)

yp

εt

1

35

-4

16

-10,89

43,56

34,16

0,84

2

37

-3

9

-8,89

26,67

37,09

-0,09

3

40

-2

4

-5,89

11,78

40,02

-0,02

4

41

-1

1

-4,89

4,89

42,96

-1,96

5

45

0

0

-0,89

0,00

45,89

-0,89

6

51

1

1

5,11

5,11

48,82

2,18

7

52

2

4

6,11

12,22

51,76

0,24

8

55

3

9

9,11

27,33

54,69

0,31

9

57

4

16

11,11

44,44

57,62

-0,62

Итого

413

0

60

0

176,00

413,00

0

Среднее значение

45,9

0

6,67

0

19,56

45,89

0

Информация о работе Парная регрессия и корреляция