Построение и анализ модель множественной регрессии

Автор работы: Пользователь скрыл имя, 15 Января 2014 в 22:16, задача

Краткое описание

По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

Прикрепленные файлы: 1 файл

Эконометрика готовая.docx

— 222.01 Кб (Скачать документ)

Задача 1. Построение и анализ модель множественной регрессии

По исходным данным требуется:

1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).

2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и Δ- коэффициентов.

4. Построитьипроанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.

5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости a = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).

6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Изучите зависимость стоимости  квартиры от ряда основных факторов.

№ п/п

x1

число

комнат в

квартире

x2

общая

площадь

квартиры 

(м2)

x3

жилая

площадь

квартиры 

(м2)

x4

площадь

кухни

(м2)

y - цена

квартиры,

тыс. долл.

1

2

93,2

49,5

14,0

46,6

2

3

117,0

55,2

25,0

58,5

3

1

42,0

21,0

10,2

24,2

4

2

62,0

35,0

11,0

35,7

5

3

89,0

52,3

11,5

51,2

6

4

132,0

89,6

11,0

75,9

7

1

40,8

19,2

10,1

21,2

8

2

59,2

31,9

11,2

30,8

9

3

65,4

38,9

9,3

34,0

10

2

60,2

36,3

10,9

31,9

11

3

82,2

49,7

13,8

43,6

12

3

98,4

52,3

15,3

52,2

13

3

76,7

44,7

8,0

43,1

14

1

38,7

20

10,2

25,0

15

2

56,4

32,7

10,1

35,2

16

3

76,7

44,7

8,0

40,8

17

1

38,7

20

10,2

18,2

18

1

41,5

20

10,2

20,1

19

2

48,8

28,5

8,0

22,7

20

2

57,4

33,5

10,1

27,6

21

3

76,7

44,7

8,0

36,0

22

1

37

17,5

8,3

17,8

23

2

54

30,5

8,3

25,9

24

3

68

42,5

8,3

32,6

25

1

40,5

16

11,0

19,8

26

2

61

31

11,0

29,9

27

3

80

45,6

11,0

39,2

28

1

52

21,2

11,2

22,4

29

2

78,1

40

11,6

35,2

30

3

91,6

53,8

16,0

41,2


 

 

 

 

 

 

 

 

Решение.

1. Построим линейную модель  множественной регрессии:

 

С помощью инструмента Регрессия в надстройке Анализ Данных ВExcel найдем уравнение регрессии принимает вид:

y =0,72 - 1,76*x1+0,27*x2+0,49*x3+0,1*x4,

Коэффициент детерминации:

 

Коэффициент множественной  корреляции:

 

Значения коэффициентов  детерминации и множественной корреляции:

Оценим значимость модели в целом  с помощью F-критерия Фишера:

Для нахождения Fтабличное используем Таблицу значений F-критерия Фишера при

уровне  значимости :

=F.ОБР.ПХ(0,05;4;25)

Вывод заключается в том, что модель значима и надежна,тк. Fфак>Fтабл( 123,1>2,78).

Находим параметры  Стьюдента t-статистики.

Из представленной выше таблицы  берем нужные нам коэффициенты,t1 и t2.

Для нахождения t табличное воспользуемся таблицей критических значений t-критерия Стьюдента при уровне значимости 0,10, 0,05, 0,01 (двухсторонний)

Вывод заключается в том, что параметр b1 статистически не значим, т.к меньше t табличное. Поэтому фактор x1  можно исключить из модели.

Так же можем убрать из модели фактор x4,потому что он меньше связан с моделью.

Y=f(x2,x3)

Найдем уравнение регрессии  для двухфакторной модели:

Y=0,32+0,33*x2+0,33*x3.

7-41111

 

Задача 2. Построение и анализ модели временного ряда

По исходным данным требуется:

1. Проверить наличие аномальных наблюдений.

2. Проверить наличие тренда.

3. Построить линейную модель временного ряда , параметры которой оценить с помощью метода наименьших квадратов.

4. Оценить адекватность модели, используя свойства независимости остаточной компоненты, случайности уровней ряда остатков и соответствия ряда остатков нормальному закону распределения (при использовании R/S-критерия воспользоваться таблицами).

5. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.

6. Осуществить прогноз (точечный прогноз и доверительный интервал) результирующего показателя на следующие два временных шага (доверительный интервал прогноза рассчитать при доверительной вероятности 0,85).

7. Представить графически фактические значения исследуемого показателя, результаты моделирования и прогнозирования

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вариант 10.

Задолженность по кредитам yt (тыс. руб.) на некотором предприятии за последние 12 месяцев составляет следующую последовательность:

Месяц, t

1

2

3

4

5

6

7

8

9

10

11

12

Задолженность yt, тыс. руб.

16,6

25,4

26,0

34,1

44,0

34,0

48,0

45,5

62,8

67,6

76,1

80,0


 

Решение.

    1. В Excel построить таблицу с исходными данными.

                                                Рис. 1. Исходные данные

2. Наличие аномальных  наблюдений приводит к искажению  результатов моделирования, поэтому  необходимо убедиться в отсутствии  аномалий данных.

Проверим наличие аномальных наблюдений. Для этого воспользуемся  методом Ирвина. Вычислим :

 

 

Рис. 2. Нахождение аномальных наблюдений

3. Для того, чтобы проверить  наличие тренда, воспользуемся анализом  данных – «Двухвыборочный t-тест  с одинаковыми дисперсиями».

Рис. 3. Двухвыборочный t-тест с одинаковыми  дисперсиями

Результат выполненного теста, показывает, что дисперсии отличаются существенно, значит, временной ряд  имеет тенденцию к тренду.

4. Линейная модель временного  ряда y = 10,1545x +5,6185

Рис. 4. Коэффициенты уравнения  регрессии

5. Оценка параметров модели.

6. Проверим соответствие  ряда остатков нормальному закону  распределения с помощью RS-критерия:

 

 

 

Рис. 5. Вывод остатков

 

 

 

 

Модель по этому критерию адекватна.

 

7. Для оценки точности  воспользуемся формулой 


 

 

 

 

Еотн = 49,117 %  − хороший уровень точности.  
Список литературы.

    1. Орлова «Компьютерное моделирование» 2007.
    2. Кремер «Эконометрика» 2002.
    3. Елисеева «Эконометрика» 2007.

 

 

 

 

 

 


Информация о работе Построение и анализ модель множественной регрессии