Многофакторная регрессионная модель прогнозирования товарооборота

Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 20:16, лабораторная работа

Краткое описание

Цель: приобретение навыков построения многофакторной регрессионной модели и ее анализа на статистическую значимость.
Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).

Прикрепленные файлы: 1 файл

Lab_rabN8_Mnogofaktornaya_regressionnaya_model_prognozirovaniya_q32ttqpgcfub (1).doc

— 690.50 Кб (Скачать документ)

 

 

 

Рисунок 2 – Зависимость объема товарооборота от численности работников предприятия

 

 

Рисунок 3 - Зависимость объема товарооборота от размера основных фондов

 

 

Рисунок 4 – Зависимость продаж от объема поступления товара

 

Корреляционные поля на графиках показывают тенденции к изменению из нижнего  левого угла в правый верхний. Поэтому построенные графики позволяют предположить, что между независимыми факторами Х1 и У, Х2 и У, Х3 и У возможна зависимость линейного вида.

 

3. Построим матрицу корреляции для количественного выражения взаимосвязи между объёмом товарооборота и приведёнными в таблице независимыми факторами с помощью команды Сервис/Анализ данных/Корреляция (рисунок 3).

 

 

Рисунок 3 – Окно диалога Корреляция

 

Полученная матрица корреляции представлена на рисунке 4.

 

 

Рисунок 4 – Корреляционная матрица

 

4.  Проанализируем полученные коэффициенты корреляции:

  • корреляция объёма товарооборота (по шкале Чеддока) демонстрирует высокую связь с объёмом поступления товаров (Х3), заметную взаимосвязь с величиной основных фондов (Х2) и крайне слабую с численностью персонала (Х1);
  • все эти связи положительные, т.е. с увеличением величины каждого из независимых факторов объем товарооборота возрастает;
  • матрица корреляции показывает возможные
    • обратную заметную, близкую к высокой по тесноте взаимосвязь между независимыми факторами: Основные фонды (Х2) и Среднесписочная численность работников (Х1),
    • умеренную обратную связь между Объемом поступления товаров (Х3) и Среднесписочной численностью работников (Х1),
    • заметную взаимосвязь между Объемом поступления товаров (Х3) и Основными фондами (Х2).

 

5. Определим наличие явления мультиколлинеарности (мультиколлинеарности означает, что один или несколько независимых факторов тесно связаны друг с другом).

На рисунке 5 представлена матрица мультиколлинеарности М.

det(М) = 0,3378414151,

что свидетельствует о возможном присутствии явления мультиколлинеарности в регрессионной модели (det(М) стремится к 0).

 

Рисунок 5 – Матрица мультиколлинеарности

 

6. Для нахождения коэффициентов регрессии, построения и дальнейшего анализа регрессионной модели воспользуемся командой Сервис-Анализ данных-Регрессия (рисунок 6).

 

 

Рисунок 6 – Диалоговое окно Регрессия

 

Результат выполнения команды приведен на рисунке 7.

 

7. Проанализируем регрессионную статистику:

 

  • значение коэффициента детерминации R2 = 0,89625 (достаточно, чтобы R2 было  >=80%) показывает, что изменения зависимого фактора - объема товарооборота, на 89,63% объясняются изменчивостью в совокупности трех рассматриваемых независимых факторов. Оставшиеся 10,37% приходятся на другие, не рассматриваемые в модели факторы;

 

 Рисунок 7 – Результат выполнения команды Регрессия

 

  • множественный коэффициент корреляции R = 0,9467 свидетельствует о том, что корреляция или теснота связи между предсказанным (вычисленным по уравнению регрессии) значением зависимого фактора, т.е. объёмом товарооборота, и линейной комбинацией всех рассматриваемых независимых факторов согласно шкале Чеддока признаётся весьма высокой;
  • величина в строке Стандартная ошибка описывает размер типичного отклонения наблюдаемого значения от линии регрессии, т.е. диапазон объема товарооборота варьируется от предсказанной (вычисленной) величины на 1278,25.

 

8. Проанализируем значимость коэффициента множественной корреляции R. При уровне значимости и степенях свободы и 2 критерий Фишера Fp = 11,5183, табличное значение (значимость F) = 0,01947. Fp > Fk , что позволяет отвергнуть гипотезу о незначимости показателя тесноты связи - Множественного R=0,9467, или иначе: гипотеза о равенстве коэффициентов регрессии в модели нулю должна быть отвергнута.

 

9. При анализе мультиколлинеарности (пункт 5) было выявлено ее возможное наличие, что говорит о существовании факта взаимосвязи независимых факторов между собой. Такой же вывод был сделан при анализе корреляционной матрицы (пункт 4). Коэффициенты выявленных корреляций равны -0,699581146, -0,351708319, 0,577086169. Так как все эти коэффициенты парной корреляции ниже значения множественного коэффициента корреляции R=0,9467, явление мультиколлинеарности будем считать незначительным и ни один из независимых факторов не будем удалять из модели.

 

10. Уравнение регрессии между объёмом товарооборота, численностью персонала, основными фондами и объемом поступления товаров имеет следующий вид (в скобках указаны стандартные ошибки):

 

(38331,48) (17,191) (5,6412) (0,1983)

 

11. Анализ значений коэффициентов регрессии и их стандартных ошибок (t-статистика) позволяет сделать вывод о значимости в уравнении коэффициентов всех переменных, т.к. они превосходят свои стандартные ошибки более чем в два раза.

Значение 57,67 коэффициента регрессии для численности работников говорит о том, что увеличение персонала на одного человека будет сопровождаться повышением объема товарообоота на 57,67 единиц, если остальные факторы остаются без изменения. Аналогично: значение 0,5923 коэффициента регрессии для объёма поступления товаров при увеличении его на единицу означает повышение объема товарооборота на 0,5923 единиц, если остальные факторы останутся неизменными; значение 16,45 коэффициента регрессии для основных фондов товаров при увеличении их на единицу означает повышение объема товарооборота на 16,45  единиц, если остальные факторы останутся неизменными.

 

12. Используя данные таблицы Вывод остатка (рисунок 7), построим диаграмму остатков (рисунок 8). Анализ остатков позволяет сделать вывод, что остатки удовлетворяют предположению о нормальном распределении, т.к. остатки не имеют большого разброса при перемещении слева направо по шкале предсказанных значений.

 

 

Рисунок 8 - Диаграмма остатков как функция предсказанных значений (с линией тренда)

 

Диаграммы остатков как функция  независимых факторов (рисунки 9-11 с добавленной линией тренда) также подтверждают независимость остатков.

 

 

 

Рисунок 9 - Диаграмма остатков как функция среднесписочной численности работников

 

 

 

Рисунок 10 - Диаграмма остатков как функция основных фондов

 

 

Рисунок 11 - Диаграмма остатков как функция объемов поступления товаров

 

13. Проведем анализ остатков с точки зрения критерия Дарбина –Уотсона.

 

Воспользовавшись данными из таблицы Вывод остатка (рисунок 7) и расчетной

формулой  , получим dw»2,466383504.

 

Из таблицы критических точек Дарбина–Уотсона (Приложение 1) определим два пороговых значения - dl и du:

n (объем выборки) = 8,

m (число независимых факторов) = 3.

Следовательно, dl = 0,368, du = 2,287

Значение критерия Дарбина–Уотсона не удовлетворяет ни одному из предложенных оценочных правил:

  - существует положительная автокорреляция

  - вывод о наличии автокорреляции не определён

  - автокорреляция отсутствует

  - существует отрицательная автокорреляция.

Оно попало в зону неопределенности.

Воспользуемся "грубым" правилом: автокорреляция остатков отсутствует, если , что подходит в нашем случае.

Проведенный анализ позволяет сделать приблизительный вывод о независимости остатков и, следовательно, об отсутствии автокорреляции.

 

Вывод

 

Таким образом, с некоторым приближением можно сделать вывод о практической значимости полученной модели прогнозирования товарооборота.

Для получения более надежной модели необходимо еще раз проанализировать все факторы, влиющие на объем товарооборота, выбрать наиболее существенные; получить новую выборку данных, построить другую модель, строго удовлетворяющую всем требованиям статистической значимости.

 

Задания на самостоятельную работу

 

Вариант №1

 

Требуется составить модель множественной  регрессии для следующих данных:

Y- урожайность (ц/га),

X1- число тракторов (мощность  на 100га), 

X2 - число зерноуборочных комбайнов  на 100 га,

X3- число орудий поверхностной  обработки на 100 га,

X4- количество удобрений (т/га),

X5 - количество химических средств  защиты растений (ц/га)

В таблице представлены усредненные  данные:

 

Y

X1

X2

X3

X4

X5

9,7

1,59

0,26

2,05

0,32

0,14

10,2

1,8

0,55

3,22

0,4

0,02

11,5

2,5

0,71

4,6

0,72

0,15

9,9

1,6

0,49

2,57

0,39

0,17

8,6

0,7

0,67

2,95

0,2

0,09

9

1,1

0,88

3,6

0,25

0,07

10,7

2

0,92

4,31

0,64

0,14

10,1

1,6

0,63

4,24

0,55

0,15

9,5

1,2

0,74

3,86

0,28

0,11

11,3

1,9

0,82

3,9

0,68

0,065

11

1,8

0,95

4,24

0,62

0,097


 

Оценить значимость полученной модели.

 

Вариант №2

 

Оценщик имеет следующие  данные о характеристиках одиннадцати  зданий (в одном районе города), арендуемых или покупаемых фирмами.

Для оценки 12-го и других зданий построить  уравнение множественной регрессии  и сделать выводы.

Оценить значимость полученной регрессионной модели.

 

Общая площадь, (кв.м.)

Количество  офисов

Количество  входов

Срок эксплуатации (год)

Стоимость (у.е.)

 

х1

х2

х3

х4

Y

1

2310

2

2

20

142000

2

2333

2

2

12

144000

3

2356

3

1

33

151000

4

2379

3

2

43

150000

5

2402

2

3

53

139000

6

2425

4

2

23

169000

7

2448

2

1

99

126000

8

2471

2

2

34

142900

9

2494

3

3

23

163000

10

2517

4

4

55

169000

11

2540

2

3

22

149000


 

 

Приложение 1

Распределение Дарбина—Уотсона

 

Критические точки d1 и du при уровне значимости α = 0,05

Информация о работе Многофакторная регрессионная модель прогнозирования товарооборота