Многофакторная регрессионная модель прогнозирования товарооборота

Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 20:16, лабораторная работа

Краткое описание

Цель: приобретение навыков построения многофакторной регрессионной модели и ее анализа на статистическую значимость.
Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).

Прикрепленные файлы: 1 файл

Lab_rabN8_Mnogofaktornaya_regressionnaya_model_prognozirovaniya_q32ttqpgcfub (1).doc

— 690.50 Кб (Скачать документ)


Лабораторная  работа № 8

Многофакторная  регрессионная модель прогнозирования товарооборота

 

Цель: приобретение навыков построения многофакторной регрессионной

модели и ее анализа на статистическую значимость.

 

Общие положения

 

1 Понятие многофакторной модели

 

Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).

Регрессионные модели представляют собой математические отношения определённого вида между показателями работы объекта или характеристиками наблюдаемого явления Y1  ,  Y2 ,… Ym  и обуславливающими их величинами Х1, Х2,..., Хn .

В зависимости от количества Xi (независимых факторов), влияние которых необходимо установить, на определяющий (зависимый) фактор Y, модели могут быть классифицированы как однофакторные и многофакторные.

Выбор типа подходящей модели является в значительной степени искусством, и при определении её вида часто решающую роль играют опыт и знания исследователя.

 

2 Явление автокорреляции

 

В тех случаях, когда КРА проводится по данным за определённые периоды, может обнаружиться явление автокорреляции, т.е. связь между данными за предыдущие и последующие периоды. Так как методика корреляционного анализа основывается на принципе статистической независимости данных, наличие автокорреляции может привести к ошибочному определению существенности и доверительных границ коэффициентов регрессии и к другим последствиям, ставящим под сомнение результаты анализа. Поэтому, если анализ производится по данным за разные периоды, необходимо убедиться в отсутствии автокорреляции в исследуемых рядах динамики.

Исследование модели на наличие  явления автокорреляции проводят с помощью

  • критерия Дарбина – Уотсона:

 

где  остатки для каждого момента времени наблюдения Т,

 -  наблюдаемое в момент времени значение исследуемого зависимого фактора,

 -  вычисленное с помощью полученного регрессионного уравнения значение исследуемого зависимого фактора в момент времени

  • таблиц критических точек Дарбина–Уотсона (Приложение 1), по которым определяют два пороговых значения dl и du, зависящих от числа наблюдений, числа независимых факторов и уровня значимости.

Выводы о наличии или отсутствии автокорреляции делают на основании  полученных коэффициентов по следующему правилу:

  - существует положительная автокорреляция

  - вывод о наличии автокорреляции не определён

  - автокорреляция отсутствует

  - существует отрицательная автокорреляция

 

Положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтённых в модели факторов. 

Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот.

 

Замечания:

1.  недостаток критерия -  наличие области неопределённости. Тогда используют тест серий (Бреуша – Готфри), Q-тест Льюинга-Бокса;

2. не обращаясь к таблице критических точек Дарбина–Уотсона, можно пользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если . Для более надёжного вывода целесообразно обращаться к табличным значениям.

 

3 Явление мультиколлинеарности

 

Включение в модель линейно-зависимых  между собой независимых факторов приводит к возникновению явления мультиколлинеарности, которое отрицательно сказывается на качестве модели.

Существо проблемы заключается  в том, что между факторными признаками (независимыми факторами) может существовать значительная линейная связь, что приводит в конечном итоге к недопустимому росту ошибок оценки регрессии. Например, заработная плата работников зависит, наряду с другими факторами, от роста производительности труда и от объёма выпускаемой продукции, но эти два фактора тесно взаимосвязаны, коррелированны. Если мультиколлинеарность присутствует (есть взаимозависимые факторы), то от нее пытаются избавиться исключением взаимозависимости факторов. При этом стремятся оставить один из двух взаимозависимых факторов, тот, который сильнее влияет на зависимый фактор. Но удалять из модели один из двух факторов необходимо лишь только в том случае, когда коэффициент парной корреляции между ними выше множественного коэффициента корреляции R.

Для определения явления мультиколлинеарности необходимо:

  • построить из коэффициентов матрицы корреляции для независимых факторов матрицу мультиколлинеарности М,
  • определить её детерминант det(М),
  • если det(М) ®0  - мультиколлинеарность присутствует, иначе det(М) ®1 – отсутствует.

 

4 Этапы построения  многофакторной регрессионной модели

 

Процесс КРА состоит из следующих этапов:

  • предварительная обработка статистических данных и выбор факторных признаков.

Факторы, включаемые в разрабатываемую  регрессионную модель, должны отвечать следующим требованиям:

    • каждый фактор должен быть обоснован теоретически;
    • факторы должны быть важнейшими, оказывающими существенное воздействие на изучаемый зависимый фактор; при этом рекомендуется, чтобы количество включаемых в модель факторов не превышало одной трети от числа наблюдений в выборке (длины временного ряда);
    • факторы не должны быть линейно зависимыми между собой, поскольку эта зависимость означает, что они характеризуют аналогичные свойства изучаемого фактора (явление мультиколлинеарности);
    • в модель рекомендуется включать только такие факторы, которые могут быть численно измерены;
    • в одну модель нельзя включать совокупный фактор и образующие его частные факторы. Одновременное включение таких факторов приводит к неоправданно увеличенному их влиянию на зависимый фактор, к искажению реальной действительности.

Предварительная обработка статистических данных заканчивается составлением матрицы парных коэффициентов корреляции. Матрица парных коэффициентов - квадратная и симметричная в отношении главной диагонали. Парные коэффициенты корреляции используются для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде.

Коэффициент корреляции выборки представляет собой ковариацию двух наборов данных, делённую на произведение их стандартных отклонений.

Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю);

  • оценка тесноты связи между факторами и выявление форм связи.

Оценку тесноты связи между факторами осуществляют по шкале Чеддока на основе коэффициентов корреляции (из матрицы корреляции):

 

Показания тесноты связи (коэффициент корреляции)

0.1-0.3

0.3-0.5

0.5-0.7

0.7-0.9

0.9-0.99

Характеристика силы связи

слабая

умеренная

заметная

высокая

весьма высокая


 

Оценка корреляционных связей позволяет определить степень влияния каждого независимого фактора на зависимый. Те независимые факторы, которые имеют крайне слабую тесноту связи с исследуемым зависимым фактором (коэффициент корреляции ниже значения 0,1), из рассмотрения можно исключить как несущественные.

Выбор формы связи является сложной  проблемой, так как из бесконечного множества функций требуется найти такую, которая лучше других выражает реально существующие связи между изучаемым зависимым и независимыми факторами.

Принимая во внимание, что в большинстве практических случаях любую функцию многих переменных путём логарифмирования или замены переменных можно свести к линейному виду, уравнение множественной регрессии строят в линейной форме:

Каждый коэффициент уравнения: (коэффициент регрессии) показывает степень влияния соответствующего независимого фактора на анализируемый фактор при фиксированном положении (на среднем уровне) остальных факторов: с изменением каждого фактора на единицу зависимый фактор изменяется на соответствующий коэффициент регрессии;

  • разработка многофакторной модели изучаемого явления и её анализ. 

Построение регрессионной модели выполняется с использованием электронной технологии пакета Анализ данных в Excel.

Для определения статистической значимости полученного уравнения регрессии необходимо проанализировать:

    • значение множественного коэффициента корреляции R, указывающего на тесноту связи между зависимой переменной и совокупностью всех независимых факторов;
    • величину коэффициента детерминации R2 (R2 должен быть >= 80%);
    • F-статистику: Fp (F расчетный) должен быть меньше Fk (F критическое табличное) - Fp < Fk;
    • остатки – разность между наблюдаемыми значениями и линией регрессии (предсказываемые значения). Остатки должны быть независимыми,
    • наличие или отсутствие явления автокорреляции с помощью критерия Дарбина – Уотсона.
  • использование результатов анализа.

 

Рассмотрим технологию разработки многофакторной регрессионной модели с помощью инструментария MS Excel на примере решения задачи построения модели регрессии для прогнозирования товарооборота организации

 

Разработка регрессионной  модели прогнозирования товарооборота организации

 

Задача:

 

Построить многофакторную регрессионную  модель зависимости объема товарооборота  торговой организации от трех факторов: объема поступления товаров, основных фондов и среднесписочной численности работников предприятия. Данные наблюдений за шесть периодов приведены в таблице 1.

 

Таблица 1. Данные наблюдений для расчета регрессионной модели

 

Периоды

Объем товарооборота (y)

Среднесписочная численность  работников (x1)

Основные фонды      (x2)

Объем поступления товаров (x3)

1

12702

220

6518

14380

2

18524

287

6489

16354

3

13321

195

6547

14002

4

16954

183

6624

22050

5

15967

162

6768

16875

6

19516

183

6683

20000

7

17251

171

6801

18354

8

21605

192

6854

21056


 

Оценить пригодность использования  полученной модели для прогнозирования  объемов продаж на будущие периоды.

 

Решение задачи

 

В связи с тем, что необходимо определить влияние нескольких факторов на величину товарооборота, проведем разработку многофакторной модели.

 

1. Сформируем на листе Excel форму для ввода исходных данных (рисунок 1)

 

 

 

Рисунок 1 – Исходные данные для  разработки многофакторной регрессионной  модели

 

2. Для качественного определения вида зависимости регрессионной модели построим графики зависимости объемов товарооборота от каждого из независимых факторов (рисунки 2-4).

Информация о работе Многофакторная регрессионная модель прогнозирования товарооборота