Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 20:16, лабораторная работа
Цель: приобретение навыков построения многофакторной регрессионной модели и ее анализа на статистическую значимость.
Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).
Лабораторная работа № 8
Многофакторная регрессионная модель прогнозирования товарооборота
Цель: приобретение навыков построения многофакторной регрессионной
модели и ее анализа на статистическую значимость.
Общие положения
1 Понятие многофакторной модели
Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).
Регрессионные модели представляют собой математические отношения определённого вида между показателями работы объекта или характеристиками наблюдаемого явления Y1 , Y2 ,… Ym и обуславливающими их величинами Х1, Х2,..., Хn .
В зависимости от количества Xi (независимых факторов), влияние которых необходимо установить, на определяющий (зависимый) фактор Y, модели могут быть классифицированы как однофакторные и многофакторные.
Выбор типа подходящей модели является в значительной степени искусством, и при определении её вида часто решающую роль играют опыт и знания исследователя.
2 Явление автокорреляции
В тех случаях, когда КРА проводится по данным за определённые периоды, может обнаружиться явление автокорреляции, т.е. связь между данными за предыдущие и последующие периоды. Так как методика корреляционного анализа основывается на принципе статистической независимости данных, наличие автокорреляции может привести к ошибочному определению существенности и доверительных границ коэффициентов регрессии и к другим последствиям, ставящим под сомнение результаты анализа. Поэтому, если анализ производится по данным за разные периоды, необходимо убедиться в отсутствии автокорреляции в исследуемых рядах динамики.
Исследование модели на наличие явления автокорреляции проводят с помощью
где остатки для каждого момента времени наблюдения Т,
- наблюдаемое в момент времени значение исследуемого зависимого фактора,
- вычисленное с помощью полученного регрессионного уравнения значение исследуемого зависимого фактора в момент времени
Выводы о наличии или
- существует положительная автокорреляция
- вывод о наличии автокорреляции не определён
- автокорреляция отсутствует
- существует отрицательная автокорреляция
Положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтённых в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот.
Замечания:
1. недостаток критерия - наличие области неопределённости. Тогда используют тест серий (Бреуша – Готфри), Q-тест Льюинга-Бокса;
2. не обращаясь к таблице критических точек Дарбина–Уотсона, можно пользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если . Для более надёжного вывода целесообразно обращаться к табличным значениям.
3 Явление мультиколлинеарности
Включение в модель линейно-зависимых между собой независимых факторов приводит к возникновению явления мультиколлинеарности, которое отрицательно сказывается на качестве модели.
Существо проблемы заключается в том, что между факторными признаками (независимыми факторами) может существовать значительная линейная связь, что приводит в конечном итоге к недопустимому росту ошибок оценки регрессии. Например, заработная плата работников зависит, наряду с другими факторами, от роста производительности труда и от объёма выпускаемой продукции, но эти два фактора тесно взаимосвязаны, коррелированны. Если мультиколлинеарность присутствует (есть взаимозависимые факторы), то от нее пытаются избавиться исключением взаимозависимости факторов. При этом стремятся оставить один из двух взаимозависимых факторов, тот, который сильнее влияет на зависимый фактор. Но удалять из модели один из двух факторов необходимо лишь только в том случае, когда коэффициент парной корреляции между ними выше множественного коэффициента корреляции R.
Для определения явления
4 Этапы построения
многофакторной регрессионной
Процесс КРА состоит из следующих этапов:
Факторы, включаемые в разрабатываемую регрессионную модель, должны отвечать следующим требованиям:
Предварительная обработка статистических данных заканчивается составлением матрицы парных коэффициентов корреляции. Матрица парных коэффициентов - квадратная и симметричная в отношении главной диагонали. Парные коэффициенты корреляции используются для количественной оценки взаимосвязи двух наборов данных, представленных в безразмерном виде.
Коэффициент корреляции выборки представляет собой ковариацию двух наборов данных, делённую на произведение их стандартных отклонений.
Корреляционный анализ дает возможность установить, ассоциированы ли наборы данных по величине, то есть, большие значения из одного набора данных связаны с большими значениями другого набора (положительная корреляция), или, наоборот, малые значения одного набора связаны с большими значениями другого (отрицательная корреляция), или данные двух диапазонов никак не связаны (корреляция близка к нулю);
Оценку тесноты связи между факторами осуществляют по шкале Чеддока на основе коэффициентов корреляции (из матрицы корреляции):
Показания тесноты связи (коэффициент корреляции) |
0.1-0.3 |
0.3-0.5 |
0.5-0.7 |
0.7-0.9 |
0.9-0.99 |
Характеристика силы связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
Оценка корреляционных связей позволяет определить степень влияния каждого независимого фактора на зависимый. Те независимые факторы, которые имеют крайне слабую тесноту связи с исследуемым зависимым фактором (коэффициент корреляции ниже значения 0,1), из рассмотрения можно исключить как несущественные.
Выбор формы связи является сложной проблемой, так как из бесконечного множества функций требуется найти такую, которая лучше других выражает реально существующие связи между изучаемым зависимым и независимыми факторами.
Принимая во внимание, что в большинстве практических случаях любую функцию многих переменных путём логарифмирования или замены переменных можно свести к линейному виду, уравнение множественной регрессии строят в линейной форме:
Каждый коэффициент уравнения: (коэффициент регрессии) показывает степень влияния соответствующего независимого фактора на анализируемый фактор при фиксированном положении (на среднем уровне) остальных факторов: с изменением каждого фактора на единицу зависимый фактор изменяется на соответствующий коэффициент регрессии;
Построение регрессионной модели выполняется с использованием электронной технологии пакета Анализ данных в Excel.
Для определения статистической значимости полученного уравнения регрессии необходимо проанализировать:
Рассмотрим технологию разработки многофакторной регрессионной модели с помощью инструментария MS Excel на примере решения задачи построения модели регрессии для прогнозирования товарооборота организации
Разработка регрессионной модели прогнозирования товарооборота организации
Задача:
Построить многофакторную регрессионную модель зависимости объема товарооборота торговой организации от трех факторов: объема поступления товаров, основных фондов и среднесписочной численности работников предприятия. Данные наблюдений за шесть периодов приведены в таблице 1.
Таблица 1. Данные наблюдений для расчета регрессионной модели
Периоды |
Объем товарооборота (y) |
Среднесписочная численность работников (x1) |
Основные фонды (x2) |
Объем поступления товаров (x3) |
1 |
12702 |
220 |
6518 |
14380 |
2 |
18524 |
287 |
6489 |
16354 |
3 |
13321 |
195 |
6547 |
14002 |
4 |
16954 |
183 |
6624 |
22050 |
5 |
15967 |
162 |
6768 |
16875 |
6 |
19516 |
183 |
6683 |
20000 |
7 |
17251 |
171 |
6801 |
18354 |
8 |
21605 |
192 |
6854 |
21056 |
Оценить пригодность использования полученной модели для прогнозирования объемов продаж на будущие периоды.
Решение задачи
В связи с тем, что необходимо определить влияние нескольких факторов на величину товарооборота, проведем разработку многофакторной модели.
1. Сформируем на листе Excel форму для ввода исходных данных (рисунок 1)
Рисунок 1 – Исходные данные для разработки многофакторной регрессионной модели
2. Для качественного определения вида зависимости регрессионной модели построим графики зависимости объемов товарооборота от каждого из независимых факторов (рисунки 2-4).
Информация о работе Многофакторная регрессионная модель прогнозирования товарооборота