Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 20:16, лабораторная работа
Цель: приобретение навыков построения многофакторной регрессионной модели и ее анализа на статистическую значимость.
Задача создания математических моделей некоторых объектов и явлений на основе экспериментов или наблюдений с целью их дальнейшего использования, например, для составления прогнозов, может быть успешно решена с помощью корреляционно-регрессионного анализа (КРА).
Рисунок 2 – Зависимость объема товарооборота от численности работников предприятия
Рисунок 3 - Зависимость объема товарооборота от размера основных фондов
Рисунок 4 – Зависимость продаж от объема поступления товара
Корреляционные поля на графиках показывают тенденции к изменению из нижнего левого угла в правый верхний. Поэтому построенные графики позволяют предположить, что между независимыми факторами Х1 и У, Х2 и У, Х3 и У возможна зависимость линейного вида.
3. Построим матрицу корреляции для количественного выражения взаимосвязи между объёмом товарооборота и приведёнными в таблице независимыми факторами с помощью команды Сервис/Анализ данных/Корреляция (рисунок 3).
Рисунок 3 – Окно диалога Корреляция
Полученная матрица корреляции представлена на рисунке 4.
Рисунок 4 – Корреляционная матрица
4. Проанализируем полученные коэффициенты корреляции:
5. Определим наличие явления мультиколлинеарности (мультиколлинеарности означает, что один или несколько независимых факторов тесно связаны друг с другом).
На рисунке 5 представлена матрица мультиколлинеарности М.
det(М) = 0,3378414151,
что свидетельствует о возможном присутствии явления мультиколлинеарности в регрессионной модели (det(М) стремится к 0).
Рисунок 5 – Матрица мультиколлинеарности
6. Для нахождения коэффициентов регрессии, построения и дальнейшего анализа регрессионной модели воспользуемся командой Сервис-Анализ данных-Регрессия (рисунок 6).
Рисунок 6 – Диалоговое окно Регрессия
Результат выполнения команды приведен на рисунке 7.
7. Проанализируем регрессионную статистику:
Рисунок 7 – Результат выполнения команды Регрессия
8. Проанализируем значимость коэффициента множественной корреляции R. При уровне значимости и степенях свободы и 2 критерий Фишера Fp = 11,5183, табличное значение (значимость F) = 0,01947. Fp > Fk , что позволяет отвергнуть гипотезу о незначимости показателя тесноты связи - Множественного R=0,9467, или иначе: гипотеза о равенстве коэффициентов регрессии в модели нулю должна быть отвергнута.
9. При анализе мультиколлинеарности (пункт 5) было выявлено ее возможное наличие, что говорит о существовании факта взаимосвязи независимых факторов между собой. Такой же вывод был сделан при анализе корреляционной матрицы (пункт 4). Коэффициенты выявленных корреляций равны -0,699581146, -0,351708319, 0,577086169. Так как все эти коэффициенты парной корреляции ниже значения множественного коэффициента корреляции R=0,9467, явление мультиколлинеарности будем считать незначительным и ни один из независимых факторов не будем удалять из модели.
10. Уравнение регрессии между объёмом товарооборота, численностью персонала, основными фондами и объемом поступления товаров имеет следующий вид (в скобках указаны стандартные ошибки):
(38331,48) (17,191) (5,6412) (
11. Анализ значений коэффициентов регрессии и их стандартных ошибок (t-статистика) позволяет сделать вывод о значимости в уравнении коэффициентов всех переменных, т.к. они превосходят свои стандартные ошибки более чем в два раза.
Значение 57,67 коэффициента регрессии для численности работников говорит о том, что увеличение персонала на одного человека будет сопровождаться повышением объема товарообоота на 57,67 единиц, если остальные факторы остаются без изменения. Аналогично: значение 0,5923 коэффициента регрессии для объёма поступления товаров при увеличении его на единицу означает повышение объема товарооборота на 0,5923 единиц, если остальные факторы останутся неизменными; значение 16,45 коэффициента регрессии для основных фондов товаров при увеличении их на единицу означает повышение объема товарооборота на 16,45 единиц, если остальные факторы останутся неизменными.
12. Используя данные таблицы Вывод остатка (рисунок 7), построим диаграмму остатков (рисунок 8). Анализ остатков позволяет сделать вывод, что остатки удовлетворяют предположению о нормальном распределении, т.к. остатки не имеют большого разброса при перемещении слева направо по шкале предсказанных значений.
Рисунок 8 - Диаграмма остатков как функция предсказанных значений (с линией тренда)
Диаграммы остатков как функция независимых факторов (рисунки 9-11 с добавленной линией тренда) также подтверждают независимость остатков.
Рисунок 9 - Диаграмма остатков как функция среднесписочной численности работников
Рисунок 10 - Диаграмма остатков как функция основных фондов
Рисунок 11 - Диаграмма остатков как функция объемов поступления товаров
13. Проведем анализ остатков с точки зрения критерия Дарбина –Уотсона.
Воспользовавшись данными из таблицы Вывод остатка (рисунок 7) и расчетной
формулой , получим dw»2,466383504.
Из таблицы критических точек Дарбина–Уотсона (Приложение 1) определим два пороговых значения - dl и du:
n (объем выборки) = 8,
m (число независимых факторов) = 3.
Следовательно, dl = 0,368, du = 2,287
Значение критерия Дарбина–Уотсона не удовлетворяет ни одному из предложенных оценочных правил:
- существует положительная автокорреляция
- вывод о наличии автокорреляции не определён
- автокорреляция отсутствует
- существует отрицательная автокорреляция.
Оно попало в зону неопределенности.
Воспользуемся "грубым" правилом: автокорреляция остатков отсутствует, если , что подходит в нашем случае.
Проведенный анализ позволяет сделать приблизительный вывод о независимости остатков и, следовательно, об отсутствии автокорреляции.
Вывод
Таким образом, с некоторым приближением можно сделать вывод о практической значимости полученной модели прогнозирования товарооборота.
Для получения более надежной модели необходимо еще раз проанализировать все факторы, влиющие на объем товарооборота, выбрать наиболее существенные; получить новую выборку данных, построить другую модель, строго удовлетворяющую всем требованиям статистической значимости.
Задания на самостоятельную работу
Вариант №1
Требуется составить модель множественной
регрессии для следующих
Y- урожайность (ц/га),
X1- число тракторов (мощность на 100га),
X2 - число зерноуборочных
X3- число орудий поверхностной обработки на 100 га,
X4- количество удобрений (т/га),
X5 - количество химических средств защиты растений (ц/га)
В таблице представлены усредненные данные:
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
9,7 |
1,59 |
0,26 |
2,05 |
0,32 |
0,14 |
10,2 |
1,8 |
0,55 |
3,22 |
0,4 |
0,02 |
11,5 |
2,5 |
0,71 |
4,6 |
0,72 |
0,15 |
9,9 |
1,6 |
0,49 |
2,57 |
0,39 |
0,17 |
8,6 |
0,7 |
0,67 |
2,95 |
0,2 |
0,09 |
9 |
1,1 |
0,88 |
3,6 |
0,25 |
0,07 |
10,7 |
2 |
0,92 |
4,31 |
0,64 |
0,14 |
10,1 |
1,6 |
0,63 |
4,24 |
0,55 |
0,15 |
9,5 |
1,2 |
0,74 |
3,86 |
0,28 |
0,11 |
11,3 |
1,9 |
0,82 |
3,9 |
0,68 |
0,065 |
11 |
1,8 |
0,95 |
4,24 |
0,62 |
0,097 |
Оценить значимость полученной модели.
Вариант №2
Оценщик имеет следующие данные о характеристиках одиннадцати зданий (в одном районе города), арендуемых или покупаемых фирмами.
Для оценки 12-го и других зданий построить
уравнение множественной
Оценить значимость полученной регрессионной модели.
№ |
Общая площадь, (кв.м.) |
Количество офисов |
Количество входов |
Срок эксплуатации (год) |
Стоимость (у.е.) |
х1 |
х2 |
х3 |
х4 |
Y | |
1 |
2310 |
2 |
2 |
20 |
142000 |
2 |
2333 |
2 |
2 |
12 |
144000 |
3 |
2356 |
3 |
1 |
33 |
151000 |
4 |
2379 |
3 |
2 |
43 |
150000 |
5 |
2402 |
2 |
3 |
53 |
139000 |
6 |
2425 |
4 |
2 |
23 |
169000 |
7 |
2448 |
2 |
1 |
99 |
126000 |
8 |
2471 |
2 |
2 |
34 |
142900 |
9 |
2494 |
3 |
3 |
23 |
163000 |
10 |
2517 |
4 |
4 |
55 |
169000 |
11 |
2540 |
2 |
3 |
22 |
149000 |
Приложение 1
Распределение Дарбина—Уотсона
Критические точки d1 и du при уровне значимости α = 0,05
Информация о работе Многофакторная регрессионная модель прогнозирования товарооборота