Автор работы: Пользователь скрыл имя, 22 Января 2014 в 19:35, контрольная работа
По исходным данным требуется:
1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов «чистой» регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).
2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.
Таблица В
Коэффициенты уравнения регрессии |
Стандартная ошибка определения коэффициентов |
t-статистика |
Вероятность ошибки |
Нижние 95%-пределы |
Верхние 95%-пределы | |
Коэффициенты |
Стандартная ошибка |
P-Значение |
Нижние 95% |
Верхние 95% | ||
Y-пересечение |
-0,70149 |
0,811485 |
-0,86446 |
0,409786 |
-2,5372 |
1,134214 |
X2 |
0,069869 |
0,035925 |
1,944849 |
0,083656 |
-0,0114 |
0,151138 |
X3 |
1,05516 |
0,334983 |
3,149891 |
0,01174 |
0,297376 |
1,812944 |
Из таблицы В следует, что уравнение регрессии имеет вид:
У = -0,70149 + 0,069869*х2+1,05516*х3
Дана экономическая
Коэффициент детерминации (индекс детерминации) можно определить из табл. А:
R2ух1,х2,…. = 0,952963
Очевидно, что связь между факторами (х2, х3) и результатом (У) прямая и сильная. Величина R2= 0,952963 показывает долю изменения (вариации) результативного признака под действием факторного признака. Т.е. доля изменения (вариации) результативного признака под воздействием факторного признака равна 95,3 %
Коэффициент множественной корреляции (индекс корреляции) можно определить из табл. А:
Rух1,х2,…. =
Проверка значимости уравнения регрессии основана на использовании F-критерии Фишера. Фактическое значение критерия берется из таблицы Б, т. е.
Fфакт = 91,16845
Так как 4,0617= = 91,16845 то уравнение модели регрессии статистически значимо на 95% уровне значимости. Таким образом, связь У с включенным в модель факторами Х2, Х3 существенна.Откуда следует, что уравнение регрессии значимо и при α = 0,05, и α = 0,01.
Уровень точности модели характеризует степень отклонения в среднем фактических значений результативной переменнойУ от ее значений, полученных по модели регрессии (предсказанных). Для оценки уровня точности используются различные ошибки: средняя относительная, стандартная и другие.
Cтандартная ошибка модели выводится в таблице Аотчета по регрессионному анализу.
Регрессионная статистика | |
Множественный R |
0,976198 |
R-квадрат |
0,952963 |
Нормированный R-квадрат |
0,94251 |
Стандартная ошибка |
1,663242 |
Наблюдения |
12 |
Точность модели тем лучше, чем меньше ее стандартная ошибка (это же имеет место и при использовании для оценки уровня точности других видов ошибок). Однако, понятие «чем меньше» является относительным и зависит от порядка чисел, представляющих данные задачи. Поэтому модель считается точной, если стандартная ошибка модели меньше стандартной ошибки (среднеквадратического отклонения) результативного признака Y = 6,936787091. Для нашего примера это условие выполняется
При оценке уровня точности модели на основе средней относительной ошибки, необходимо рассчитать величину = * 4,574059 * 100% = 38,117%,которая показывает, на сколько процентов в среднем фактические значения результативного признака отличаются от рассчитанных по модели (предсказанных). Уровень точности модели считается достаточным, если . В нашем случае уровень точности модели можно оценить как неудовлетворительный.
Учитывая, что коэффициенты регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения и разной колеблемости факторов, используем коэффициенты эластичности, бета-коэффициенты, дельта-коэффициенты.
Эластичность:
где – коэффициент регрессии, стоящий перед фактором в уравнении регрессии.Средние значения переменных легко найти с помощью статистической функции Excel СРЗНАЧ.
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
Э(х2) = 0,069869* = 0,3820656
Э (х3) = 1,05516* = 0,70835
Бета-коэффициенты:
где , – среднеквадратические отклонения (стандартные ошибки) соответствующих переменных, которые легко находить с помощью статистической функции СТАНДОТКЛОН.
Бета-коэффициент с математической точки зрения показывает, на какую часть величины среднеквадратического отклонения (СКО) меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных.
b (х2) = 0,069869* = 0,3790854
b (х3) = 1,05516* = 0,613972
Вывод: при изменении каждого из факторов на одно СКО результат У меняется соответственно на 0,3790854 (прямая связь с фактором х2), и на0,613972 своего СКО (прямая связь со вторым фактором х3).
Долю влияния
конкретного фактора в
где – коэффициенты парной корреляции (в силу мультиколлинеарности факторов, воспользуемся коэффициентами частной корреляции) – коэффициент детерминации.
∆Х2 = 0,949267 * = 0,377615
∆Х3 = 0,96602 * = 0,622384
Общий вывод: наибольшее влияние наУ оказывает фактор х3
4. Построена и проанализирована линейная модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.
Значения коэффициентов а = (а0, а1), при которых достигается минимум, называются оценками метода наименьших квадратов.
Система нормальных уравнений имеет вид:
Sy = m a0 + а1Sx3
Syx3 = a0Sx3 +а1Sx32
Величины Sy, Sx3, Syx3, Sx32 находятся непосредственно по данным производственных измерений, которые заданы в таблице промежуточных вычислений.
t |
у |
х |
у*х |
х*х |
у*у |
Республика Алтай |
0,8 |
0,26 |
0,208 |
0,0676 |
0,64 |
Республика Бурятия |
3,1 |
2,64 |
8,184 |
6,9696 |
9,61 |
Республика Тыва |
0,3 |
0,28 |
0,084 |
0,0784 |
0,09 |
Республика Хакасия |
1,9 |
1,78 |
3,382 |
3,1684 |
3,61 |
Алтайский край |
6,7 |
5,13 |
34,371 |
26,3169 |
44,89 |
Красноярский край |
24 |
12,43 |
298,32 |
154,5049 |
576 |
Иркутская обл. |
11,4 |
8,62 |
98,268 |
74,3044 |
129,96 |
Кемеровская обл. |
16,4 |
11,74 |
192,536 |
137,8276 |
268,96 |
Новосибирская обл. |
9,4 |
6,05 |
56,87 |
36,6025 |
88,36 |
Омская обл. |
4,8 |
4,54 |
21,792 |
20,6116 |
23,04 |
Томская обл. |
8,6 |
5,84 |
50,224 |
34,1056 |
73,96 |
Читинская обл. |
5,7 |
3,19 |
18,183 |
10,1761 |
32,49 |
ИТОГО |
93,1 |
62,5 |
782,422 |
504,7336 |
1251,61 |
Для исходной задачи система нормальных уравнений примет вид:
93,1= 12 * а0 + 62,5 * а1
782,422 = 62,5 * а0 + 504,7336 * а1
Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия» (рис 1).
Задав соответствующие диапазоны данных в окне,
получим набор таблиц А, Б, В.
Таблица А – регрессионный анализ
Множественный R |
0,966019709 |
Множественный коэффициент корреляции R |
R-квадрат |
0,933194078 |
Коэффициент координации R |
Нормированный R-квадрат |
0,926513485 |
|
Стандартная ошибка |
1,88045173 |
Стандартная ошибка определения R |
Наблюдения |
12 |
Число наблюдений |
Таблица Б – дисперсионный анализ
Число степеней свободы |
дисперсия |
Дисперсия на 1 степень свободы |
Статистика Фишера |
||
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
493,9481796 |
493,9481796 |
139,6873278 |
3,37E-07 |
Остаток |
10 |
35,36098709 |
3,536098709 |
||
Итого |
11 |
529,3091667 |
Таблица В
Коэффициенты уравнения регрессии |
Стандартная ошибка определения коэффициентов |
t-статистика |
Вероятность ошибки |
Нижние 95%-пределы |
Верхние 95%-пределы | |
Коэффициенты |
Стандартная ошибка |
P-Значение |
Нижние 95% |
Верхние 95% | ||
Y-пересечение |
-0,8884583 |
0,910999635 |
-0,975256483 |
0,352434299 |
-2,91829 |
1,141375 |
X3 |
1,660183994 |
0,140468103 |
11,81893937 |
3,37E-07 |
1,347202 |
1,973166 |
Из таблицы В следует, что уравнение регрессии имеет вид:
У = -0,8884583 + 1,660183994*х3
Сравним качество моделей, построенных ранее
Вид модели |
Коэффициент корреляции |
Коэффициент детерминации |
Расчетное значение F-критерия Фишера |
Значимость F-критерия Фишера |
Множественная регрессия с полным набором факторов |
0,982883 |
0,966059 |
75,90049 |
3,22 Е-06 |
Множественная регрессия со значимыми факторами (х2, х3) |
0,976198 |
0,952963 |
91,16845 |
1,06 Е-06 |
Парная корреляция для У и Х3 |
0,966019709 |
0,933194078 |
139,6873 |
3,37 Е-07 |
В нашем случае индекс множественной дисперсии равен наибольшее значения принимает для модели множественной регрессии с полным набором факторов (0,982883). Чем больше значение индекса множественной корреляции (коэффициента детерминации), тем больше роль в изменении результирующей переменной у тех факторов, которые учтены в модели, т.е. тем лучше линейная модель отражает исходные данные. В то время как линейная модель отражает исходные данные только на 98,9%.
Очевидно, что только для модели парной регрессии показателей У и Х3 значение F факт = 139,6873³Fтабл = 4,459, т.е. данное уравнение регрессии с вероятностью 0,95 в целом статистически значимо, т.е. принимается гипотеза о неслучайной природе выявленной зависимости и статистической значимости параметров уравнения и показателя тесноты связи. Для остальных моделей F факт несколько ниже, хотя все построенные уравнения регрессии с вероятностью 0,95 в целом статистически незначимы, т.е. гипотеза о неслучайной природе выявленной зависимости и статистической значимости параметров уравнения и показателя тесноты связи не принимается.
5. Осуществлено прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости a = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).
1) точечный прогноз фактора:
Х3 прогноз = 12,43 * 0,8 = 9,944
2) точечный прогноз (ТП) показателя Y:
У = -0,8884583 + 1,660183994*х3=
= -0,8884583 + 1,6601833994 * 9,944 = 15,62
3) интервальный прогноз показателя Y:
Вначале находят ошибку прогнозирования
Информация о работе Построение и анализ модель множественной регрессии