Автор работы: Пользователь скрыл имя, 06 Октября 2015 в 15:13, контрольная работа
Найти:
1) Построить линейную регрессию. Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию.
2) Вычислить выборочный коэффициент корреляции между Y и X и проверить гипотезу о его значимости;
3) Определите значимость коэффициентов регрессии и построить для них 95%-ые интервалы;
4) Используя построенное уравнение, спрогнозировать значение при ;
5) Построить доверительный интервал для зависимой переменной с надежностью 95%;
6) Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона;
7) Вычислить коэффициент детерминации и проверить его значимость.
8) Оценить прогнозные качества модели;
9) Сделать общий вывод по качеству построенной модели.
По таблице Дарбина-Уотсона найдем (нижняя граница), (верхняя граница). При уровне значимости имеем:
=0,879, =1,320
Получили <DW<4- , значит, гипотеза об отсутствии автокорреляции остатков принимается. Это является одним из подтверждений высокого качества модели.
Ответ: <DW (=1,3565264) <4- , значит, гипотеза об отсутствии автокорреляции остатков принимается. Это является одним из подтверждений высокого качества модели.
7) Вычислим коэффициент детерминации и определим его статистическую значимость по критерию Фишера.
После проверки значимости каждого коэффициента регрессии обычно проверяется общее качество уравнения регрессии.
Для этой цели используется коэффициент детерминации . определяет долю разброса зависимых переменных, объяснимую регрессией Y на X и рассчитывается в общем случае по следующей формуле:
Поставим расчетные данные, получим:
На практике проверяют гипотезу о статистической значимости коэффициента детерминации .
В этом случае используется следующая гипотеза:
: =0
: >0
Для проверки данной гипотезы существует следующая F-статистика:
Величина F при выполнении предпосылок МНК и при справедливости имеет распределение Фишера.
Для проверки нулевой гипотезы при заданном уровне значимости по таблицам критических точек распределения Фишера находится критическое значение
Нулевая гипотеза отклоняется, если F> . Это значит, что >0 и статистически значим.
Проведем вышеперечисленные расчеты:
Поскольку F> как при 5%-м и при 1%-м уровне значимости, то нулевая гипотеза отвергается, и коэффициент детерминации статистически значим.
Ответ: Коэффициент детерминации равен . Данный коэффициент близок к единице, значит, уравнение регрессии с высокой точностью отражает имеющуюся зависимость между переменными y и x. Поскольку F> как при 5%-м и при 1%-м уровне значимости, то нулевая гипотеза отвергается, и коэффициент детерминации статистически значим.
8) Оценим прогнозные качества модели.
Прогнозные качества модели проверяют при помощи средней относительной ошибки аппроксимации:
Таблица 1.4
Расчетные данные
У |
У~ |
|yi-yi~/yi| | |
621 |
616,7628 |
0,006823 | |
672 |
668,9496 |
0,004539 | |
737 |
723,9321 |
0,017731 | |
811 |
820,8504 |
0,012146 | |
887 |
899,1305 |
0,013676 | |
976 |
990,4574 |
0,014813 | |
1084 |
1081,784 |
0,002044 | |
1204 |
1192,681 |
0,009401 | |
1346 |
1342,718 |
0,002438 | |
1506 |
1506,734 |
0,000487 | |
Итого |
0,084099 |
Так как значит, данную модель для прогнозирования использовать желательно.
9) Оценим качество уравнения регрессии.
При определении общего качества модели обычно анализируются следующие параметры:
Таким образом, в данной линейной модели связь между переменными Х и У прямая сильная, так как коэффициенты корреляции (значим) равен 0,999497277. Связь прямая, т.е. при увеличении совокупного располагаемого дохода совокупные расходы на личное потребление США возрастут.
По критерию Стьюдента коэффициенты регрессии а и b являются значимы.
Коэффициент детерминации статистически значим и равен , что говорит о сильной зависимости между совокупным располагаемым доходом и совокупным расходом на личное потребление США.
Согласно статистике Дарбина-Уотсона гипотеза об отсутствии автокорреляции остатков принимается. Это является одним из подтверждений высокого качества модели.
Данная модель для прогнозирования приемлема, так как ошибка аппроксимации .
ЗАДАНИЕ 2.
Общее уравнение экспоненциальной зависимости:
Коэффициенты а и b находятся аналогично линейной зависимости, но для уравнения где , .
Таблица 2.1
Расчетные данные
x |
y |
y* |
у*х |
х2 | |
695 |
621 |
6,43133 |
4469,78 |
483025 | |
751 |
672 |
6,51026 |
4889,2 |
564001 | |
810 |
737 |
6,60259 |
5348,1 |
656100 | |
914 |
811 |
6,69827 |
6122,22 |
835396 | |
998 |
887 |
6,78784 |
6774,27 |
996004 | |
1096 |
976 |
6,88346 |
7544,27 |
1201216 | |
1194 |
1084 |
6,98841 |
8344,17 |
1425636 | |
1313 |
1204 |
7,0934 |
9313,64 |
1723969 | |
1474 |
1346 |
7,20489 |
10620 |
2172676 | |
1650 |
1506 |
7,31721 |
12073,4 |
2722500 | |
среднее |
1089,5 |
984,4 |
6,851768 |
7549,905 |
1278052 |
Получили уравнение y= 342,3089е0,000933*х.
Построим график для найденной зависимости с помощью средств Мастера диаграмм MS Excel. После ввода данных из исходной таблицы 2.1 на рабочий лист нужно построить плоскую диаграмму зависимости y от x. Проще использовать точечный тип диаграмм. Для этого типа в качестве аргумента предлагается задать область аргумента, в нашем случае x.
После того, как диаграмма построена, необходимо активизировать на ней все точки наблюдений. Затем с помощью правой кнопки мыши вызывается контекстное меню, в котором выбирается пункт «добавить линию тренда». Под линией тренда в данной задаче следует понимать линию, определенную уравнением регрессии.
Затем на закладке «Тип» окна «Линия тренда» нужно выбрать тип уравнения в соответствии с выдвинутой нами ранее гипотезой о экспоненциальной зависимости между y и x. На закладке «Параметры» этого же окна включим флажок «показывать уравнение на диаграмме».
Рисунок 1. - Закладки «Тип» и «Параметры» окна «Линия тренда»
На рисунке 2 показан результат оценки регрессии, полученный с помощью Мастера диаграмм Microsoft Excel.
Видим, что это совпадает с ручным результатом y= 342,3089е0,000933*х, полученным выше.
Совпадение результатов ручной схемы и Мастера диаграмм дает уверенность в их правильности.
Найдем корреляционное отношение. Для этого построим таблицу 2.2.
Таблица 2.2
Расчетные данные
№ п/п |
| ||
1 |
654,494 |
-33,494 |
-363,4 |
2 |
689,583 |
-17,583 |
-312,4 |
3 |
728,589 |
8,41127 |
-247,4 |
4 |
802,794 |
8,20572 |
-173,4 |
5 |
868,212 |
18,7881 |
-97,4 |
6 |
951,3 |
24,7001 |
-8,4 |
7 |
1042,34 |
41,6605 |
99,6 |
8 |
1164,68 |
39,321 |
219,6 |
9 |
1353,36 |
-7,3623 |
361,6 |
10 |
1594,77 |
-88,767 |
521,6 |
Сумма квадратов |
13747,6 |
791450 |
Для определения тесноты связи между интенсивностью потока покупателей и товарооборотом, найдем корреляционное отношение:
Так как , следовательно, между размерами совокупного располагаемого дохода (Х) и совокупных расходах на личное потребление (У) существует тесная связь.
Для коэффициента детерминации и индекса корреляции выполняется следующее равенство: , поэтому данные показатели можно сравнить у линейной и нелинейной зависимостей.
Коэффициент детерминации для экспоненциальной зависимости равен .
Коэффициент детерминации для экспоненциальной зависимости показывает, что 98,263% изменения средних расходов на личное потребление обусловлено зависимостью от размеров совокупного располагаемого дохода, остальные 1,737016% приходятся на долю прочих факторов, не учтенных в экспоненциальной модели.
Сравнивая коэффициенты детерминации для линейной ( = ) и экспоненциальной зависимости ( ), можно сделать вывод, что линейная зависимость лучше аппроксимирует данную задачу в отличие от экспоненциальной зависимости.
ЗАДАНИЕ 3.
Имеются статистические данные, описывающие зависимость производительности труда в некоторой отрасли производства (переменная У) от удельного веса рабочих с технической подготовкой (объясняющая переменная Х1) и удельного веса механизированных работ (объясняющая переменная Х2).
Таблица 3.1
Исходные данные
№ |
Удельный вес рабочих с технической подготовкой, %, Х1 |
Удельный вес механизированных работ, %, Х2 |
Производительность труда |
1 |
70 |
90 |
4350 |
2 |
67 |
89 |
4100 |
3 |
53 |
73 |
2950 |
4 |
52 |
69 |
2900 |
5 |
55 |
75 |
2950 |
6 |
60 |
76 |
3350 |
7 |
59 |
79 |
3410 |
8 |
67 |
87 |
4050 |
9 |
63 |
83 |
3650 |
10 |
60 |
78 |
3450 |
11 |
66 |
86 |
3950 |
12 |
73 |
89 |
4400 |
13 |
69 |
91 |
4220 |
Найти:
Решение:
Регрессионные модели можно подразделить на однофакторные и многофакторные.
Определение
Многофакторной моделью регрессии называется модель с несколькими входным параметрами (факторами). В нашем случае это X1 и Х2.
Фактор является детерминированной величиной, т.е. должен задаваться экспериментатором. В отличие от него результат является величиной случайной и представляет собой некоторую функцию в зависимости от входных параметров. Причем функция должна удовлетворять следующим требованиям:
· Аналитичность, т.е. должна разлагаться в ряд;
· Непрерывность;
· Адекватность, т.е. с достаточной точностью отражать параметры оптимизации;
· Единственность оптимума.
Данным требованиям наилучшим образом отвечают регрессионные модели. Вид регрессионных моделей находится по следующему алгоритму
1. Определение фактора. В нашем
случае влияние удельного веса
рабочих с технической
2. Сбор статистического
3. Нахождение коэффициентов
Матричный метод позволяет вычислять вектор коэффициентов уравнения b как выражение следующего вида:
В условиях нашей задачи вектор Х определен следующим образом:
1 |
70 |
90 |
1 |
67 |
89 |
1 |
53 |
73 |
1 |
52 |
69 |
1 |
55 |
75 |
1 |
60 |
76 |
1 |
59 |
79 |
1 |
67 |
87 |
1 |
63 |
83 |
1 |
60 |
78 |
1 |
66 |
86 |
1 |
73 |
89 |
1 |
69 |
91 |