Автор работы: Пользователь скрыл имя, 06 Октября 2015 в 15:13, контрольная работа
Найти:
1) Построить линейную регрессию. Вычисление коэффициентов выполнить методом наименьших квадратов, дать интерпретацию.
2) Вычислить выборочный коэффициент корреляции между Y и X и проверить гипотезу о его значимости;
3) Определите значимость коэффициентов регрессии и построить для них 95%-ые интервалы;
4) Используя построенное уравнение, спрогнозировать значение при ;
5) Построить доверительный интервал для зависимой переменной с надежностью 95%;
6) Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона;
7) Вычислить коэффициент детерминации и проверить его значимость.
8) Оценить прогнозные качества модели;
9) Сделать общий вывод по качеству построенной модели.
ЗАДАНИЕ 1.
В таблице 1.1 приведены данные о размерах совокупного располагаемого дохода X совокупных расходах на личное потребление Y в США в период с 1979 по 1988 год. Обе величины выражены в текущих долларах США:
Таблица 1.1
Исходные данные
X |
695 |
751 |
810 |
914 |
998 |
1096 |
1194 |
1313 |
1474 |
1650 |
Y |
621 |
672 |
737 |
811 |
887 |
976 |
1084 |
1204 |
1346 |
1506 |
Найти:
1) Построить линейную регрессию.
Вычисление коэффициентов
2) Вычислить выборочный
3) Определите значимость
4) Используя построенное
5) Построить доверительный интерв
6) Определить, есть или нет автокорреляция остатков с помощью критерия Дарбина-Уотсона;
7) Вычислить коэффициент
8) Оценить прогнозные качества модели;
9) Сделать общий вывод по качеству построенной модели.
Решение:
1) Построим линейную регрессию. Вычисление коэффициентов выполним методом наименьших квадратов, дать интерпретацию.
Однофакторной моделью регрессии называется модель с одним входным параметром (фактором).
На практике для одного входного параметра составляется однофакторная модель вида Y=b*X+a.
Вид регрессионных моделей находится по следующему алгоритму
1. Определение фактора.
2. Сбор статистического
3. Нахождение коэффициентов
Метод Наименьших Квадратов (МНК) - это метод минимизации суммы квадратов невязок (значение отклика заданное - полученное из уравнения регрессии).
Причем коэффициенты регрессии находятся из следующих уравнений:
Докажем правильность приведенных формул для поиска коэффициентов регрессии:
Для этого построим функцию:
Необходимым условием существования минимума функции является равенство нулю частных производных данной функции. Неизвестными переменными в нашем случае являются параметры а и b. Найдем эти частные производные:
Получим систему:
Разделив оба уравнения на “n” получим:
Выразив из первого уравнения a и подставив во второе уравнение, получим:
Составим вспомогательную таблицу:
Таблица 1.2
Расчетные данные
№ |
X |
Y |
X*X |
X*Y |
Y*Y |
(Y- |
|||
1 |
695 |
621 |
483025 |
431595 |
385641 |
616,763 |
17,95246559 |
155630,3 |
132059,56 |
2 |
751 |
672 |
564001 |
504672 |
451584 |
668,9498 |
9,303982359 |
114582,3 |
97593,76 |
3 |
810 |
737 |
656100 |
596970 |
543169 |
723,9323 |
170,7655674 |
78120,25 |
61206,76 |
4 |
914 |
811 |
835396 |
741254 |
657721 |
820,8506 |
97,03428096 |
30800,25 |
30067,56 |
5 |
998 |
887 |
996004 |
885226 |
786769 |
899,1308 |
147,155969 |
8372,25 |
9486,76 |
6 |
1096 |
976 |
1201216 |
1069696 |
952576 |
990,4577 |
209,0242797 |
42,25 |
70,56 |
7 |
1194 |
1084 |
1425636 |
1294296 |
1175056 |
1081,785 |
4,908183255 |
10920,25 |
9920,16 |
8 |
1313 |
1204 |
1723969 |
1580852 |
1449616 |
1192,681 |
128,108646 |
49952,25 |
48224,16 |
9 |
1474 |
1346 |
2172676 |
1984004 |
1811716 |
1342,719 |
10,76812412 |
147840,3 |
130754,56 |
10 |
1650 |
1506 |
2722500 |
2484900 |
2268036 |
1506,734 |
0,538976223 |
314160,3 |
272066,56 |
Итого: |
10895 |
9844 |
12780523 |
11573465 |
10481884 |
795,5604745 |
910420,5 |
791450,4 | |
Среднее: |
1089,5 |
984,4 |
1278052,3 |
1157346,5 |
1048188,4 |
- |
- |
- |
- |
Получим:
a=984,4+0,93190674*1089,5= -30,91239301
Получили однофакторное уравнение регрессии в виде Y=0,9319X-30,91239. Коэффициент b положителен, что означает: при увеличении совокупного располагаемого дохода совокупные расходы на личное потребление США возрастут.
Ответ: Таким образом, уравнение парной линейной регрессии имеет вид:
Y=0,9319X-30,91239
Коэффициент b показывает, на какую величину изменятся совокупные расходы на личное потребление США, если совокупный располагаемый доход возрастет на 1 единицу.
Сводный член а уравнения регрессии определяет прогнозируемое значение У при совокупном располагаемом доходе Х=0.
2) Найдем коэффициент корреляции между X и Y и проверим гипотезу о его значимости.
Коэффициент парной корреляции ryx характеризует тесноту линейной зависимости между x и y. Он находится по формуле:
Для коэффициента парной корреляции выполняется соотношение:
- 1£ ryx £ 1. Чем ближе значение | ryx | к единице, тем теснее линейная связь между x и y. Если | ryx | =1, то между x и y существует функциональная зависимость вида . Если величина | ryx | близка к нулю, то это свидетельствует об отсутствии линейной зависимости между x и y, что не исключает возможность наличия нелинейной взаимосвязи между x и y.
Близость значения коэффициента корреляции к нулю или единице носит относительный характер. Действительно, если ryx =0,99, то можно с уверенностью говорить о близости значения к единице и достаточно сильной линейной взаимосвязи между x и y. Но если ryx равен, например, 0,7, то говорить о его близости к единице оснований значительно меньше. А если ryx=0,5, то можно с равными основаниями говорить как о близости к нулю, так и о близости к единице.
В условиях нашей задачи получим:
Значит, коэффициент корреляции между X и Y равен 0,999497277. Данное значение коэффициента корреляции позволяет сделать вывод о сильной (прямой) линейной зависимости между рассматриваемыми переменными Х и У, т.к. значение │r│ близок к 1.
Одним из важнейших элементов эконометрического анализа является установление наличия связи между различными показателями. Обычно анализ начинают с простейшей линейной зависимости. Чтобы установить наличие значимой линейной связи между X и Y следует проверить гипотезу о статической зависимости коэффициента корреляции. В этом случае используется следующая гипотеза:
: =0
: <>0
Для проверки по выборке (x1,y1),…,(x10,y10) объема 10 строится статистика.
В нашем случае N=10, =0,999497277 (выборочный коэффициент корреляции).
Значит
Определим по таблице распределения Стьюдента для заданного уровня значимости и степени свободы.
2,306
Если , тогда нет оснований отклонения ;
Если , тогда отклоняется в пользу
В нашем случае отклоняется, значит, коэффициент корреляции статически значим, и между переменными существует линейная связь (прямая).
Ответ: Коэффициент корреляции между X и Y равен 0,999497277. Данное значение коэффициента корреляции позволяет сделать вывод о сильной (прямой) линейной зависимости между рассматриваемыми переменными Х и У, т.к. значение │r│ близок к 1. Связь прямая, при увеличении совокупного располагаемого дохода совокупные расходы на личное потребление США возрастут. Коэффициент корреляции статически значим
3) Проверим значимость коэффициентов регрессии и построим для них 95%-ые интервалы.
Определяем значимость коэффициента уравнения. Для проверки значения коэффициента рассчитываются t-статистика.
где Sа , Sb – стандартные ошибки коэффициента регрессии
,
где S – стандартная ошибка регрессии
S2 – остаточная дисперсия.
= 795,5604745/8= 99,44505931
Так как , , то нулевая гипотеза при заданном уровне значимости =0,05 отвергается. Это означает статистическую значимость коэффициентов a и b. Значит, членами уравнения регрессии нельзя пренебречь, рассматривая регрессию .
Соотношения, определяющие доверительные интервалы:
= 795,5604745/8= 99,44505931
Подставив полученные значения в исходную формулу, получим:
Доверительный интервал для ‘a’:
-30,91239 2,306* ;
(-58,1586; -3,66624)
Доверительный интервал для ‘b’:
0,9319 2,306* ;
(0,907806; 0,956008)
Фактически доверительный интервал определяет значения теоретических коэффициентов регрессии, которые будут приемлемы с надежностью (1- ) при найденных оценках a, b.
Ответ: Так как , то нулевая гипотеза при заданном уровне значимости =0,05 отвергается. Это означает статистическую значимость коэффициентов a и b.
4) Спрогнозируем значение.
5) Найдем интервал, в котором с вероятностью 0,95 находится значение .
Доверительный интервал в данном случае определяется границами:
Получим
(1178,4925; 1196,43245)
Ответ: Доверительный интервал, в котором с вероятностью 0,95, находится значение , определяется границами: (1178,4925; 1196,43245). Другими словами, средний размер совокупного расхода на личное потребление США при размере совокупного располагаемого дохода 1307,4 с вероятностью 95% будет находиться в интервале (1178,4925; 1196,43245).
6) Определим автокорреляцию остатков с помощью критерия Дарбина-Уотсона.
Статистические значения коэффициентов регрессии и близкое к единице значение коэффициента детерминации не гарантируют высокое качество уравнения регрессии.
На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина-Уотсона DW, рассчитываемую по формуле:
Для заданных в таблице Дарбина-Уотсона указываются два числа: -нижняя граница, - верхняя граница.
Выводы осуществляются по следующей схеме:
Если DW< , то это свидетельствует о положительной автокорреляции остатков.
Если DW>4- , то это свидетельствует об отрицательной автокорреляции остатков.
Если <DW<4- , то гипотеза об отсутствии автокорреляции остатков принимается.
Если <DW< или 4- <DW<4- , то гипотеза об отсутствии автокорреляции остатков не может быть ни принята, ни отклонена.
Таблица 1.3
Расчетные данные
№ |
X |
Y |
|||||
1 |
695 |
621 |
64,870222 |
4,237035 |
17,95246559 |
- |
- |
2 |
751 |
672 |
69,388071 |
3,050243 |
9,303982359 |
-1,18679 |
1,408475 |
3 |
810 |
737 |
70,033478 |
13,06773 |
170,7655674 |
10,01749 |
100,35 |
4 |
914 |
811 |
70,678885 |
-9,850598 |
97,03428096 |
-22,9183 |
525,2498 |
5 |
998 |
887 |
71,969699 |
-12,130786 |
147,155969 |
-2,28019 |
5,199257 |
6 |
1096 |
976 |
67,45185 |
-14,457672 |
209,0242797 |
-2,32689 |
5,414398 |
7 |
1194 |
1084 |
66,161036 |
2,215442 |
4,908183255 |
16,67311 |
277,9927 |
8 |
1313 |
1204 |
65,515629 |
11,318509 |
128,108646 |
9,103067 |
82,86583 |
9 |
1474 |
1346 |
66,806443 |
3,281482 |
10,76812412 |
-8,03703 |
64,5938 |
10 |
1650 |
1506 |
64,224815 |
-0,73415 |
0,538976223 |
-4,01563 |
16,1253 |
Итого: |
- |
- |
- |
- |
795,5604745 |
-4,97119 |
1079,2 |