Автор работы: Пользователь скрыл имя, 15 Декабря 2013 в 19:49, контрольная работа
По территориям Районов известны данные за 1995 г. (в табл.).
1.Рассчитайте параметры уравнений линейной парной регрессии.
2.Оцените тесноту связи с помощью показателей корреляции и детерминации.
3.Оцените с помощью средней ошибки аппроксимации качество уравнений.
4.Оцените с помощью F - критерия Фишера статистическую надёжность результатов регрессионного моделирования.
С помощью Excel вычисляем параметры линейного уравнения множественной регрессии. Эта операция проводится с помощью инструмента анализа данных Регрессия.
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,919058809 |
|||||||
R-квадрат |
0,844669094 |
|||||||
Нормированный R-квадрат |
0,803247519 |
|||||||
Стандартная ошибка |
2,501345416 |
|||||||
Наблюдения |
20 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
4 |
510,3490667 |
127,5872667 |
20,392008 |
6,30718E-06 |
|||
Остаток |
15 |
93,85093334 |
6,25672889 |
|||||
Итого |
19 |
604,2 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
66,81415194 |
4,790035949 |
13,94857004 |
5,391E-10 |
56,60443204 |
77,02387184 |
56,60443204 |
77,02387184 |
Переменная X 1 |
0,441496913 |
0,380772214 |
1,159477758 |
0,2643862 |
-0,370099846 |
1,253093672 |
-0,370099846 |
1,253093672 |
Переменная X 2 |
-5,410333539 |
2,224272809 |
-2,432405556 |
0,0279915 |
-10,15125879 |
-0,669408293 |
-10,15125879 |
-0,669408293 |
Переменная X 3 |
5,254149625 |
1,881468214 |
2,792579532 |
0,0136627 |
1,243895074 |
9,264404177 |
1,243895074 |
9,264404177 |
Переменная X 4 |
-0,160339127 |
0,034491078 |
-4,648713201 |
0,0003151 |
-0,233855119 |
-0,086823136 |
-0,233855119 |
-0,086823136 |
Получим следующее уравнение множественной регрессии
Она показывает, что средняя ожидаемая продолжительность жизни при:
х1 – если ВВП в паритетах покупательной способности увеличивается, то продолжительность жизни при рождении увеличивается на 0,44;
х2 – при увеличении населения предыдущего года, продолжительность жизни уменьшается на 5,41 %;
х3 – при увеличении темпа прироста рабочей силы по сравнению с предыдущим годом, продолжительность жизни при рождении увеличивается на 5,25 %;
х4 – если коэффициент младенческой смертности увеличивается, то продолжительность жизни при рождении уменьшается на 0,16 %.
Находим стандартизированную (таб.), величины для расчетов Sy и Sj определяем с помощью Excel (мастер функции, категория статистические, функция стадотклон).
Нужно сравнить влияние на зависимую переменную различных объясняющих переменных, когда они выражаются разными единицами измерения, для этого используют два показателя:
- стандартизированный коэффициент регрессии - ;
Она показывает, что средняя ожидаемая продолжительность жизни:
- при увеличении покупательной способности в паритетах ВВП, продолжительность жизни в среднем повышается на 0,152.
- при увеличении населения по сравнению с предыдущим годом, продолжительность жизни уменьшается на 0,406%.
- при увеличении темпов прироста рабочей силы по сравнению с предыдущим годом, продолжительность жизни увеличивается на 0,468%.
- при увеличении коэффициента младенческой смертности, продолжительность жизни уменьшается на 0,621%.
- коэффициент эластичности - ;
Она показывает, что средняя ожидаемая продолжительность жизни:
- при увеличении покупательной способности в паритетах ВВП на 1 %, продолжительность жизни в среднем повышается на 0,038.
- при увеличении населения по сравнению с предыдущим годом на 1%, продолжительность жизни уменьшается на 0,263%.
- при увеличении темпов прироста рабочей силы по сравнению с предыдущим годом на 1%, продолжительность жизни увеличивается на 0,252%.
- при увеличении коэффициента младенческой смертности на 1%, продолжительность жизни уменьшается на 0,258%.
Оценить значимость можно с помощью коэффициента детерминации (таб. Дисперсионного анализа):
Задание: 26
Постройте авторегрессионную функцию. Охарактеризуйте структуру ряда. Выбрать наилучший тип тренда и определить его параметры. Известны сведения об уровне среднегодовых цен на мировых рынках на шерсть из Новой Зеландии, амер. центы за кг.
Год |
Цена |
Год |
Цена |
1970 |
73,8 |
1977 |
256,4 |
1971 |
72,6 |
1978 |
249,6 |
1972 |
106,9 |
1979 |
300,4 |
1973 |
237,5 |
1980 |
316,7 |
1974 |
214,7 |
1981 |
274,6 |
1975 |
147,6 |
1982 |
239,7 |
1976 |
202,9 |
1983 |
221,9 |
Решение:
Пусть имеются условные данные об уровне среднегодовых ценах на мировых рынках на шерсть за 14 лет. Добавим в таблицу Yt-1; Yt-2 и т.д.
t |
Yt |
Yt-1 |
Yt-2 |
Yt-3 |
Yt-4 |
Yt-5 |
Yt-6 |
Yt-7 |
1/t |
ŷt линен. |
ŷt гипербола |
1 |
73,8 |
- |
- |
- |
- |
- |
- |
- |
1 |
113,7 |
113,7 |
2 |
72,6 |
73,8 |
- |
- |
- |
- |
- |
- |
0,5 |
128,2 |
106,45 |
3 |
106,9 |
72,6 |
73,8 |
- |
- |
- |
- |
- |
0,333333 |
142,7 |
104,033333 |
4 |
237,5 |
106,9 |
72,6 |
73,8 |
- |
- |
- |
- |
0,25 |
157,2 |
102,825 |
5 |
214,7 |
237,5 |
106,9 |
72,6 |
73,8 |
- |
- |
- |
0,2 |
171,7 |
102,1 |
6 |
147,6 |
214,7 |
237,5 |
106,9 |
72,6 |
73,8 |
- |
- |
0,166667 |
186,2 |
101,616667 |
7 |
202,9 |
147,6 |
214,7 |
237,5 |
106,9 |
72,6 |
73,8 |
- |
0,142857 |
200,7 |
101,271429 |
8 |
256,4 |
202,9 |
147,6 |
214,7 |
237,5 |
106,9 |
72,6 |
73,8 |
0,125 |
215,2 |
101,0125 |
9 |
249,6 |
256,4 |
202,9 |
147,6 |
214,7 |
237,5 |
106,9 |
72,6 |
0,111111 |
229,7 |
100,811111 |
10 |
300,4 |
249,6 |
256,4 |
202,9 |
147,6 |
214,7 |
237,5 |
106,9 |
0,1 |
244,2 |
100,65 |
11 |
316,7 |
300,4 |
249,6 |
256,4 |
202,9 |
147,6 |
214,7 |
237,5 |
0,090909 |
258,7 |
100,518182 |
12 |
274,6 |
316,7 |
300,4 |
249,6 |
256,4 |
202,9 |
147,6 |
214,7 |
0,083333 |
273,2 |
100,408333 |
13 |
239,7 |
274,6 |
316,7 |
300,4 |
249,6 |
256,4 |
202,9 |
147,6 |
0,076923 |
287,7 |
100,315385 |
14 |
221,9 |
239,7 |
274,6 |
316,7 |
300,4 |
249,6 |
256,4 |
202,9 |
0,071429 |
302,2 |
100,235714 |
итого |
2915,3 |
2693,4 |
2453,7 |
2179,1 |
1862,4 |
1562,0 |
1312,4 |
1056,0 |
|||
среднее значение |
208,2 |
207,2 |
204,5 |
198,1 |
186,2 |
173,6 |
164,1 |
150,9 |
Следует заметить, что среднее значение y t-1 получается путем деления не на 14, а на 13, т.к. у нас теперь на одно наблюдение меньше и т. д.
Нанесем значение Yt на график:
Среднегодовые цены на мировых рынках на шерсть за 14 лет.
Где, t – время, лет;
Yt – среднегодовые цены.
Определяем коэффициент автокорреляции первого порядка Y t-1 и воспользуемся формулой расчета линейного коэффициента корреляции:
Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда t и y t-1.
Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями yt и yt-2 и определяется по формуле:
Мы воспользуемся расчетами Excel (аргументы функции, коррел, массив1, массив2.) зависимость между соседними уровнями ряда t и y t-1, t и y t-2 и т.д. Все полученные значения заносим в сводную таблицу:
Лаг |
Коэффициент автокорреляции уровней |
Коррелограмма |
1 |
0,771065885 |
******** |
2 |
0,439553649 |
**** |
3 |
0,361285713 |
**** |
4 |
0,464038703 |
***** |
5 |
0,411142373 |
**** |
6 |
0,372870292 |
**** |
7 |
0,233406005 |
** |
Анализ коррелограммы и графика исходных уровней временного ряда позволяет сделать вывод, что наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию, сезонности нет, есть только тренд. Для моделирования тенденции временного ряда, мы вычислим параметры линейного уравнения регрессии с помощью Excel, инструмента анализа данных Регрессия. (где y =Yt: x =t) |
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,76949101 |
|||||||
R-квадрат |
0,592116414 |
|||||||
Нормированный R-квадрат |
0,558126115 |
|||||||
Стандартная ошибка |
52,53995047 |
|||||||
Наблюдения |
14 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
48087,4154 |
48087,4154 |
17,4201591 |
0,001290799 |
|||
Остаток |
12 |
33125,35675 |
2760,446396 |
|||||
Итого |
13 |
81212,77214 |
||||||
решение |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
99,1956044 |
29,65978249 |
3,34444814 |
0,005839829 |
34,57248985 |
163,8187189 |
34,57248985 |
163,8187189 |
Переменная X 1 |
14,53868132 |
3,483364797 |
4,17374641 |
0,001290799 |
6,949081417 |
22,12828122 |
6,949081417 |
22,12828122 |
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов мы рассмотрим два вида функции:
Линейный тренд:
Применительно к данному временному ряду можно сказать, что темпы роста среднегодовых цен на мировых рынках на шерсть из Новой Зеландии, за 14 лет, с 1970 по 1983г.г. изменились от уровня 99,2% со средним за год абсолютным приростом, равным 14,5 проц. пункта.
Подставляя в это уравнение значения t=1, 2….14, найдем уровни t для каждого момента времени, т.е. ŷ лин1 = 99,2+14,5·1 = 113,7; ŷ лин2 = 99,2+14,5·2 = 128,2; и т.д. (рассчитываем в Excel и подставляем данные в таблицу, в колонку ŷ линt)
Гипербола:
Подставляя в это уравнение значения t=1, 2….14, найдем уровни t для каждого момента времени т.е. ŷ гипер1 = 99,2+14,5/1 = 113,7; ŷ гипер2 = 99,2+14,5/2 = 106,45; и т.д. (рассчитываем в Excel и подставляем данные в таблицу, в колонку ŷ гиперt)
R2 = 0,60
R2нормированный = 0,56
Построим график временного ряда:
Где, t – время, лет;
Yt – фактические уровни ряда;
ŷ линt – уровни ряда, рассчитанные по линейному тренду;
ŷ гиперt – уровни ряда, рассчитанные по киперболическому тренду;
На рисунке наглядно видно наличие возрастающей тенденции. Возможно существование линейного тренда.
Задание: 36
По двадцати предприятиям отрасли была получена следующая матрица парных коэффициентов корреляции показателей: у – объем выпуска продукции (млн.руб.), х1 – численность занятых на предприятии, х2 – среднегодовая стоимость основных фондов.
у |
х1 |
х2 | |
у |
1 |
||
х1 |
0,7 |
1 |
|
х2 |
0,9 |
0,5 |
1 |
Определить частные коэффициенты корреляции результата с каждым из факторов. Прокомментируйте различие полученных парных и частных коэффициентов корреляции.