Автор работы: Пользователь скрыл имя, 03 Мая 2014 в 23:52, контрольная работа
Задача 1. По территориям региона приводятся данные за 199X г. ( , )
Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб.,
Среднедневная заработная плата, руб.,
1 85 142
2 89 148
3 87 142
4 79 154
5 89 164
6 113 195
7 67 139
8 98 167
9 82 152
10 87 162
11 86 155
12 117 173
Требуется:
1. Построить линейное уравнение парной регрессии по .
2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6. На одном графике отложить исходные данные и теоретическую прямую.
7. Проверить вычисления в MS Excel.
Требуется:
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
№ |
|||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
7 |
4,3 |
11 |
30,1 |
77 |
47,3 |
18,49 |
121 |
49 |
2 |
7 |
3,9 |
13 |
27,3 |
91 |
50,7 |
15,21 |
169 |
49 |
3 |
7 |
3,7 |
15 |
25,9 |
105 |
55,5 |
13,69 |
225 |
49 |
4 |
7 |
4,0 |
17 |
28,0 |
119 |
68,0 |
16,00 |
289 |
49 |
5 |
7 |
4,5 |
18 |
31,5 |
126 |
81,0 |
20,25 |
324 |
49 |
6 |
7 |
4,8 |
19 |
33,6 |
133 |
91,2 |
23,04 |
361 |
49 |
7 |
8 |
5,4 |
19 |
43,2 |
152 |
102,6 |
29,16 |
361 |
64 |
8 |
8 |
4,4 |
20 |
35,2 |
160 |
88,0 |
19,36 |
400 |
64 |
9 |
8 |
4,9 |
20 |
39,2 |
160 |
98,0 |
24,01 |
400 |
64 |
10 |
10 |
6,8 |
21 |
68,0 |
210 |
142,8 |
46,24 |
441 |
100 |
11 |
9 |
6,9 |
21 |
62,1 |
189 |
144,9 |
47,61 |
441 |
81 |
12 |
11 |
6,4 |
22 |
70,4 |
242 |
140,8 |
40,96 |
484 |
121 |
13 |
9 |
6,8 |
22 |
61,2 |
198 |
149,6 |
46,24 |
484 |
81 |
14 |
11 |
7,2 |
25 |
79,2 |
275 |
180,0 |
51,84 |
625 |
121 |
15 |
12 |
7,1 |
28 |
85,2 |
336 |
198,8 |
50,41 |
784 |
144 |
16 |
12 |
8,2 |
29 |
98,4 |
348 |
237,8 |
67,24 |
841 |
144 |
17 |
12 |
8,1 |
30 |
97,2 |
360 |
243,0 |
65,61 |
900 |
144 |
18 |
12 |
8,5 |
31 |
102,0 |
372 |
263,5 |
72,25 |
961 |
144 |
19 |
14 |
9,6 |
32 |
134,4 |
448 |
307,2 |
92,16 |
1024 |
196 |
20 |
14 |
9,9 |
36 |
138,6 |
504 |
356,4 |
98,01 |
1296 |
196 |
Сумма |
192 |
125,4 |
449 |
1290,7 |
4605 |
3047,1 |
857,78 |
10931 |
1958 |
Ср. знач. |
9,6 |
6,27 |
22,45 |
64,535 |
230,25 |
152,36 |
42,889 |
546,55 |
97,9 |
Найдем средние квадратические отклонения признаков:
;
;
.
1. Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить систему линейных уравнений относительно неизвестных параметров , ,
либо воспользоваться готовыми формулами
;
;
.
Рассчитаем сначала парные коэффициенты корреляции:
;
;
.
Находим коэффициенты чистой регрессии и параметр :
;
;
.
Таким образом, получили следующее уравнение множественной регрессии:
.
Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 0,8 тыс. руб., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,128 тыс. руб.
После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.
№ |
|||||||
1 |
7 |
4,3 |
11 |
6,558 |
0,442 |
0,195 |
6,314 |
2 |
7 |
3,9 |
13 |
6,494 |
0,506 |
0,256 |
7,229 |
3 |
7 |
3,7 |
15 |
6,590 |
0,410 |
0,168 |
5,857 |
4 |
7 |
4,0 |
17 |
7,086 |
-0,086 |
0,007 |
1,229 |
5 |
7 |
4,5 |
18 |
7,614 |
-0,614 |
0,377 |
8,771 |
6 |
7 |
4,8 |
19 |
7,982 |
-0,982 |
0,964 |
14,029 |
7 |
8 |
5,4 |
19 |
8,462 |
-0,462 |
0,213 |
5,775 |
8 |
8 |
4,4 |
20 |
7,790 |
0,210 |
0,044 |
2,625 |
9 |
8 |
4,9 |
20 |
8,190 |
-0,190 |
0,036 |
2,375 |
10 |
10 |
6,8 |
21 |
9,838 |
0,162 |
0,026 |
1,620 |
11 |
9 |
6,9 |
21 |
9,918 |
-0,918 |
0,843 |
10,200 |
12 |
11 |
6,4 |
22 |
9,646 |
1,354 |
1,833 |
12,309 |
13 |
9 |
6,8 |
22 |
9,966 |
-0,966 |
0,933 |
10,733 |
14 |
11 |
7,2 |
25 |
10,670 |
0,330 |
0,109 |
3,000 |
15 |
12 |
7,1 |
28 |
10,974 |
1,026 |
1,053 |
8,550 |
16 |
12 |
8,2 |
29 |
11,982 |
0,018 |
0,000 |
0,150 |
17 |
12 |
8,1 |
30 |
12,030 |
-0,030 |
0,001 |
0,250 |
18 |
12 |
8,5 |
31 |
12,478 |
-0,478 |
0,228 |
3,983 |
19 |
14 |
9,6 |
32 |
13,486 |
0,514 |
0,264 |
3,671 |
20 |
14 |
9,9 |
36 |
14,238 |
-0,238 |
0,057 |
1,700 |
Сумма |
192 |
125,4 |
449 |
191,992 |
0,008 |
7,609 |
110,371 |
Ср. знач. |
9,6 |
6,27 |
22,45 |
9,600 |
– |
0,380 |
5,519 |
Остаточная дисперсия:
.
Средняя ошибка аппроксимации:
.
Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициенты и стандартизованного уравнения регрессии :
;
.
Т.е. уравнение будет выглядеть следующим образом:
.
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
; .
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,523% или 0,299% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
; ; .
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
;
.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Коэффициент множественной корреляции определить через матрицы парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
Находим:
.
Коэффициент множественной корреляции:
.
Аналогичный результат получим при использовании других формул:
;
;
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.
3. Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
.
Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. Оценим статистическую значимость параметров чистой регрессии с помощью -критерия Стьюдента. Рассчитаем стандартные ошибки коэффициентов регрессии:
;
.
Фактические значения -критерия Стьюдента:
, .
Табличное значение критерия при уровне значимости и числе степеней свободы составит . Таким образом, признается статистическая значимость параметра и незначимость параметра .
Доверительные интервалы для параметров чистой регрессии:
,
и
, .
6. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул (3.16):
; .
Найдем и :
;
.
Имеем:
;
.
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, существенным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .
7. Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:
.
Найдем его параметры:
;
.
Таким образом,
, .
8. Проверим вычисления в MS Excel.
Найдем
матрицу парных коэффициентов корреляции
(Сервис→Анализ данных→
.
С помощью
инструмента Регрессия (Сервис→Анализ данных→
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,966294 |
|||||||
R-квадрат |
0,933724 |
|||||||
Нормированный R-квадрат |
0,925927 |
|||||||
Стандартная ошибка |
0,668998 |
|||||||
Наблюдения |
20 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
2 |
107,1915 |
53,59576 |
119,7516 |
9,58E-11 |
|||
Остаток |
17 |
7,608481 |
0,447558 |
|||||
Итого |
19 |
114,8 |
||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
1,707175 |
0,537318 |
3,177218 |
0,005511 |
0,573534 |
2,840816 |
0,573534 |
2,840816 |
x1 |
0,78961 |
0,231638 |
3,40881 |
0,003343 |
0,300897 |
1,278324 |
0,300897 |
1,278324 |
x2 |
0,131045 |
0,067155 |
1,951388 |
0,067688 |
-0,01064 |
0,27273 |
-0,01064 |
0,27273 |
Информация о работе Контрольная работа по дисциплине "Эконометрика"