Автор работы: Пользователь скрыл имя, 23 Сентября 2013 в 19:09, контрольная работа
Построить линейное уравнение парной регрессии от .
Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике построить исходные данные и теоретическую прямую.
.
Вариант 2
D.1. Парная регрессия и корреляция
По территориям региона приводятся данные за 199X г.
Таблица D.1
Номер региона |
Среднедушевой прожиточный минимум
в день одного трудоспособного, руб., |
Среднедневная заработная плата, руб., |
1 |
74 |
122 |
2 |
81 |
134 |
3 |
90 |
136 |
4 |
79 |
125 |
5 |
89 |
120 |
6 |
87 |
127 |
7 |
77 |
125 |
8 |
93 |
148 |
9 |
70 |
122 |
10 |
93 |
157 |
11 |
87 |
144 |
12 |
121 |
165 |
Требуется:
Решение
Таблица D.2
;
.
Получено уравнение регрессии: .
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,95 руб.
; .
Это означает, что 70% вариации заработной платы ( ) объясняется вариацией фактора – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации:
.
Качество построенной модели оценивается как хорошее, так как не превышает 8-10%.
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы и составляет . Так как , то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии проведем с помощью -статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Табличное значение -критерия для числа степеней свободы и составит .
Определим случайные ошибки , , :
;
.
Тогда
;
.
Фактические значения -статистики превосходят табличное значение:
поэтому параметры , и не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии и . Для этого определим предельную ошибку для каждого показателя:
;
.
Доверительные интервалы
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
.
Предельная ошибка прогноза, которая в случаев не будет превышена, составит:
.
Доверительный интервал прогноза:
руб.;
руб.
Выполненный прогноз среднемесячной заработной платы является надежным ( ) и находится в пределах от 120,37 руб. до 161,99 руб.
Рис. D.1.
D.2. Множественная регрессия и корреляция
По предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов ( от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих ( ).
Номер предприятия |
Номер предприятия |
||||||
1 |
6 |
3,5 |
10 |
11 |
10 |
6,3 |
21 |
2 |
6 |
3,6 |
12 |
12 |
11 |
6,4 |
22 |
3 |
7 |
3,9 |
15 |
13 |
11 |
7 |
23 |
4 |
7 |
4,1 |
17 |
14 |
12 |
7,5 |
25 |
5 |
7 |
4,2 |
18 |
15 |
12 |
7,9 |
28 |
6 |
8 |
4,5 |
19 |
16 |
13 |
8,2 |
30 |
7 |
8 |
5,3 |
19 |
17 |
13 |
8,4 |
31 |
8 |
9 |
5,3 |
20 |
18 |
14 |
8,6 |
31 |
9 |
9 |
5,6 |
20 |
19 |
14 |
9,5 |
35 |
10 |
10 |
6 |
21 |
20 |
15 |
10 |
36 |
Требуется:
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
Найдем средние квадратические отклонения признаков:
;
;
.
Для нахождения параметров линейного
уравнения множественной
необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :
либо воспользоваться готовыми формулами:
; ;
.
Рассчитаем сначала парные коэффициенты корреляции:
;
;
.
Находим
;
;
.
Таким образом, получили следующее
уравнение множественной
.
Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:
;
.
Т.е.
уравнение будет выглядеть
.
Так
как стандартизованные
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
; .
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,83% или 0,035% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
; ; .
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
;
.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
;
.
Коэффициент множественной корреляции
.
Аналогичный
результат получим при
;
;
.
Коэффициент множественной корреляции показывает на весьма сильную связь всего набора факторов с результатом.