Автор работы: Пользователь скрыл имя, 30 Мая 2013 в 11:38, контрольная работа
Рассчитать линейный коэффициент парной корреляции, оценить его статистическую значимость и построить для него доверительный интервал с уровнем значимости α = 0,05. Сделать выводы.
Построить линейное уравнение парной регрессии y на x и оценить статистическую значимость параметров регрессии. Сделать рисунок.
Оценить качество уравнения регрессии при помощи коэффициента детерминации. Сделать выводы. Проверить качество уравнения регрессии при помощи F критерия Фишера.
Выполнить прогноз прибыли y при прогнозном значении x, составляющем 113% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал для уровня значимости α = 0,05. Сделать выводы.
Эконометрика для СибГАУ
Вариант 3
Контрольная работа
Содержание работы
Имеются данные за 10 лет по прибылям x и y (в %), получаемому домохозяйством ежемесячно в течение года.
Таблица 1
Исходные данные
Годы |
Х |
y |
1 |
10,2 |
20,1 |
2 |
15,8 |
18 |
3 |
12,5 |
10,3 |
4 |
10,3 |
12,5 |
5 |
5,7 |
6 |
6 |
-5,8 |
-6,8 |
7 |
-3,5 |
-2,8 |
8 |
5,2 |
3 |
9 |
7,3 |
8,5 |
10 |
6,7 |
8 |
Задания:
Решение:
1. Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:
где , - выборочные дисперсии переменных х и y, - ковариация признаков. Соответствующие средние величины определяются по формулам:
С целью расчета коэффициента корреляции построим следующую расчетную таблицу:
Таблица 2
Расчетная таблица коэффициента корреляции
№ |
x |
y |
xy |
x2 |
y2 |
y(xi) |
(yi-y(xi))2 |
1 |
10,2 |
20,1 |
205,02 |
104,04 |
404,01 |
12,017 |
65,335 |
2 |
15,8 |
18 |
284,4 |
249,64 |
324 |
18,476 |
0,227 |
3 |
12,5 |
10,3 |
128,75 |
156,25 |
106,09 |
14,670 |
19,097 |
4 |
10,3 |
12,5 |
128,75 |
106,09 |
156,25 |
12,132 |
0,135 |
5 |
5,7 |
6 |
34,2 |
32,49 |
36 |
6,826 |
0,683 |
6 |
-5,8 |
-6,8 |
39,44 |
33,64 |
46,24 |
-6,438 |
0,131 |
7 |
-3,5 |
-2,8 |
9,8 |
12,25 |
7,84 |
-3,785 |
0,971 |
8 |
5,2 |
3 |
15,6 |
27,04 |
9 |
6,250 |
10,561 |
9 |
7,3 |
8,5 |
62,05 |
53,29 |
72,25 |
8,672 |
0,030 |
10 |
6,7 |
8 |
53,6 |
44,89 |
64 |
7,980 |
0,000 |
Итого |
64,4 |
76,8 |
961,61 |
819,62 |
1225,68 |
76,800 |
97,169 |
Среднее |
6,44 |
7,68 |
96,161 |
81,962 |
122,568 |
7,680 |
9,717 |
Непосредственный расчет
характеристик показателей
Таблица 3
Статистические характеристики
изучаемых показателей и
Показатель |
Значение |
Среднее по х |
6,4400 |
Среднее по y |
7,6800 |
Выборочная дисперсия S2x |
40,4884 |
Выборочная дисперсия S2y |
63,5856 |
Выборочное СКО Sx |
6,3630 |
Выборочное СКО Sy |
7,9741 |
Модифицированное выборочное СКО S*x |
6,7072 |
Модифицированное выборочное СКО S*y |
8,4054 |
Ковариация cov(x,y) |
46,7018 |
Корреляция rxy |
0,9204 |
Модифицированные выборочные СКО S*x, S*y рассчитываются по формулам:
Таким образом, между объемом продаж (y) и расходами на рекламу (x) существует слабая (|r|<0,3) отрицательная корреляционная зависимость.
Для оценки статистической значимости коэффициента корреляции рассчитаем t-критерий Стьюдента:
который имеет распределение Стьюдента с k=n-2=8 степенями свободы и уровнем значимости α=0,05. Критическое значение Tкритич = T(k=8, α=0,05) = 2,31.
Поскольку условие Tнабл > Tкритич выполняется, то коэффициент корреляции значим.
Для значимого коэффициента можно
построить доверительный
Распределение z уже при небольших n является приближенным нормальным распределением с математическим ожиданием
и дисперсией
Поэтому вначале строят доверительный интервал для M[z], а затем делают обратное z-преобразование.
Применяя z-преобразование для найденного коэффициента корреляции, получим:
z = arth(0,9204) = 1,5918.
Доверительный интервал для M[z] будет иметь вид:
где tγ находится с помощью функции Лапласа Ф(tγ) = γ/2. Для γ = 1- α=0,95 имеем tγ = 1,96. Тогда: 0,8510 ≤ M[z] ≤ 2,3326.
Обратное z-преобразование осуществляется по формуле
В результате находим
0,6916 ≤ ρ ≤ 0,9204.
Следовательно, в указанных границах на уровне значимости 0,05 (с надежностью 0,95) заключен генеральный коэффициент корреляции ρ.
2. Таким образом, между переменными x и y имеет место существенная линейная корреляционная зависимость, то есть:
y = β0 + β1 x + ε
где y – зависимая переменная (результативный признак), x – независимая (объясняющая) переменная, ε – случайные отклонения, β0, β1 – параметры регрессии. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
где b0, b1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (МНК). Применение данного метода к оценке указанных параметров приводит к следующим формулам:
Результат расчета коэффициентов
эмпирического уравнения
Эмпирическое уравнение регрессии
Параметр b1 называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. В рассматриваемом случае, с увеличением x на 1 ед. y возрастает в среднем на 1,1535 млн. руб.
На рисунке 1 построено корреляционное поле и эмпирическая линия регрессии.
Рис. 1. Корреляционное поле и эмпирическая линия регрессии.
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки статистической значимости каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии
Значимость коэффициента регрессии устанавливается с помощью t-критерия Стьюдента:
где Sbi – стандартная ошибка коэффициента регрессии.
Для коэффициентов b0, b1 эмпирической линии регрессии оценку дисперсии можно получить по формулам:
Тогда: = 0,1605, = 6,6596.
Критическое значение критерия было уже найдено Tкритич = 2,31. Поскольку условия < Tкритич, > Tкритич, то коэффициент b1 значимо отличается от нуля, а коэффициент b0 - нет. Следовательно, для коэффициента b1 – можно построить доверительный интервал, а для коэффициента b0 - нельзя.
Несмотря на сказанное выше, все же построим доверительные интервалы для обоих коэффициентов, учитывая условность интервала для коэффициента b0. Определим предельные ошибки для каждого показателя:
где t = Tкритич = 2,31. В рассматриваемом случае:
В результате, получаем следующие доверительные интервалы для коэффициентов регрессии:
b0 = 0,2517±3,62; b1 = 1,1535±0,3994
3. Оценку качества построенной модели дает коэффициент детерминации.
Коэффициент детерминации для линейной модели равен квадрату коэффициента
Это означает, что 84,72% вариации признака y объясняется вариацией признака-фактора x.
Значимость уравнения
регрессии проверяется при
F подчиняется распределению Фишера с уровнем значимости α и степенями свободы k1 = 1, k2 = n-2=8.
Поскольку критическое значение критерия равно Fкритич = F(α=0,05; k1=1; k2=8) = 5,32 и условие F> Fкритич выполняется, то статистическая признается значимость построенного уравнения регрессии.
4. Полученные оценки
уравнения регрессии позволяют
использовать его для прогноза.
В рассматриваемом случае
Средняя ошибка прогноза вычисляется по формуле (xp = ):
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза
Задача 2. Модель парной нелинейной регрессии
По территориям Волго-Вятского Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1997 г.
Таблица 1
Исходные данные
№ |
Средняя заработная плата и выплаты социального характера, тыс. руб., x |
Потребительские расходы на душу населения, тыс.руб., y |
Респ. Марий Эл |
554 |
302 |
Респ. Мордовия |
560 |
360 |
Чувашская респ. |
545 |
310 |
Кировская обл. |
672 |
415 |
Нижегородская обл. |
796 |
452 |
Белгородская обл. |
777 |
502 |
Воронежская обл. |
632 |
355 |
Курская обл. |
688 |
416 |
Липецкая обл. |
830 |
501 |
Тамбовская обл. |
577 |
403 |
Респ. Татарстан |
949 |
462 |
Пензенская обл. |
562 |
342 |