Автор работы: Пользователь скрыл имя, 09 Октября 2012 в 23:55, реферат
Актуальность выбранной темы определяется тем, что в эконометрике широко используются методы статистики. Во многих практических задачах прогнозирования, изучая различного рода связи в экономических, производственных системах, необходимо на основании экспериментальных данных выразить зависимую переменную в виде некоторой математической функции от независимых переменных – регрессоров, то есть построить регрессионную модель.
Глава 1. Теоретические и методологические основы применения регрессионного анализа в эконометрике
Основные положения регрессионного анализа………………………….5
Оценка параметров парной регрессионной модели…………………….8
Интервальная оценка функции регрессии и ее параметров…………...15
Оценка значимости уравнения регрессии и особенности
применения коэффициента детерминации………………….…………16
Выводы……………………………………………………………………………...20
Глава 2. Практическое применение регрессионного анализа в эконометрике
Задача 1…………………………………………………………………...22
Задача 2…………………………………………………………………...23
Выводы……………………………………………………………………………...26
Заключение………………………………………………………………………….27
Библиографический список………………………………………………………..29
После того как найдено
уравнение линейной регрессии, проводится
оценка значимости как уравнения в
целом, так и отдельных его параметров13.
Оценка значимости уравнения регрессии
в целом дается с помощью F-критерия Фишера.
При этом выдвигается нулевая гипотеза,
коэффициент регрессии равен нулю, то
есть b=0, и, следовательно, фактор х не оказывает
влияния на результат у. Непосредственному
расчету F-критерия предшествует анализ
дисперсии. Центральное место в нем занимает
разложение общей суммы квадратов отклонений
переменной у от среднего значения у на
две части – «объясненную» и «необъясненную»
(приложение 2).
Общая сумма квадратов отклонений индивидуальных
значений результативного признака у
от среднего значения у вызвана влиянием
множества причин. Условно всю совокупность
причин можно разделить на две группы:
Если фактор не оказывает
влияния на результат, то линия регрессии
на графике параллельна оси охи
у = ŷ. Тогда вся дисперсия
Поскольку не все точки поля корреляции
лежат на линии регрессии, то всегда имеет
место их разброс как обусловленный влиянием
фактора х, то есть регрессией у по х, так
и вызванный действием прочих величин
(необъясненная вариация). Пригодность
линии регрессии для прогноза зависит
от того, какая часть общей вариации признака
у приходится на объясненную вариацию.
Очевидно, что если сумма квадратов отклонений,
обусловленная регрессией, будет больше
остаточной суммы квадратов, то уравнение
регрессии статистически значимо и фактор
х оказывает существенное влияние на результат
у. Это равносильно тому, что коэффициент
детерминации r2xy будет приближаться к единице.
Любая сумма квадратов отклонений связана
с числом степеней свободы (df – degrees of freedom),
то есть с числом свободы независимого
варьирования признака. Число степеней
свободы связано с числом единиц совокупности n и
с числом определяемых по ней констант.
Применительно к исследуемой проблеме
число степеней свободы должно показать,
сколько независимых отклонений из n возможных
[(y1-y), (y2-y),…,(yn-y)] требуется для образования
данной суммы квадратов. Так, для общей
суммы квадратов ∑(y-y)2 требуется (n-1) независимых отклонений.
При расчете объясненной или факторной
суммы квадратов ∑(ŷx -y)2 используются теоретические
(расчетные) значения результативного
признака ŷx, найденные по линии регрессии:
ŷx=а+b*x.
В линейной регрессии сумма квадратов
отклонений, обусловленных линейной регрессией,
составит: ∑(ŷx -y)2=b2*∑(x –x)2.
Поскольку при заданном объеме наблюдений
по х и у факторная сумма квадратов при
линейной регрессии зависит только от
одной константы коэффициента регрессии b,
то данная сумма квадратов имеет одну
степень свободы. К тому же выводу придем,
если рассмотрим содержательную сторону
расчетного значения признака у, то есть
ŷx. Величина ŷx определяется по уравнению
линейной регрессии: ŷx=а+b*x. Параметр а можно определить
как: a=y-b*x. Подставив выражение параметра
а в линейную модель получим:
ŷx= y-b*x+b*x= y-b*(х-х).
Отсюда видно, что при заданном наборе
переменных у и х расчетное значение ŷx является в линейной регрессии
функцией только одного параметра – коэффициента
регрессии. Соответственно и факторная
сумма квадратов отклонений имеет число
степеней свободы, равное 1.
Существует равенство между числом степеней
свободы общей, факторной и остаточной
суммами квадратов. Число степеней свободы
остаточной суммы квадратов при линейной
регрессии составляет n-2. Число степеней
свободы для общей суммы квадратов определяется
числом единиц, и поскольку используется
средняя вычисленная по данным выборки,
то теряем одну степень свободы, то есть dfобщ= n-1.
Итак, имеется два равенства:
∑(у-у)2=∑( ŷx –у)2+∑(у- ŷx)2,
n-1=1+(n-2).
Разделив каждую сумму квадратов на соответствующее
ей число степеней свободы, получим средний
квадрат отклонений, или, что то же самое,
дисперсию на одну степень свободы D.
Dобщ=∑(у-у)2/(n-1);
Dфакт=∑( ŷx –у)2/1;
Dост=∑(у- ŷx)2/(n-1).
Определение дисперсии на одну степень
свободы приводит дисперсии к сравнимому
виду. Сопоставляя факторную и остаточную
дисперсии в расчете на одну степень свободы,
получим величину F-отношения (F-критерия):
F= Dфакт/ Dост, где
F – критерий для проверки нулевой гипотезы
Н0: Dфакт=Dост.
Если нулевая гипотеза справедлива, то
факторная и остаточная дисперсии не отличаются
друг от друга. Для Н0 необходимо опровержение, чтобы
факторная дисперсия превышала остаточную
в несколько раз.
Английским статистиком Снедекором разработаны
таблицы критических значений F-отношений
при разных уровнях существенности нулевой
гипотезы и различимом числе степеней
свободы. Табличное значение F-критерия
– это максимальная величина отношения
дисперсий, которая может иметь место
при случайном их расхождении для данного
уровня вероятности наличия нулевой гипотезы.
Вычисленное значение F-отношения признается
достоверным (отличным от единицы), если
оно больше табличного. В этом случае нулевая
гипотеза об отсутствии связи признаков
отклоняется и делается вывод о существенности
этой связи: Fфакт>Fтабл. Н0 отклоняется.
Если же величина окажется меньше табличной Fфакт<Fтабл, то вероятность нулевой гипотезы
выше заданного уровня и она не может быть
отклонена без серьезного риска сделать
неправильный вывод о наличии связи. В
этом случае уравнение регрессии считается
статистически не значимым. Н0 не отклоняется.
Оценку качества модели дает коэффициент
детерминации. Коэффициент детерминации
(R2) — это квадрат множественного
коэффициента корреляции14. Он показывает, какая доля дисперсии результативного
признака объясняется влиянием независимых
переменных.
Формула для вычисления коэффициента
детерминации:
где
yi — выборочные данные, а fi — соответствующие им значения
модели.
Также это квадрат корреляции Пирсона между
двумя переменными. Он выражает количество
дисперсии, общей между двумя переменными.
Коэффициент принимает значения из интервала
[0;1]. Чем ближе значение к 1 тем ближе модель
к эмпирическим наблюдениям.
В случае парной линейной регрессионной
модели коэффициент детерминации равен
квадрату коэффициента корреляции, то
есть R2 = r2.
Иногда показателям тесноты связи можно
дать качественную оценку (шкала Чеддока)
(приложение 3).
Функциональная связь возникает при значении
равном 1, а отсутствие связи — 0. При значениях
показателей тесноты связи меньше 0,7 величина
коэффициента детерминации всегда будет
ниже 50 %. Это означает, что на долю вариации
факторных признаков приходится меньшая
часть по сравнению с остальными неучтенными
в модели факторами, влияющими на изменение
результативного показателя. Построенные
при таких условиях регрессионные модели
имеют низкое практическое значение.
Выводы
В настоящее время регрессионный анализ
используется как в естественнонаучных
исследованиях, так и в обществоведении.
Уравнение регрессии позволяет найти
значение зависимой переменной, если величина
независимой или независимых переменных
известна.
Практически, речь идет о том, чтобы, анализируя
множество точек на графике (т.е. множество
статистических данных), найти линию, по
возможности точно отражающую заключенную
в этом множестве закономерность (тренд,
тенденцию), линию регрессии.
Задачи регрессионного анализа лежат
в сфере установления формы зависимости,
определения функции регрессии, использования
уравнения для оценки неизвестных значений
зависимой переменной.
Решение задач основывается на анализе
соответствующих параметров (статистических
данных) в которых всегда неизбежно присутствуют
отклонения, вызванные случайными ошибками.
Поэтому существуют специальные методы
оценки как уравнения регрессии в целом,
так и отдельных ее параметров.
Глава 2. Практическое
применение регрессионного анализа в
эконометрике
Задача 1
По территории региона приводятся данные
за 2007 (табл. 2.1).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Построить линейное уравнение
парной регрессии у от х.
Решение: для расчета параметров уравнения
линейной регрессии строим расчетную
таблицу (табл. 2.2)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b=xy-y*x/∑x2-(x)2=(13484-85,6*
a=y-b*x=155,8-0,92*85,6=77,0
Получено уравнение регрессии: у=77,0+0,92*х.
С увеличением среднедушевого прожиточного
минимума на 1 рубль среднедневная заработная
плата возрастает в среднем на 0,92 рубля.
Задача 2
По семи территориям Уральского района
за 2008 г. Известны значения двух признаков
(табл. 2.3).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Определить:
А. линейной, ценить ее через F-критерий
Фишера.
Б. степенной
Решение:
1.А. Для расчета параметров а и b линейной
регрессии ŷx=а+b*x решаем систему нормальных
уравнений относительно а и b:
n*a+b∑x=∑y,
a∑x+b∑x2=∑y*x.
По исходным данным рассчитываем: ∑x, ∑y,
∑x2, ∑y*x, ∑y2. (Табл. 2.4)
b= yx-y*x/ σx2=(3166,05-57,89*54,
a=y-b*x=57,89+0,35*54,9=76,88.
Уравнение регрессии: ŷ=76,8-0,35*х
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С увеличением среднедневной
заработной платы на 1 рубль доля
расходов на покупку продовольственных
товаров снижается в среднем
на 0,35%-ных пункта.
Рассчитаем линейный коэффициент парной
корреляции:
rxy=b*σx /σy=-0,35*5,86/5,74=-
Связь умеренная, обратная.
Определим коэффициент детерминации:
r2xy=(-0,35)2=0,127.
Вариация результата на 12,7% объясняется
вариацией фактора х.
Рассчитаем F-критерий:
Fфакт= r2xy*(n-2)/(1- r2xy)=0,
Поскольку 1≤F≤∞, следует рассмотреть F-1.
Полученное значение указывает на необходимость
принять гипотезу Н0 о случайной природе выявленной
зависимости и статистической незначимости
параметров уравнения и показателя тесноты
связи.
1.Б. построению степенной модели ŷx=а*xb предшествует процедура линеаризации
переменных. В примере линеаризация производится
путем логарифмирования обеих частей
уравнения:
lg y=lg a + b*lg x;
Y = C + b*X, где
Y = lg y, X = lg x, С = lg a.
Для расчетов построим таблицу (табл. 2.5)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рассчитаем С и b:
b=(YX-Y*X)/ σ2X=3,0572-1,7605*
C=Y-b*X=1,7605+0,298*1,7370=2,
Получим линейное уравнение: Ŷ=2,278-0,298*Х.
Выполнив его потенцирование, получим:
ŷ=102,278*х-0,298=189,7* х-0,298.
Выводы
В практических исследованиях возникает
необходимость аппроксимировать (описать
приблизительно) зависимость между переменными
величинами у и х. Ее можно выразить аналитически
с помощью формул и уравнений и графически
в виде геометрического места точек в
системе прямоугольных координат. Для
выражения регрессии служат эмпирические
и теоретические ряды, их графики — линии
регрессии, а также корреляционные уравнения
(уравнения регрессии) и коэффициент линейной
регрессии.
Показатели регрессии выражают корреляционную
связь двусторонне, учитывая изменение
средней величины
признака у при изменении значений
xi признака х, и, наоборот, показывают
изменение средней величины
признака х по измененным значениям
yi признака у.
Форма связи между показателями может
быть разнообразной. И поэтому задача
состоит в том, чтобы любую форму корреляционной
связи выразить уравнением определенной
функции (линейной, параболической и т.д.),
что позволяет получать нужную информацию
о корреляции между переменными величинами
у и х, предвидеть возможные изменения
признака у на основе известных изменений
х, связанного с у корреляционно.
Заключение
В настоящее время регрессионный анализ
используется как в естественнонаучных
исследованиях, так и в обществоведении.
В практических исследованиях возникает
необходимость аппроксимировать (описать
приблизительно) зависимость между переменными
величинами у и х. Ее можно выразить аналитически
с помощью формул и уравнений и графически
в виде геометрического места точек в
системе прямоугольных координат. Для
выражения регрессии служат эмпирические
и теоретические ряды, их графики — линии
регрессии, а также корреляционные уравнения
(уравнения регрессии) и коэффициент линейной
регрессии.
Показатели регрессии выражают корреляционную
связь двусторонне, учитывая изменение
средней величины
признака у при изменении значений
xi признака х, и, наоборот, показывают
изменение средней величины
признака х по измененным значениям
yi признака у.
Форма связи между показателями может
быть разнообразной. И поэтому задача
состоит в том, чтобы любую форму корреляционной
связи выразить уравнением определенной
функции (линейной, параболической и т.д.),
что позволяет получать нужную информацию
о корреляции между переменными величинами
у и х, предвидеть возможные изменения
признака у на основе известных изменений
х, связанного с у корреляционно.
Уравнение регрессии позволяет найти
значение зависимой переменной, если величина
независимой или независимых переменных
известна.
Практически, речь идет о том, чтобы, анализируя
множество точек на графике (т.е. множество
статистических данных), найти линию, по
возможности точно отражающую заключенную
в этом множестве закономерность (тренд,
тенденцию), линию регрессии.
Задачи регрессионного анализа лежат
в сфере установления формы зависимости,
определения функции регрессии, использования
уравнения для оценки неизвестных значений
зависимой переменной.
Решение задач основывается на анализе
соответствующих параметров (статистических
данных) в которых всегда неизбежно присутствуют
отклонения, вызванные случайными ошибками.
Поэтому существуют специальные методы
оценки как уравнения регрессии в целом,
так и отдельных ее параметров.
Построение линейной регрессии сводится
к оценке ее параметров – a и b. Оценки параметров
линейной регрессии могут быть найдены
разными методами. Классический подход
к оцениванию параметров линейной регрессии
основан на методе наименьших квадратов
В прогнозных расчетах по уравнению регрессии
путем подстановки в него соответствующего
значения х определяется предсказываемое
значение. Однако точечный прогноз явно
не реален. Поэтому он дополняется расчетом
стандартной ошибки ŷx, то есть mŷx, и соответственно интервальной
оценкой прогнозного значения (у*).
После того как найдено уравнение линейной
регрессии, проводится оценка значимости
как уравнения в целом, так и отдельных
его параметров. Оценка значимости уравнения
регрессии в целом дается с помощью F-критерия
Фишера.
Библиографический
список