Автор работы: Пользователь скрыл имя, 09 Октября 2012 в 23:55, реферат
Актуальность выбранной темы определяется тем, что в эконометрике широко используются методы статистики. Во многих практических задачах прогнозирования, изучая различного рода связи в экономических, производственных системах, необходимо на основании экспериментальных данных выразить зависимую переменную в виде некоторой математической функции от независимых переменных – регрессоров, то есть построить регрессионную модель.
Глава 1. Теоретические и методологические основы применения регрессионного анализа в эконометрике
Основные положения регрессионного анализа………………………….5
Оценка параметров парной регрессионной модели…………………….8
Интервальная оценка функции регрессии и ее параметров…………...15
Оценка значимости уравнения регрессии и особенности
применения коэффициента детерминации………………….…………16
Выводы……………………………………………………………………………...20
Глава 2. Практическое применение регрессионного анализа в эконометрике
Задача 1…………………………………………………………………...22
Задача 2…………………………………………………………………...23
Выводы……………………………………………………………………………...26
Заключение………………………………………………………………………….27
Библиографический список………………………………………………………..29
Оглавление
Введение…………………………………………………………
применения коэффициента
детерминации………………….…………16
Выводы………………………………………………………………
Выводы………………………………………………………………
Заключение……………………………………………………
Библиографический список………………………………………………………..
Приложение
Введение
Актуальность выбранной темы определяется
тем, что в эконометрике широко используются
методы статистики. Во многих практических
задачах прогнозирования, изучая различного
рода связи в экономических, производственных
системах, необходимо на основании экспериментальных
данных выразить зависимую переменную
в виде некоторой математической функции
от независимых переменных – регрессоров,
то есть построить регрессионную модель.
Регрессионный анализ позволяет:
Целью курсовой работы явилось
исследование регрессионного анализа
и применение его в эконометрике.
Для достижения поставленной цели были
решены следующие задачи:
Предметом исследования явились
математико-статистические методы в
экономических исследованиях.
Объект исследования курсовой работы
– практическая задача по применению
регрессионного анализа в эконометрике.
Информационную базу составили труды
отечественных ученых-экономистов в области
эконометрических исследований, публикации,
Интернет источники и личные наблюдения
автора.
Для написания курсовой работы использовались
методы статистической обработки информации,
методы аналитических процедур и возможности
математических расчетов для обоснования
экономических исследований.
Ставя цель дать количественное
описание взаимосвязи между
Регрессия [regression] — это зависимость среднего
значения какой-либо случайной величины от
некоторой другой величины или нескольких
величин1. Следовательно, при регрессионной
связи одному и тому же значению x величины X (в отличие от
функциональной связи) могут соответствовать
разные случайные значения величины Y. Распределение
этих значений называется условным распределением Y при данном X = x.
Уравнение, связывающее эти величины,
называется уравнением регрессии, а соответствующий
график — линией регрессии величины Y по X.
К задачам регрессионного анализа относятся2:
• установление формы зависимости между
переменными;
• оценка модельной функции (модельного
уравнения) регрессии;
• оценка неизвестных значений (прогноз
значений) зависимой переменной.
В регрессионном анализе рассматривается
односторонняя зависимость переменной
Y (ее еще называют функцией отклика, результативным
признаком, предсказываемой переменной)
от одной или нескольких независимых переменных
X (называемых также объясняющими или предсказывающими
переменными, факторными признаками).
В зависимости от количества факторов,
включенных в уравнение регрессии, принято
различать простую (парную) и множественную
регрессии.
Простая регрессия представляет собой
регрессию между двумя переменными y и x,
то есть модель вида:
y = ƒ(x), где:
y – зависимая переменная (результативный
признак);
x – независимая, или объясняющая, переменная
(признак-фактор).
Множественная регрессия соответственно
представляет собой регрессию результативного
признака с двумя и большим числом факторов,
то есть модель вида3:
y = ƒ(x1, x2, …, xk).
В данной работе рассмотрена модель парной
регрессии. Прежде всего из всего круга
факторов, влияющих на результативный
признак, необходимо выделить наиболее
существенно влияющие факторы. Парная
регрессия достаточна, если имеется доминирующий
фактор, который и используется объединяющей
переменной.
Уравнение простой регрессии характеризует
связь между двумя переменными, которая
проявляется как некоторая закономерность
лишь в среднем в целом по совокупности
наблюдений.
В уравнении регрессии корреляционная
по сути связь признаков представляется
в виде функциональной связи, выраженной
соответствующей математической функцией.
Практически в каждом отдельном случае
величина y складывается из двух слагаемых:
yj = ŷxj + εj, где:
yj – фактическое значение результативного
признака;
ŷxj – теоретическое значение результативного
признака, найденное исходя из соответствующей
математической функции y и x, то есть из
уравнения регрессии;
εj – случайная величина, характеризующая
отклонения реального значения результативного
признака от теоретического, найденного
по уравнению регрессии.
Случайная величина ε (возмущение) включает
влияние не учтенных в модели факторов,
случайных ошибок и особенностей измерения.
Ее присутствие в модели обусловлено тремя
источниками: спецификацией модели, выборочным
характером исходных данных, особенностями
измерения переменных.
От правильно выбранной спецификации
модели зависит величина случайных ошибок:
они тем меньше, чем в больше мере теоретические
значения результативного признака ŷx подходят у фактическим данным y.
В парной регрессии выбор вида математической
функции ŷx= ƒ(x) может быть осуществлен
тремя методами4: графическим, аналитическим
(исходя из теории изучаемой взаимосвязи),
экспериментальным.
При изучении зависимости между двумя
признаками графический метод подбора
вида уравнения регрессии достаточно
нагляден. Он основан на поле корреляции.
Основные типы кривых, используемые при
количественной оценке связей:
Если между экономическими
явлениями существуют нелинейные соотношения5, то они выражаются с помощью
соответствующих нелинейных функций:
например, равносторонней гиперболы y=a+b/x+ε,
параболы второй степени y=a+b*x+c*x2+ ε и другие.
Различают два класса нелинейных регрессий:
Линейная регрессия находит
широкое применение в эконометрике
в виде четкой экономической интерпретации
ее параметров.
Линейная регрессия сводится к нахождению
уравнения вида:
ŷx=a+b*x или y=a+b*x+ε.
Уравнение вида ŷx=a+b*x позволяет по заданным значениям
фактора x иметь теоретические значения
результативного признака, подставляя
в него фактические значения фактора x.
Построение линейной регрессии сводится
к оценке ее параметров – а и b6. Оценки параметров линейной
регрессии могут быть найдены разными
методами. Можно обратиться к полю корреляции
и, выбрав на графике две точки, провести
через них прямую линию. Далее по графику
можно определить значения параметров.
Параметр а определим как точку пересечения
линии регрессии с осью oy, а параметр b оценим,
исходя из угла наклона линии регрессии,
как dy/dx, где dy – приращение результата у,
а dx – приращение фактора х.
Классический подход к оцениванию параметров
линейной регрессии основан на методе
наименьших квадратов (МНК)7.
МНК позволяет получить такие оценки параметров
а и b, при которых сумма квадратов отклонений
фактических значений результативного
признака (у) от расчетных (теоретических)
ŷx минимальна: ∑(уi- ŷxi)2→min. Иными словами, из всего
множества линий линия регрессии на графике
выбирается так, чтобы сумма квадратов
расстояний по вертикали между точками
и этой линией была бы минимальной.
Чтобы найти минимум функции, надо вычислить
частные производные по каждому из параметров
а и b и приравнять их к нулю.
Обозначим ∑εi2 через S, тогда:
S=∑(уi- ŷxi)2=∑(y-a-b*x)2
dS/da=-2∑y+2*n*a+2*b∑x=0 (1.1)
dS/db=-2∑y*x+2 *a∑x +2*b∑x2=0
Преобразуя формулу (1.1), получим следующую
систему нормальных уравнений для оценки
параметров а и b:
n*a+b∑x=∑y
a ∑x+ b∑x2= ∑x*y (1.2)
Решая систему нормальных уравнений (1.2)
либо методом последовательного исключения
переменных, либо методом определителей,
найдем исходные оценки параметров а и b.
Можно воспользоваться следующими готовыми
формулами: a=y-b*x (1.3)
Формула (1.3) получена из первого уравнения
системы (1.2), если все его члены разделить
не n.
b=cov(x,y)/σx2, где
cov(x,y) – ковариация признаков;
σx2 – дисперсия признака х.
Ввиду того, что cov(x,y)=yx-y*x, а σx2=x2-x2, получим следующую формулу
расчета оценки параметра b:
b=yx-y*x/ x2-x2
Параметр b называется коэффициентом регрессии.
Его величина показывает среднее изменение
результата с изменением фактора на одну
единицу.
Формально а – значение у при х=0. Если
признак-фактор х не имеет и не может иметь
нулевого значения, то вышеуказанная трактовка
свободного члена а не имеет смысла. Параметр
а может не иметь экономического содержания.
Попытки экономически интерпретировать
параметр а могут привести к абсурду, особенно
при а<0.
Интерпретировать можно лишь знак при
параметре а. если а>0, то относительное
изменение результата происходит медленнее
фактора. Иными словами, вариация результата
меньше вариации фактора – коэффициент
вариации по фактору х выше коэффициента
вариации для результата у:Vx>Vy.
Нелинейная регрессия по включенным переменным
не представляет никакой сложности в оценке
ее параметров8. Она определяется, как и в линейной
регрессии, МНК, обо эти функции линейны
по параметрам. Так, в параболе второй
степени у=а0+а1*х+а2*х2+ε, заменяя переменные х=х1, х2=х2, получим двухфакторное уравнение
линейной регрессии: у=а0+а1*х1+а2*х2+ε, для оценки параметров которого
используется МНК.
Следовательно для полинома третьего
порядка у=а0+а1*х+а2*х2+а3*х3+ε, при замене х=х1,х2=х2, х3=х3 получим трехфакторную модель
линейной регрессии: у=а0+а1*х1+а2*х2+а3*х3+ε.
А для полинома k-го порядка у=а0+а1*х+а2*х2+…+аk*хk+ε получим модель множественной
регрессии с k объясняющими переменными:
у=а0+а1*х1+а2*х2+…+аk*хk+ε/
Следовательно, полином любого порядка
сводится к линейной регрессии с ее методами
оценивания параметров и проверки гипотез.
Как показывает опыт большинства исследователей,
среди нелинейной полиномиальной регрессии
чаще всего используется парабола второй
степени; в отдельных случаях – полином
третьего порядка. Ограничения в использовании
полиномов более высоких степеней связаны
с требованием однородности исследуемой
совокупности: чем выше порядок полинома,
тем больше изгибов имеет кривая и соответственно
менее однородна совокупность по результативному
признаку.
Парабола второй степени целесообразна
к применению, если для определенного
интервала значений фактора меняется
характер связи рассматриваемых признаков:
прямая связь меняется на обратную или
обратная на прямую. В этом случае определяется
значение фактора, при котором достигается
максимальное (минимальное) значение результативного
признака: приравнивается к нулю первая
производная параболы второй степени:
ŷx=a+b*x+c*х2, то есть b+2*c*x=0 и x=-b/2*c.
Если же исходные данные не обнаруживают
изменения направленности связи, то параметры
параболы второго порядка становятся
трудно интерпретируемыми, а форма связи
часто заменяется другими нелинейными
моделями.
Ввиду симметричности кривой парабола
второй степени далеко не всегда пригодна
в конкретных исследованиях. Чаще всего
исследователь имеет дело лишь с отдельными
сегментами параболы, а не с полной параболической
формой. Кроме того, параметры параболической
связи не всегда могут быть логически
истолкованы. Поэтому если график зависимости
не демонстрирует четко выраженной параболы
второго порядка (нет смены направленности
связи признаков), то она может быть заменена
другой нелинейной функцией, например
степенной.
Среди класса нелинейных функций, параметры
которых без особых затруднений оцениваются
МНК, следует назвать хорошо известную
в эконометрике равностороннюю гиперболу:
ŷx=a+b/x. Она может быть использована
не только для характеристики связи удельных
расходов сырья, топлива, материалов с
объемом выпускаемой продукции, времени
обращения товаров от величины товарооборота
на микроуровне, но и на макроуровне. Классическим
ее примером является кривая Филипса,
характеризующая нелинейное соотношение
между нормой безработицы х и процентом
прироста заработной платы у: y=a+b/x+ε.
Для равносторонней гиперболы вида y=a+b/x+ε,
заменив 1/х на z, получим линейное уравнение
регрессии y=a+b*z+ε, оценка параметров которого
может быть дана МНК. Система нормальных
уравнений составит:
∑у=n*a+b*∑1/x,
∑y/x=a*∑1/x+b*∑1/x2
При b>0 имеем обратную зависимость, которая
при х→∞ характеризуется нижней асимптотой,
то есть минимальным предельным значением
у, оценкой которого служит параметр а.
При b<0 имеем медленно повышающуюся функцию
с верхней асимптотой при х→∞, то есть
с максимальным предельным уровнем у,
оценку которого в уравнении ŷx=a+b/x дает параметр а.
Примером может служить взаимосвязь доли
расходов на товары длительного пользования
и общих сумм расходов (или доходов). Математическое
описание подобного рода взаимосвязей
получило название кривых Энгеля.
Уоркинг и Лизер для описания кривой Энгеля
использовали полулогарифмическую кривую
у=а+b*lnx+ε/
Заменив lnx на z, опять получим линейное уравнение: y=a+b*z+ε.
Данная функция, как и предыдущая, линейна
по параметрам и нелинейна по объясняющей
переменной х. оценка параметров а и b может
быть найдена МНК. Система нормальных
уравнений при этом окажется следующей:
∑у=n*a+b*∑lnx,
∑y*lnx=a*∑lnx+b*∑(lnx)2
Возможны и иные модели, нелинейные по
объясняющим переменным. Например, у=а+b*√x+ε.
Соответственно система нормальных уравнений
для оценки параметров составит:
∑у=n*a+b*∑√x,
∑y*√x=a*∑√x+b*∑x
Уравнение с квадратными корнями использовались
в исследованиях урожайности9, трудоемкости сельскохозяйственного
производства. В работе Н.Дрейнера и Г.Смита10 справедливо отмечено, что если
нет каких-либо теоретических обоснований
в использовании данного вида кривых,
то основная цель подобных преобразований
состоит в том, чтобы для преобразованных
переменных получить более простую модель
регрессии, чем для исходных данных.
Иначе обстоит дело с регрессией, нелинейной
по оцениваемым параметрам11. Данный класс нелинейных моделей
подразделяется на два типа:
Например, в экономических
исследованиях при изучении эластичности
спроса от цен широко используется степенная
функция: у=а*хb*ε, где
у – спрашиваемое количество;
х – цена;
ε – случайная ошибка.
Данная модель не линейна относительно
оцениваемых параметров, ибо включает
параметры а и b неаддитивно. Однако ее можно
считать внутренне линейной, так как логарифмирование
данного уравнения по основанию е приводит
его к линейному виду: lny=lna+b*lnx+lnε.
Соответственно оценки параметров а и b могут
быть найдены МНК. В рассматриваемой степенной
функции предполагается, что случайная
ошибка ε мультипликативно связана с объясняющей
переменной х.
Если же модель представить в виде у=а*xb+ε, то она становится внутренне
не линейной, так как ее невозможно превратить
в линейный вид.
В специальных исследованиях по регрессионному
анализу часто к нелинейным относят модели,
только внутренне нелинейные по оцениваемым
параметра, а все другие модели, которые
внешне нелинейны, но путем преобразований
параметров могут быть приведены к линейному
виду, относятся к классу линейных моделей.
Если модель внутренне нелинейна по параметрам,
то для оценки параметров используются
итеративные процедуры, успешность которых
зависит от вида уравнений и особенностей
применяемого итеративного подхода.
Среди нелинейных функций, которые могут
быть приведены к линейному виду, в эконометрических
исследованиях очень широко используется
степенная функция у=а*xb*ε. Связанно это с тем, что параметр b в
ней имеет четкое экономическое толкование,
те есть он являеся коэффицентом эластичности.
Это значит, что величина коэффициента b показывает,
на сколько процентов изменился в среднем
результат, если фактор изменился на 1%.
О правомерности подобного истолкования
параметра b для степенной функции ŷх=а*хb можно судить, если рассмотреть
формулу расчета коэффициента эластичности
Э=ƒ`(x)x/y, где
ƒ`(x) – первая производная, характеризующая
соотношение приростов результата и фактора
для соответствующей формы связи.
В силу того, что коэффициент эластичности
для линейной функции не является величиной
постоянной, а зависит от соответствующего
значения х, то обычно рассчитывается
средний показатель эластичности по формуле:
Э=b*x/y.
Для оценки параметров степенной функции
у=а*xb*ε применяется МНК к линеаризированному
уравнению lny=lna+b*lnx+lnε, то есть решается
система нормальных уравнений:
∑lnу=n*lna+b*∑lnx,
∑lny*lnx=lna*∑lnx+b*∑(lnx)2
Параметр b определяется непосредственно
из системы, а параметр а – косвенным путем
после потенцирования величины lna.
Поскольку коэффициенты эластичности
представляют экономический интерес,
а виды моделей не ограничиваются только
степенной функцией, то существуют формулы
расчета коэффициентов эластичности для
наиболее распространенных типов уравнений
регрессии, приведенные в приложении 1.
Несмотря на широкое использование в эконометрике
коэффициентов эластичности, возможны
случаи, когда их расчет экономического
смысла не имеет. Это происходит тогда,
когда для рассматриваемых признаков
бессмысленно определение изменения значений
в процентах.
В прогнозных расчетах по уравнению
регрессии определяется предсказываемое
(ур) значение как точечный прогноз
ŷx при хр=хк, то есть путем подстановки
в уравнение регрессии ŷx=a+b*x соответствующего значения
х12. однако точечный прогноз явно
не реален. Поэтому он дополняется расчетом
стандартной ошибки ŷx, то есть mŷx, и соответственно интервальной
оценкой прогнозного значения (у*)
ŷx- mŷx≤ у*≤ ŷx+mŷx
что бы понять, как строится формула для
определения величины стандартной ошибки
ŷx, обратимся к уравнению линейной
регрессии: ŷx=a+b*x. Подставим в это уравнение
выражение параметра а: a=y-b*x, тогда уравнение
регрессии примет вид: ŷx= y-b*x+b*x=у+ b(x-x).
Отсюда вытекает, что стандартная ошибка mŷx зависит от ошибки у и ошибки
коэффициента регрессии b, то есть:
mŷx2=my2+mb2(x-x)2
Из теории выборки известно, что my2= σ2/n. Используя в качестве оценки σ2 остаточную дисперсию на одну
степень свободы S2, получим формулу расчета ошибки
среднего значения переменной у:
my2= S2/n.
Считая, что прогнозное значение фактора
хз=хк, получим следующую формулу
расчета стандартной ошибки предсказываемого
по линии регрессии значения, то есть mŷx:
mŷx2= S2/n+ S2/∑(x-x)2*(хк-х)2= S2*(1/n+((xk-x)2/(∑(x-x)2)))
Рассмотренная формула стандартной ошибки
предсказываемого среднего значения у
при заданном значении xk характеризует ошибку положения
линии регрессии. Величина стандартной
ошибки mŷx, как видно из формулы, достигает
минимума при хк=х, и возрастает по мере того,
как «удаляется» от х в любом направлении.
Иными словами, чем больше разность между
хк и х, тем больше ошибка mŷx с которой предсказывается
среднее значение у для заданного значения
хк. Можно ожидать наилучшие результаты
прогноза, если признак-фактор х находится
в центре области наблюдений х и нельзя
ожидать хороших результатов прогноза
при удалении хк от х. Если же значение хк оказывается за пределами наблюдаемых
значений х, используемых при построении
линейной регрессии, то результаты прогноза
ухудшаются в зависимости от того, насколько
хкотклоняется от области наблюдаемых
значений фактора х.
Фактические значения у варьируются около
среднего значения ŷx. Индивидуальные значения у
могут отклоняться от ŷx на величину случайной ошибки
ε, дисперсия которой оценивается как
остаточная дисперсия на одну степень
свободы S2. Поэтому ошибка предсказываемого
индивидуального значения у должна включать
не только стандартную ошибку mŷx, но и случайную ошибку S.