Автор работы: Пользователь скрыл имя, 14 Августа 2013 в 21:51, контрольная работа
Как уже отмечалось, в эконометрике широко используются методы статистики. Ставя, цель дать количественное описание взаимосвязей между экономическими переменными, эконометрика, прежде всего, вязана с методами регрессии и корреляции.
В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, т.е. это модель вида
1. Парная регрессия и корреляция в эконометрических исследования.
Спецификация модели…………………………………………………………………..3
2. Линейная регрессия и корреляция: смысл и оценка параметров…………………11
Задание 2………………………………………………………………………………...23
Задание 3………………………………………………………………………………...24
Задание 4………………………………………………………………………………...26
Список использованных источников………………………………………………….27
Международный университет в Москве
Калининградский филиал
СПЕЦИАЛЬНОСТЬ «Финансы и кредит»
ФОРМА ОБУЧЕНИЯ «Заочная»
КОНТРОЛЬНАЯ РАБОТА
Дисциплина: «Эконометрика»
Тема: «Парная регрессия и корреляция в эконометрических исследованиях. Спецификация модели. Линейная регрессия и корреляция: смысл и оценка параметров»
Выполнила:
студентка IV курса,
группы УФКС 08-1
Алешина А.Г.
Преподаватель:
Панюта Г.В.
г.Советск
2009 год
СОДЕРЖАНИЕ
1. Парная регрессия и корреляция в эконометрических исследования.
Спецификация модели……………………………
2. Линейная регрессия и корреляция: смысл и оценка параметров…………………11
Задание 2……………………………………………………………………………
Задание 3……………………………………………………………………………
Задание 4……………………………………………………………………………
Список использованных
источников………………………………………………….
1.Парная регрессия и корреляция в эконометрических исследования.
Спецификация модели.
Как уже отмечалось, в эконометрике широко используются методы статистики. Ставя, цель дать количественное описание взаимосвязей между экономическими переменными, эконометрика, прежде всего, вязана с методами регрессии и корреляции.
В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии.
Простая регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной y рассматривается как функция одной независимой (объясняющей) переменной x, т.е. это модель вида
Множественная регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция нескольких независимых (объясняющих) переменных х1,х2, ..., т.е. это модель вида
Любое эконометрическое исследование начинается со спецификации модели, т. е. с формулировки вида модели исходя из соответствующей теории связи между переменными. Иными словами, исследование начинается с теории, устанавливающей связь между явлениями.
В первую очередь из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, которой и используется в качестве объясняющей переменной. Предположим, выдвигается гипотеза о том, что величина проса у на товар А находится в обратной зависимости от цены х, т е. ŷx= a-b*x. В этом случае нужно знать, какие остальные факторы предполагаются неизменными, возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений. Так, если зависимость спроса у от цены х характеризуется, например, уравнением у = 5000 — 2*х, то это означает, что с ростом цены на 1 д. е. спрос в среднем уменьшается на 2 д. е. В уравнении регрессии корреляционная связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых:
yj= ŷXj+εj
где yj – фактическое значение результативного признака;
ŷXj – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х т.е. из уравнения регрессии;
εj – случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина εj или возмущение, включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
Приведенное ранее уравнение зависимости спроса у от цены х точнее следует записывать как
У=5000-2*х+ε,
поскольку всегда действуют случайные факторы. Обратная зависимость спроса от цены не обязательно характеризуется линейной функцией .
ŷX= а-b*х,
Возможны и другие соотношения, например:
поэтому от правильно выбранной спецификации модели зависит величина случайных ошибок они тем меньше, чем в большей мере теоретические значения результативного признака ŷX подходят к фактическим данным у.
К ошибкам спецификации будет относиться не только неправильный выбор той или иной математической функции для ŷX, но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной. Так, спрос на конкретный товар может определятся и ценой, и доходом на душу населения.
Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего работает с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики. Использование временной информации также представляет собой выборку из всего множества хронологических дат. Изменив временной интервал, можно получить другие результаты регрессии.
Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Ели ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки — увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Особенно велика роль ошибок измерения при исследовании на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется «доход на душу населения». Вместе с тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, например в результате наличия сокрытых доходов.
Приведем еще один пример: в настоящее время органы государственной статистики получают балансы предприятий, достоверность которых никто не подтверждает. Последующее обобщение такой информации может содержать ошибки измерения. Исследуя, например, в качестве результативного признака прибыль предприятий, мы должны быть уверены, что предприятия показывают в отчетности адекватные реальной действительности величины.
Предполагая, что ошибки
В парной регрессии спецификация модели связана с выбором вида математической функции, а в множественной — также с отбором факторов, включаемых в модель.
При построении регрессионных моделей могут использоваться как линейные (ŷ = а + b1х1 + b2х2 + ... + bpxp), так и нелинейные функции, например: ŷ = а*x1b1* x2b2* xpbp. В большинстве стандартных пакетов прикладных программ предусмотрена процедура преобразования нелинейных функций в линейные. В результате исследователь работает с линейной моделью, построенной по преобразованным данным. Так, если модель зависимости спроса от цены представлена степенной функцией у = а* хb* ε , то прологарифмировав, получаем, модель линейного вида: ln у = ln а + b ln x + ln ε, но уже не для исходных х и у, а для их логарифмов. Этим объясняется то внимание, которое уделяется рассмотрению именно линейной регрессии как основному виду регрессионных моделей. Кроме того, вариация переменных х и у может быть весьма ограничена, и реальный эффект нелинейности их связи может не проявиться. Это еще один аргумент в пользу линейных моделей. Например, ясно, что чрезмерное внесение удобрений может привести не к росту а к снижению урожайности, но фактически подобная ситуация маловероятна. Так что если теоретически мы должны выразить зависимость урожайности от удобрений как у = а + bх + сx2+ ε , то, вероятнее всего, вполне достаточным будет выражение у = а + bх + ε.
Наконец, ошибки измерения в переменных могут свести на нет наши усилия по усложнению модели. И мы должны признать, что при грубых измерениях более эффективно простое описание связей. Это еще один довод, объясняющий предпочтение линейных моделей.
В парной регрессии выбор вида математической функции ŷX = f (х) может быть осуществлен тремя методами:
• графическим;
• аналитическим, т. е. иcходя из теории изучаемой взаимосвязи;
• экспериментальным.
При излучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он базируется на поле корреляции. Основные типы кривых, используемые при количественной оценке связей, представлены на рис. 1.
Класс математических функций для описания связи двух переменных достаточно широк. Кроме уже указанных используются и другие типы кривых:
Значительный интерес представляет аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков.
Пусть, например, изучается потребность предприятия в электроэнергии у в зависимости от объема выпускаёмой продукции х.
Все потребление электроэнергии у можно подразделить на две части:
• не связанное с производством прод
Рис. 1. основные типы кривых, используемые при количественной оценке связей между двумя переменными:
а - ŷX = a+b*x; б- ŷX = a+b*x+c*x2;
в - ŷX = a+b/x; г- ŷX = a+b*x+c*x2+d*x3;
д - ŷX = a*xb; е - ŷX = a*bx;
• непосредственно связанное с объемом выпускаемой продукции, пропорционально возрастающее с увеличением объема выпуска (b*x).
Тогда зависимость потребления электроэнергии от объема продукции можно выразить уравнением регрессии вида -
ŷX = а + b*х,
Если затем разделить обе части уравнения на величину объема выпуска продукции х, то получим выражение зависимости удельного расхода электроэнергии на единицу продукции (z = y/x) от объема выпущенной продукции х в виде уравнения равносторонней гиперболы:
Аналогично затраты предприятия могут быть подразделены на условно-переменные, изменяющиёся пропорционально изменению объема продукции (расход материала, оплата труда и др.) и условно-постоянные, не изменяющиеся с изменением объема производства (арендная плата, содержание администрации и др.). Соответственно зависимость затрат на производство у от объема продукции х характеризуется линейной функцией
ŷX = а + b*х,
а зависимость себестоимости единицы продукции (z) от объема продукции — равносторонней гиперболой
При обработке информации на компьютере выбор вида уравнения регрессии обычно проводится экспериментальным методом, т. е. путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях.
Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии ŷX=f(х), то фактические значения результативного признака совпадают с теоретическими у = ŷX т.е. они полностью обусловлены влиянием фактора х. В этом случае остаточная дисперсия Dост=0. В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых в уравнении регрессии факторов. Иными словами, имеют место отклонения фактических данных от теоретических (у - ŷX). Величина этих отклонений и лежит в основе расчета остаточной дисперсии:
Чем меньше величина остаточной дисперсии, тем в меньшей мере наблюдается влияние прочих не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным. При обработке статистических данных на компьютере перебираются разные математические функции в автоматическом режиме и из них выбирается та, для которой остаточная дисперсия является наименьшей.