Особенности регрессии, проходящей через начало координат

Автор работы: Пользователь скрыл имя, 22 Декабря 2013 в 05:57, реферат

Краткое описание

Обнаружив взаимосвязь между двумя переменными, оценив интенсивность данной связи при помощи какого-нибудь коэффициента, исследователь пытается проинтерпретировать такую взаимосвязь по причинам и следствиям. Другими словами, конечным итогом измерений взаимосвязи между переменными считается подтверждение (либо опровержение) каких-нибудь содержательных предположений, которые касаются причинного механизма, рождающего выявленную взаимосвязь. Однако само по себе наличие связей между двумя переменными не доказывает, что данная связь может описываться моделью «причина — следствие».

Содержание

Введение………………………………………………………………………..…3
1 Особенности регрессии, проходящей через начало координат………………………………………………………………………....4
Влияние на коэффициенты регрессии масштаба измерения переменных………………………………………………………………………..7
Заключение……………………………………………………………………….10
Список использованной литературы…………………………………………..12

Прикрепленные файлы: 1 файл

эконометрика.docx

— 40.82 Кб (Скачать документ)

Содержание

 

Введение………………………………………………………………………..…3

1 Особенности регрессии, проходящей через начало координат………………………………………………………………………....4 

  1. Влияние на коэффициенты регрессии масштаба измерения переменных………………………………………………………………………..7

Заключение……………………………………………………………………….10

Список использованной литературы…………………………………………..12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Обнаружив взаимосвязь между двумя переменными, оценив интенсивность данной связи при помощи какого-нибудь коэффициента, исследователь пытается проинтерпретировать такую взаимосвязь по причинам и следствиям. Другими словами, конечным итогом измерений взаимосвязи между переменными считается подтверждение (либо опровержение) каких-нибудь содержательных предположений, которые касаются причинного механизма,  рождающего выявленную взаимосвязь. Однако само по себе наличие связей между двумя переменными не доказывает, что данная связь может описываться моделью «причина — следствие».

Термин «регрессия» впервые в статистике был использован Френсисом Гальтоном в 1886 из-за исследований вопросов наследований физических человеческих характеристик. В качестве одной из них был взят рост; при этом было выявлено, что в общем сыновья высоких отцов, оказались более высокими, в отличие от сыновей отцов с низким ростом. Более интересным стало то, что разброс роста сыновей был меньше, чем разброс роста отцов. Так проявлялась тенденция о возвращении роста сыновей к среднему росту (regression to mediocrity), или «регресс».

Регрессией  в теории вероятностей, математической статистике, называется зависимость среднего значения какой-нибудь величины от некоторой иной величины либо от нескольких величин. В отличии от чисто функциональной зависимости y=f(x), когда для каждого значения независимой переменной x существует одно лишь определённое значение величин y, при регрессионной связи значению x могут соответствовать исходя из случая разные значения величины y.

 

 

 

    1. Особенности регрессии, проходящей через начало координат   

 

При помощи регрессионного анализа изучается эффект влияния одного признака на иной, зависимость этого признака от фактора и  результативного признака от факториального. Основные результаты его следующие:

  1. Построение таблицы с дисперсионным анализом, в которой показана сила, достоверность влияний на признак по изучаемому фактору либо другому признаку (таблица разложений общий варьирований результативного признака по компонентам и их соотнесение друг с другом). 
  2. Построение уравнения регрессии, которое выражает пропорциональность сопряженного изменения всех признаков, тенденции взаимосвязанной их изменчивости либо динамики.

3. Оценка значимости параметров в регрессионном уравнении.  
Регрессионный анализ односторонне методически ориентирован на изучение зависимостей одного признака от другого (зависимость x от y или y от x), хоть и может применяться к тем случаям, когда имеется фактически взаимозависимость по двум переменным. Обобщенная зависимость, в свою очередь, исследуется при помощи "симметричного" метода – корреляционного анализа. 

Говорить о том, как изменяется один показатель по мере изменений другого, помогает коэффициент регрессии (a), который показывает, на какую величину изменяется в среднем один признак (y), когда изменяется другой (x) на единицу измерения. 

Форма - без свободного члена – может быть записана в следующем виде:                           

,

где Z - N´(n+1)-матрица, ее последний столбец состоит из единиц (равен 1N);

a - (n+1)-это вектор-столбец, его последний элемент является свободным членом регрессии.

Оператор МНК-оцениваний для уравнения без свободного члена записывается более компактно так:                                    

,

но   - (n+1)´(n+1)-это матрица вторых начальных моментов [z,1];

 - (n+1)-это вектор-столбец вторых начальных моментов между x и [z,1] .

Если в этом операторе  вернуться к обозначениям других форм уравнений регрессии, то получится выражение:                   

,

по которому видно, что

- обратная матрица ковариаций z (размерности N´N) аналогична соответствующему блоку обратной матрицы вторых начальных моментов (размерности (N+1)´(N+1));

- результаты от применений двух приведенных операторов оцениваний одинаковы.

Рассмотрим задачу по прямой без свободного члена, то есть прямой, которая проходит через начало координат и задается уравнением

y = βx:

Найдем оценку параметра  при помощи метода наименьших квадратов, которая находится при решении экстремальной задачи

 

Критическая точка функции S определяется по условию

 

Следовательно, OLS-оценка коэффициента  находится по формуле

 

Необходимо заметить, что  прямая y = не всегда может проходить через точку (ẋ;ẏ), но она всегда проходит через точку начала координат.

 Уравнение прямой без использования свободного члена применяется в некоторых прикладных задачах. К примеру, данная модель может использоваться при исследовании зависимостей прибыли от величины налога на прибыль.

Рассмотрим модель регрессии

y = x + ;

где значения x считаются неслучайными или детерминированными величинами, y и ошибки случайными величинами. Относительно ошибок регрессии предполагается выполнение условий из парной регрессии с имеющейся константой. Тогда видно, что

My = x; Var(y) = σ²

Теорема (Гаусс – Марков). Зададим условие для модели регрессии выполнения условий на ошибки регрессии

y = x + ;

Тогда OLS-оценка параметра считается BLUE оценкой, то есть среди линейных несмещенных оценок она имеет минимальную дисперсию, называемую эффективной оценкой.

Несмещенность в модели регрессии OLS-оценки коэффициента достаточно только при условии M = 0 на ошибку регрессии.

Далее рассмотрим статистические свойства оценки ^. Будем учитывать, что ошибки регрессии удовлетворяют условиям ошибки.

^͠  ͠ N(

Обозначим через y^ = x^i предсказанные либо подогнанные (fitted) значения зависимой переменной. Тогда остатки регрессии определяются как

e = yy^

В парной модели регрессии без константы ∑ e не равна 0.

Обозначим RSS = ∑e∑ yy^ – это остаточная сумма квадратов в модели регрессии. Можно показать, что

M(RSS) = (n - 1) σ²

Следовательно, статистика является несмещенной оценкой в дисперсии ошибок регрессии

Доверительный интервал с доверительной вероятностью ʏ имеет вид

P( ^  - s1 * tкр <  < ^ + s1 * tкр)= ʏ

Так же как и при парной регрессии необходимо определение полной (TSS), объясненной (ESS) и остаточной (RSS) суммы квадратов.

Но для модели регрессии в общем случае TSS не равное ESS + RSS

и коэффициент R2 уже не имеет никакого смысла.

В качестве меры по «качеству подгонки» прямой, а также модели регрессии без константы может использоваться нецентрированный коэффициент R2, который определяется равенством

R2нецентр =

 

2 Влияние на коэффициенты регрессии масштаба измерения переменных

 

В реальной жизни социологи очень редко сталкивается с простыми моделями данных, линейными уравнениями с двумя переменными. Влияние каждого фактора может обычно объяснить только часть разброса по наблюдаемым значениям независимой переменной. При помощи метода частной корреляции можно проконтролировать эффекты от воздействий любых прочих контрольных переменных, которые можно измерить. Но еще более интересной задачей считается контроль за одновременным воздействием нескольких независимых переменных на одну зависимую,  также сравнение эффектов воздействий различных независимых переменных, предсказание влияния независимой переменной.

Уравнением множественной регрессии называется определенная модель в порождении данных. Очень важные допущения, которые принимаются в этой модели, касаются требования линейности, аддитивности в суммарном эффекте независимых переменных. Аддитивность означает, что воздействие разных независимых переменных суммируются, а не, к примеру, перемножаются (мультипликативный эффект, в отличии от аддитивного, имеет место лишь тогда, когда уровень воздействия одной независимой на зависимую переменную находится, в свою очередь, под влиянием иной независимой переменной, то есть между независимыми переменными происходит взаимодействие).

Регрессия происходит одновременно по двум и больше независимым переменным, и каждая из них вхожа в регрессионное уравнение по коэффициенту, позволяющему предсказать с минимальным количеством ошибок значения зависимой переменной (здесь критерием считается метод наименьших квадратов).

Коэффициент а может быть интерпретирован как показатель влияния каждой независимой на зависимую переменную при контроле в уравнении всех других независимых переменных. Коэффициенты регрессии обладают размерностью, показывая, на сколько единиц изменится зависимая  при увеличении независимой переменной на одну единицу.

 Регрессию также можно использовать и с целью предсказаний среднего группового значения, к примеру, среднего дохода по конкретной профессии. Как независимую переменную множественной регрессии можно использовать и дихотомические переменные, к которым приписываются значения 0, 1 (к примеру, пол).

При интерпретации результата регрессии стандартизованные коэффициенты, используют как показатели значимости и влияния соответствующих переменных. Данная трактовка верна только в определенных пределах. В случае нарушения некоторых условий сравнения абсолютных величин по стандартизованным коэффициентам может привести к неверным выводам. Это происходит потому, что коэффициенты регрессии очень подвержены влияниям случайных ошибок измерений. Использование ненадежного индикатора проводит сдвиг регрессионных коэффициентов к нулю. Другими словами, наиболее надежные индикаторы дают наиболее высокие оценки коэффициентов. Но нельзя также исключать и альтернативное объяснение, которое связывает более высокий коэффициент регрессии первой переменной с побочным эффектом методов измерений: их широта и пр.

Таким образом, для получений  наиболее верного анализа данных в исследовании, масштаб измерений  играет очень большую роль, так  как при сильно отличающихся масштабах  измерений результаты могут быть существенно различные.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

 

Регрессией  в теории вероятностей, математической статистике, называется зависимость среднего значения какой-нибудь величины от некоторой иной величины либо от нескольких величин.

При помощи регрессионного анализа изучается эффект влияния  одного признака на иной, зависимость  этого признака от фактора и  результативного  признака от факториального.

 Регрессионный анализ односторонне методически ориентирован на изучение зависимостей одного признака от другого (зависимость x от y или y от x).

В отличии от чисто функциональной зависимости y=f(x), когда для каждого значения независимой переменной x существует одно лишь определённое значение величин y, при регрессионной связи значению x могут соответствовать исходя из случая разные значения величины y. Уравнение прямой без использования свободного члена применяется в некоторых прикладных задачах.

Влияние каждого фактора  может обычно объяснить только часть  разброса по наблюдаемым значениям  независимой переменной. При помощи метода частной корреляции можно проконтролировать эффекты от воздействий любых прочих контрольных переменных, которые можно измерить.

Коэффициент а может быть интерпретирован как показатель влияния каждой независимой на зависимую переменную при контроле в уравнении всех других независимых переменных. Коэффициенты регрессии обладают размерностью, показывая, на сколько единиц изменится зависимая  при увеличении независимой переменной на одну единицу.

Для получений наиболее верного анализа данных в исследовании, масштаб измерений играет очень большую роль, так как при сильно отличающихся масштабах измерений результаты могут быть существенно различные.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список использованной литературы

 

1. Айвазян С.А. Основы эконометрики. Т.2. — М.: Юнити, 2001. 

2. Артамонов Н.В. Введение в эконометрику. Курс лекций. - М.: МГИМО, 2010. - 204 с. 

3. Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 2007

4. Носко В.П. Эконометрика для начинающих, М.: ИЭПП, 2000

 


Информация о работе Особенности регрессии, проходящей через начало координат