Линейная модель парной регрессии

Автор работы: Пользователь скрыл имя, 16 Апреля 2013 в 19:21, доклад

Краткое описание

Эконометрика – это наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей. (Большой Энциклопедический Словарь – М., БРЭ, 1977)
Эконометрические методы – это, прежде всего, методы статистического анализа конкретных экономических данных.

Прикрепленные файлы: 1 файл

PRAKTIKUM_PO_EKONOMETRIKE.doc

— 400.50 Кб (Скачать документ)


 

 

 

 

Т.Г. ТЮРНЕВА

 

 

ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ

ЛИНЕЙНАЯ МОДЕЛЬ ПАРНОЙ РЕГРЕССИИ

 

 

 

 

 

 

           Эконометрика – это наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей. (Большой Энциклопедический Словарь – М., БРЭ, 1977)

Эконометрические методы – это, прежде всего, методы статистического анализа конкретных экономических данных.

Оценка результатов  эконометрического моделирования  достигается посредством решения качественной и количественной проблемы. Качественная составляющая заключается в установлении соответствия между построенной моделью и основополагающей экономической концепцией, а количественная – в точности аппроксимации имеющейся информации данными расчётов.

С практической точки  зрения к основным задачам эконометрики можно отнести:

  • построение эконометрических моделей – представление экономических моделей в математической форме, удобной для проведения эмпирического анализа. Данную проблему называют проблемой спецификации, которую можно решить несколькими способами;
  • оценку параметров построенной модели, позволяющую характеризовать адекватность модели реальными данными. Указанная задача решается на этапе параметризации;
  • проверку качества полученной модели в целом. Данная задача реализуется на этапе верификации;
  • использование построенной модели для прогнозирования.

Модель парной линейной регрессии является частным случаем  модели многомерной регрессии. Её исследование представляет самостоятельный интерес, так как она имеет многие характерные свойства общих многомерных моделей, но более наглядна и проста для изучения.

 

 

 

Расчетно-графическая  работа по эконометрике

 

Модель парной линейной регрессии

 

  1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
  2. Рассчитайте параметры выборочного уравнения линейной регрессии с помощью МНК.
  3. Оцените тесноту связи с помощью показателей корреляции (выборочный коэффициент корреляции) и детерминации.
  4. Используя критерий Стьюдента оцените статистическую значимость коэффициентов регрессии и корреляции.
  5. Постройте интервальные оценки параметров регрессии. Проверьте, согласуются ли полученные результаты с выводами, полученными в предыдущем пункте.
  6. Постройте таблицу дисперсионного анализа для оценки значимости уравнения в целом.
  7. С помощью теста Гольдфельда – Квандта исследуйте гетероскедастичность остатков. Сделайте выводы.
  8. В случае пригодности линейной модели рассчитайте прогнозное значение результата, если значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости =0,05.
  9. Оцените полученные результаты, проинтерпретируйте полученное уравнение регрессии.

 

 

 

 

 

  1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

 

Пусть имеется два ряда эмпирических данных X (x1, x2, …, xn) и            Y (y1, y2, …, yn), соответствующие им точки с координатами (xi, yi), где i=1,2,…,n, отобразим на координатной плоскости. Такое изображение называется полем корреляции. Пусть по расположению эмпирических точек можно предположить наличие линейной корреляционной зависимости между переменными X и Y.

 В общем виде теоретическую линейную парную регрессионную модель можно представить в виде:

Y=

или yi=
, i=1,2,…,n;

 

где Y – объясняемая (результирующая, зависимая, эндогенная) переменная,

      Х – объясняющая (факторная, независимая, экзогенная) переменная или регрессор;

      - теоретические параметры (числовые коэффициенты) регрессии, подлежащие оцениванию;

      εi  - случайное отклонение (возмущение, ошибка).

Основные гипотезы:

  1. yi= , i=1,2,…,n, - спецификация модели.
  2. Х – детерминированная (неслучайная) величина, при этом предполагается, что среди значений xi – не все одинаковые.

3а. М εi=0, i=1,2,…,n.

3b. D εi2, i=1,2,…,n. Условие независимости дисперсии ошибки от номера наблюдения называется гомоскедастичностью; случай, когда условие гомоскедастичности не выполняется, называется гетероскедастичностью.

3с. М(εi εj )=0 при i ≠ j , некоррелированность ошибок для разных наблюдений. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок.

  1. Возмущения являются нормально распределенными случайными величинами: εi ≈ N(0, σ2).

Замечание.  Для получения уравнения регрессии достаточно первых трех предпосылок. Для оценки точности уравнения регрессии и его параметров необходимо выполнение четвертой предпосылки.

 

Задача линейного регрессионного анализа состоит в том, чтобы  по имеющимся статистическим данным (xi, yi),  i=1,2,…,n, для переменных X  и Y получить наилучшие оценки неизвестных параметров , т. е. построить так называемое эмпирическое уравнение регрессии

,

где оценка условного математического ожидания М(Y/ X=xi); оценки неизвестных параметров , называемые эмпирическими коэффициентами регрессии. В каждом конкретном случае можно записать

, i=1,2,…,n,

 

где отклонения еi – ошибки (остатки) модели, которые являются оценками теоретического случайного отклонения  εi.

 

2.   Рассчитайте  параметры выборочного уравнения  линейной регрессии с помощью метода наименьших квадратов (МНК).

Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). В методе наименьших квадратов оценки параметров модели строятся так, чтобы минимизировать сумму квадратов ошибок модели по всем наблюдениям. Таким образом, критерий наименьших квадратов записывается в виде:

Необходимым условием существования  минимума функции S(b0 ,b1) является равенство нулю её частных производных по неизвестным b0 и b1        (для краткости опустим индексы суммирования у знака суммы Σ ):

  

Данная система уравнений  называется системой нормальных уравнений для коэффициентов регрессии.

Решая эту систему  двух линейных уравнений с двумя  неизвестными, например, методом подстановки, получим:

  где  выборочные средние значения переменных Х и Y.

.

С геометрической точки  зрения минимизация суммы квадратов  отклонений означает выбор единственной прямой (из всех прямых с параметрами), которая ближе всего «прилегает» по ординатам к системе выборочных точек (xi, yi),  i=1,2,…,n.

 

3. Оцените  тесноту связи с помощью показателей  корреляции (выборочный коэффициент  корреляции) и детерминации.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существует несколько видов формулы линейного коэффициента корреляции, основные из них:

.

Корреляционная связь  между переменными называется прямой, если rxy.>0, и обратной, если rxy <0.

Для практических расчётов наиболее удобна формула

,

так как по ней коэффициент  корреляции находится из данных наблюдений, и на значение rxy не оказывает влияния погрешность округления.

Коэффициент корреляции принимает  значения от -1 до +1.

При значении коэффициента корреляции равном 1 связь представлена линейной функциональной зависимостью. При этом все наблюдаемые значения располагаются на линии регрессии.

  При rxy=0 корреляционная связь между признаками в линейной форме отсутствует. При этом линия регрессии параллельна оси Ох.

При rxy > 0 – корреляционная связь между переменными называется прямой, а при rxy < 0 – обратной.

 

Для характеристики силы связи можно использовать шкалу Чеддока.

Показатель

тесноты связи

 

0,1 – 0,3

 

0,3 – 0,5

 

0,5 – 0,7

 

0,7 – 0,9

 

0,9 – 0,99

Характеристика

силы связи

 

Слабая

 

Умеренная

 

Заметная

 

Высокая

Весьма высокая


 

Для оценки качества подбора  линейной функции рассчитывается квадрат линейного коэффициента корреляции rxy2, называемый коэффициентом детерминации. Коэффициент детерминации обозначим R2, т. о. имеем

R2 = rxy2.

Коэффициент детерминации характеризует долю дисперсии результативного признака Y, объясняемую регрессией, в общей дисперсии результативного признака. Соответственно величина 1- R2 характеризует долю дисперсии Y, вызванную влиянием остальных, не учтенных в модели факторов.

Замечание. Вычисление R2 корректно, если константа включена в уравнение регрессии.

 

4.  Используя  критерий Стьюдента оцените статистическую  значимость коэффициентов регрессии  и корреляции.

Эмпирическое уравнение регрессии  определяется на основе конечного числа  статистических данных. Очевидно, что коэффициенты эмпирического уравнения регрессии являются случайными величинами, изменяющимися от выборки к выборке. При проведении статистического анализа возникает необходимость сравнения эмпирических коэффициентов регрессии b0 и b1 с некоторыми теоретически ожидаемыми значениями этих коэффициентов. Данный анализ осуществляется по схеме статистической проверки гипотез.

Для проверки гипотезы

Н 0 : b1 = β1,

Н 1:  b1 β1

используется статистика , которая при справедливости гипотезы Н0 имеет распределение Стьюдента с числом степеней свободы df = n – 2, где - стандартная  ошибка коэффициента регрессии b1, .

Наиболее важной на начальном этапе статистического анализа построенной модели является задача установления наличия линейной зависимости между Y и X. Эта проблема может быть решена проверкой гипотезы

Н 0 : b1 = 0,

Н 1:  b1 0.

Гипотеза в такой  постановке обычно называется гипотезой о статистической значимости коэффициента регрессии. При этом если принимается нулевая гипотеза, то есть основания считать, что величина Y не зависит от Х – коэффициент b1 статистически незначим (он слишком близок к нулю). При отклонении Н 0 коэффициент считается статистически значимым, что указывает на наличие определённой линейной зависимости между Y и X. Используемая в этом случае t – статистика имеет вид:              и при нулевой гипотезе имеет распределение Стьюдента с (n -2) степенями свободы.

Если вычисленное значение t – статистики - |tфакт| при заданном уровне значимости α больше критического (табличного) t табл , т.е.

|tфакт| > t табл = t(α ; n-2),

то гипотеза Н 0 : b1 = 0, отвергается в пользу альтернативной при выбранном уровне значимости. Это подтверждает статистическую значимость коэффициента регрессии b1.

Если |tфакт| < tтабл = t(α; n-2), то гипотеза Н0 не отвергается. Критическое значение t табл = t(α;n-2), при заданном уровне значимости α и   числе степеней свободы n -2 находится по таблицам 2 Приложения.

По аналогичной схеме  на основе t – статистики проверяется гипотеза о статистической значимости коэффициента b0 :

,

где и - стандартная ошибка коэффициента регрессии b0 .

 

  1. Постройте интервальные оценки параметров регрессии. Проверьте, согласуются ли полученные результаты с выводами, полученными в предыдущем пункте.

Формулы для расчета  доверительных интервалов имеют  следующий вид:

,

,

которые с надёжностью (1 – α) накрывают определяемые параметры .

Если в границы доверительных  интервалов попадает ноль, т.е. нижняя граница отрицательна, а верхняя  положительна, то оцениваемый параметр признается статистически незначимым.

 

  1. Постройте таблицу дисперсионного анализа для оценки значимости уравнения в целом.

Проверить значимость уравнения регрессии – значит, установить, соответствует ли математическая модель, выражающая зависимость между переменными, имеющимся данным и достаточно ли включённых в уравнение объясняющих переменных для описания зависимой переменной.

Информация о работе Линейная модель парной регрессии