Автор работы: Пользователь скрыл имя, 16 Апреля 2013 в 19:21, доклад
Эконометрика – это наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей. (Большой Энциклопедический Словарь – М., БРЭ, 1977)
Эконометрические методы – это, прежде всего, методы статистического анализа конкретных экономических данных.
Т.Г. ТЮРНЕВА
ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ
ЛИНЕЙНАЯ МОДЕЛЬ ПАРНОЙ РЕГРЕССИИ
Эконометрика – это наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей. (Большой Энциклопедический Словарь – М., БРЭ, 1977)
Эконометрические методы – это, прежде всего, методы статистического анализа конкретных экономических данных.
Оценка результатов
эконометрического
С практической точки зрения к основным задачам эконометрики можно отнести:
Модель парной линейной регрессии является частным случаем модели многомерной регрессии. Её исследование представляет самостоятельный интерес, так как она имеет многие характерные свойства общих многомерных моделей, но более наглядна и проста для изучения.
Расчетно-графическая работа по эконометрике
Модель парной линейной регрессии
Пусть имеется два ряда эмпирических данных X (x1, x2, …, xn) и Y (y1, y2, …, yn), соответствующие им точки с координатами (xi, yi), где i=1,2,…,n, отобразим на координатной плоскости. Такое изображение называется полем корреляции. Пусть по расположению эмпирических точек можно предположить наличие линейной корреляционной зависимости между переменными X и Y.
В общем виде теоретическую линейную парную регрессионную модель можно представить в виде:
Y=
где Y – объясняемая (результирующая, зависимая, эндогенная) переменная,
Х – объясняющая (факторная, независимая, экзогенная) переменная или регрессор;
- теоретические параметры (числовые коэффициенты) регрессии, подлежащие оцениванию;
εi - случайное отклонение (возмущение, ошибка).
Основные гипотезы:
3а. М εi=0, i=1,2,…,n.
3b. D εi=σ2, i=1,2,…,n. Условие независимости дисперсии ошибки от номера наблюдения называется гомоскедастичностью; случай, когда условие гомоскедастичности не выполняется, называется гетероскедастичностью.
3с. М(εi εj )=0 при i ≠ j , некоррелированность ошибок для разных наблюдений. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок.
Замечание. Для получения уравнения регрессии достаточно первых трех предпосылок. Для оценки точности уравнения регрессии и его параметров необходимо выполнение четвертой предпосылки.
Задача линейного
где оценка условного математического ожидания М(Y/ X=xi); оценки неизвестных параметров , называемые эмпирическими коэффициентами регрессии. В каждом конкретном случае можно записать
где отклонения еi – ошибки (остатки) модели, которые являются оценками теоретического случайного отклонения εi.
2. Рассчитайте
параметры выборочного
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК). В методе наименьших квадратов оценки параметров модели строятся так, чтобы минимизировать сумму квадратов ошибок модели по всем наблюдениям. Таким образом, критерий наименьших квадратов записывается в виде:
Необходимым условием существования минимума функции S(b0 ,b1) является равенство нулю её частных производных по неизвестным b0 и b1 (для краткости опустим индексы суммирования у знака суммы Σ ):
Данная система уравнений называется системой нормальных уравнений для коэффициентов регрессии.
Решая эту систему двух линейных уравнений с двумя неизвестными, например, методом подстановки, получим:
где выборочные средние значения переменных Х и Y.
.
С геометрической точки зрения минимизация суммы квадратов отклонений означает выбор единственной прямой (из всех прямых с параметрами), которая ближе всего «прилегает» по ординатам к системе выборочных точек (xi, yi), i=1,2,…,n.
3. Оцените
тесноту связи с помощью
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Существует несколько видов формулы линейного коэффициента корреляции, основные из них:
Корреляционная связь между переменными называется прямой, если rxy.>0, и обратной, если rxy <0.
Для практических расчётов наиболее удобна формула
так как по ней коэффициент корреляции находится из данных наблюдений, и на значение rxy не оказывает влияния погрешность округления.
Коэффициент корреляции принимает значения от -1 до +1.
При значении коэффициента корреляции равном 1 связь представлена линейной функциональной зависимостью. При этом все наблюдаемые значения располагаются на линии регрессии.
При rxy=0 корреляционная связь между признаками в линейной форме отсутствует. При этом линия регрессии параллельна оси Ох.
При rxy > 0 – корреляционная связь между переменными называется прямой, а при rxy < 0 – обратной.
Для характеристики силы связи можно использовать шкалу Чеддока.
Показатель тесноты связи |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Высокая |
Весьма высокая |
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции rxy2, называемый коэффициентом детерминации. Коэффициент детерминации обозначим R2, т. о. имеем
R2 = rxy2.
Коэффициент детерминации характеризует долю дисперсии результативного признака Y, объясняемую регрессией, в общей дисперсии результативного признака. Соответственно величина 1- R2 характеризует долю дисперсии Y, вызванную влиянием остальных, не учтенных в модели факторов.
Замечание. Вычисление R2 корректно, если константа включена в уравнение регрессии.
4. Используя
критерий Стьюдента оцените
Эмпирическое уравнение
Для проверки гипотезы
Н 0 : b1 = β1,
Н 1: b1 ≠ β1
используется статистика , которая при справедливости гипотезы Н0 имеет распределение Стьюдента с числом степеней свободы df = n – 2, где - стандартная ошибка коэффициента регрессии b1, .
Наиболее важной на начальном этапе статистического анализа построенной модели является задача установления наличия линейной зависимости между Y и X. Эта проблема может быть решена проверкой гипотезы
Н 0 : b1 = 0,
Н 1: b1 ≠ 0.
Гипотеза в такой постановке обычно называется гипотезой о статистической значимости коэффициента регрессии. При этом если принимается нулевая гипотеза, то есть основания считать, что величина Y не зависит от Х – коэффициент b1 статистически незначим (он слишком близок к нулю). При отклонении Н 0 коэффициент считается статистически значимым, что указывает на наличие определённой линейной зависимости между Y и X. Используемая в этом случае t – статистика имеет вид: и при нулевой гипотезе имеет распределение Стьюдента с (n -2) степенями свободы.
Если вычисленное значение t – статистики - |tфакт| при заданном уровне значимости α больше критического (табличного) t табл , т.е.
|tфакт| > t табл = t(α ; n-2),
то гипотеза Н 0 : b1 = 0, отвергается в пользу альтернативной при выбранном уровне значимости. Это подтверждает статистическую значимость коэффициента регрессии b1.
Если |tфакт| < tтабл = t(α; n-2), то гипотеза Н0 не отвергается. Критическое значение t табл = t(α;n-2), при заданном уровне значимости α и числе степеней свободы n -2 находится по таблицам 2 Приложения.
По аналогичной схеме на основе t – статистики проверяется гипотеза о статистической значимости коэффициента b0 :
где и - стандартная ошибка коэффициента регрессии b0 .
Формулы для расчета доверительных интервалов имеют следующий вид:
которые с надёжностью (1 – α) накрывают определяемые параметры .
Если в границы доверительных интервалов попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр признается статистически незначимым.
Проверить значимость уравнения регрессии – значит, установить, соответствует ли математическая модель, выражающая зависимость между переменными, имеющимся данным и достаточно ли включённых в уравнение объясняющих переменных для описания зависимой переменной.