Построение модели множественной линейной регрессии, оценка параметров модели

Автор работы: Пользователь скрыл имя, 27 Декабря 2012 в 03:11, практическая работа

Краткое описание

Цель работы – построение модели множественной линейной регрессии влияния уровня интенсификации на эффективность производства продукции сельского хозяйства.
Работа выполнялась в программе STATISTICA.
В процессе работы использовались следующие методы: дисперсионный анализ, корреляционно-регрессионный анализ (метод наименьших квадратов), графический метод.
В результате исследования была построена модель множественной линейной регрессии, параметры оценены на достоверность, оценена коллинеарность факторов, проведена гребневая регрессия, модель оценена на гетероскедастичность остатков.

Прикрепленные файлы: 1 файл

Ekonometrika (2).docx

— 2.31 Мб (Скачать документ)

 

 

Выручка от реализации продукции  на 100 га с.-х. угодий = (выручка от растениеводства + выручка от животноводства) / площадь  с.-х. угодий * 100.

Среднегодовая численность работников на 100 га с.-х. угодий = численность работников / площадь  с.-х. угодий * 100.

Амортизация по отраслям с.-х. на 100 га с.-х. угодий = (амортизация от растениеводства + амортизация от животноводства) / площадь с.-х. угодий * 100.

4) Оценим распределение хозяйств по изучаемым признакам

Для корелляционно - регрессионного анализа необходимо выделить однородные типы предприятий.

Рис.1 Огива распределения по выручке от реализации с/х угодий

 

Признак меняется   в конце с резким скачком, поэтому отбрасываем резко выделяющиеся значения, т.е. наблюдения 94-97.

 

Рис. 2. Огива распределения по выручке от реализации с/х угодий

 

Признак меняется плавно, без резких скачков (хотя  угол наклона и меняется во второй половине графика, что свидетельствует  о больших отличиях между последующим  и предыдущим значениями, чем в  начале ранжированного ряда), минимальное  и максимальное значения не являются экстремально выделяющимися, поэтому  построим гистограмму с равными  интервалами.

 

Рис. 3. гистограмма распределения по выручке от реализации с/х угодий

 

Фактическая значимость статистики Колмогорова-Смирнова меньше 5%, это означает, что с уровнем  вероятности суждения 95% гипотеза о  нормальном распределении единиц в  данной совокупности должна быть отклонена. Это также видно из графика, распределение  имеет правостороннюю скошенность.

 

Рис.4. Огива распределения по среднегодовой численности работников, занятых в с/х в расчете на 100 га с/х угодий

 

Признак меняется   в конце с резким скачком, поэтому отбрасываем резко выделяющиеся значения, т.е. наблюдения 90-97.

 

Рис. 5. Огива распределения по среднегодовой численности работников, занятых в с/х в расчете на 100 га с/х угодий

 

Признак меняется плавно, без резких скачков (хотя  угол наклона и меняется во второй половине графика, что свидетельствует  о больших отличиях между последующим  и предыдущим значениями, чем в  начале ранжированного ряда), минимальное  и максимальное значения не являются экстремально выделяющимися, поэтому  построим гистограмму с равными  интервалами.

 

 

Рис.6.Гистограмма распределения по среднегодовой численности работников, занятых в с/х  в расчете на 100 га с/х угодий

 

Фактическая значимость статистики Колмогорова-Смирнова меньше 5%, это означает, что с уровнем  вероятности суждения 95% гипотеза о  нормальном распределении единиц в  данной совокупности должна быть отклонена. Это также видно из графика, распределение  имеет правостороннюю скошенность.

 

Рис.7 . Огива распределения по амортизации по с/х в расчете на 100 га с/х угодий

 

Признак меняется   в конце с резким скачком, поэтому отбрасываем резко выделяющиеся значения, т.е. наблюдения 95-97.

 

Рис.8 . Огива распределения по амортизации по с/х в расчете на 100 га с/х угодий

 

Признак меняется плавно, без резких скачков (хотя  угол наклона и меняется во второй половине графика, что свидетельствует  о больших отличиях между последующим  и предыдущим значениями, чем в  начале ранжированного ряда), минимальное  и максимальное значения не являются экстремально выделяющимися, поэтому  построим гистограмму с равными  интервалами.

 

Рис.9.Гистограмма распределения по по амортизации по с/х в расчете на 100 га с/х угодий

 

Фактическая значимость статистики Колмогорова-Смирнова меньше 5%, это означает, что с уровнем  вероятности суждения 95% гипотеза о  нормальном распределении единиц в  данной совокупности должна быть отклонена. Это также видно из графика, распределение  имеет правостороннюю скошенность.

2. Построние множественной регрессии

1) Для сравнения интенсивности вариации признаков рассчитаем относительный показатель – коэффициент вариации

 
Рис.10.Средние и стандартные отклонения

 

В итоге  получим рассчитанные в новой  графе коэффициенты вариации зависимой  и независимой переменной, которые  свидетельствую о наличии практически  одинаковой (130%,103% и 80%) интенсивной  вариации изучаемых признаков.

В итоге  получим результаты построения уравнения  регрессии:

Рис.11.Результаты множественной регрессии

 

По результатам  множетвенной регрессии коэффициент корреляции (0,67), коэффициент детерминации (0,45), результаты дисперсионного анализа равен («сс» – степени свободы, указанные через запятую для дисперсии регрессии и для остаточной).

2)Построим  дисперсионный  анализ 

Итоги дисперсионного анализа представлены в рис.12

 

Рис.12.Дисперсионный анализ по выручки от реализации  продукции

 

Проверка  нулевой гипотезы осуществляется при  помощи F-критерия

(Критерия  Фишера). F-  критерий используется как общий критерий,  подтвер ждающий или опровергающий значимое влияние фактора на общую вариацию признака. По рис.12 делаем вывод о том, что низкая вероятность нулевой гипотезы (р=0,000000), т.е. гипотеза альтернативная.

3) Построим итоговую таблицу регрессии

 

 

 
Рис.13. Итоговая таблица регрессии

 

Параметры уравнения приведены в столбце  «В», красным цветом выделены значимые параметры.

 Таким  образом мы получим уравнение  регрессии вида:

По итоговой таблице мы делаем вывод, что уравнение значимо (по критерию F-Фишера, p<5%). Значимы и переменные среднегодовая численность работников на 100 с/х угодий и амортизация в расчете на 100 га по критерию t- Стьюдента (p -уров в обоих случаев гораздо меньше выбранной 5%-области).

Интерпретируем  значения частных коэффициентов  корреляции.

b1, говорит о том что при увеличении  среднегодовой численности работников на 1, выручка от реализации увеличивается на 109,16 руб., при неизменности других условий.

b2, говорит о том что при увеличении  амортизации с/х на 1, выручка от реализации увеличивается на 5,15 руб. , при неизмененных условиях.

3.Оценка влияние коллинеарности факторов на основе коэффициентов корреляции  между независимыми переменными

Для этого  в программе STATISTICA в процессе проведения анализа и построения множественной регрессии произведен расчет переменных входящих в уравнения либо по избыточности независимых переменных.

1) Проанализируем матрицу парных коэффициентов корреляции между факторами

Рис.14. Матрица парных коэффициентов независимых факторов

Парные  коэффициенты корреляции меньше, чем  частные коэффициенты корреляции.

Связь обратная, коэффициенты являются устойчивыми, они  меньше 0,12,что говорит об отсутствии коллинеарности факторов. Для окончательного решения о коллинеарности факторов построим текущую матрицу выметания.

2) Построим  текущую матрицу выметания

Рис.15 Текущая матрица выметания

Что касается матрицы выметания, то по главной  диагонали ее должны стоять единицы  по модулю, для того чтобы с уверенностью утверждать о том, что коллинеарность факторов отсутствует. 

В нашем  случае по диагонали стоит 1,01403, что  говорит о неком небольшом  риске присутствии коллинеарности факторов.

Кроме того, на основе частных коэффициентов  корреляции можно судить о том, какой  из факторов оказывает наибольшее влияние  на результат.

3)Рассчитаем показатель толерантности:

Т = 1 – r2x1x2

Для этого  построим избыточность независимых переменных (рис.16)

Рис. 16. Избыточность независимых переменных

Толерантность равна 0,98, что в принципе говорит  о том, что коллинеарность факторов отсутствует, поскольку толерантность  достаточна близка к 1.

4)Рассчитаем частные коэффициенты корреляции:

Если  связь между факторами сильная, то парные от частных будут отличаться. Частные коэффициенты корреляции можно  сравнивать друг с другом и определять приоритетные.

Рис. 17. Частные коэффициенты корреляции

В данном случае приоритетным является среднегодовая численность рабочих на 100 га с.-х. угодий.

 Частная  корреляция данной переменной  равна 0,62.

Факторы оказывают достаточно сильное влияние  на результат, при чем наибольшее влияние оказывает среднегодовая численность рабочих.

4.Оценка параметров уравнения множественной регрессии методом Ридж – регрессии (гребневой)

Гребневая (или ридж) регрессия используется, когда независимые переменные коррелируют друг с другом. Тогда устойчивые оценки регрессионных коэффициентов не могут быть получены с помощью обычного метода наименьших квадратов (высокие значения стандартных ошибок). Гребневые оценки параметров регрессии хоть и смещены, но имеют лучшие характеристики точности. В этом случае к диагонали корреляционной матрицы добавляется константа (лямбда) для того, чтобы все диагональные элементы корреляционной матрицы были равны 1.0 (при  гребневые оценки превращаются в оценки метода наименьших квадратов). Другими словами, гребневая регрессия искусственно занижает коэффициенты корреляции, чтобы могли быть вычислены более устойчивые оценки коэффициентов регрессии. Проблема использования данного метода на практике сводится к выбору подходящего значения.

Для оценки параметров уравнения сравним λ=0,1 и λ=0,3

 

 

1) Анализ  параметров уравнения для λ=0,1

1.1. Построение результатов уравнения гребневой регрессии

Рис.18.Результаты множественной гребневой регрессии

 

По результатам  гребневой регрессии   коэффициент  корреляции равен 0,64,  коэффициент детерминации равен 0, 40, результаты дисперсионного анализа («сс» – степени свободы, указанные через запятую для дисперсии регрессии и для остаточной).

 

1.2. Построим избыточность независимых переменных (рис.19)


 
Рис.19. Избыточность независимых переменных

Толерантность равна 1,08 , что в принципе говорит  о том, что коллинеарность факторов отсутствует, поскольку толерантность  достаточна близка к 1.

1.3.Построим таблицу по итогам гребневой регрессии

 

Рис.20.Итоги гребневой регрессии

 

Параметры уравнения приведены в столбце  «В», красным цветом выделены значимые параметры.

 Таким  образом мы получим уравнение  регрессии вида:

По итоговой таблице мы делаем вывод, что уравнение значимо (по критерию F-Фишера, p<5%). Значимы и переменные среднегодовая численность работников на 100 с/х угодий и амортизация в расчете на 100 га по критерию t- Стьюдента (p -уров в обоих случаев гораздо меньше выбранной 5%-области).

Интерпретируем  значения частных коэффициентов  корреляции.

b1, говорит о том что при увеличении  среднегодовой численности работников на 1, выручка от реализации увеличивается на 98,39 руб., при неизменности других условий.

b2, говорит о том что при увеличении  амортизации с/х на 1, выручка от реализации увеличивается на 4,6 руб. , при неизмененных условиях.

 

1.4.Построим  текущую матрицу выметания (рис.21)

Рис.21. Текущая матрица выметания

 

Что касается текущей матрицы выметания, то по главной диагонали ее должны стоять единицы по модулю, для того чтобы с уверенностью утверждать о том, что коллинеарность факторов отсутствует.

 В  нашем случае по диагонали  стоит 0,919609, что говорит о неком небольшом риске присутствии коллинеарности факторов.

 

2)Анализ  параметров уравнения для λ=0,3

 

2.1. Построение результатов уравнения гребневой регрессии

Рис.22. Результаты множественной гребневой регрессии

 

По результатам  гребневой регрессии   коэффициент  корреляции равен 0,58,  коэффициент детерминации равен 0,34, результаты дисперсионного анализа равны («сс» – степени свободы, указанные через запятую для дисперсии регрессии и для остаточной).

2.2. Построим  избыточность независимых переменных

Рис.23 Избыточность независимых переменных

 

Толерантность равна 1,29 , что в принципе говорит  о том, что коллинеарность факторов отсутствует, поскольку толерантность  достаточна близка к 1.

 

2.3. Построим  таблицу по итогам гребневой  регрессии

 

Рис.24.Итоги гребневой регрессии

 

Параметры уравнения приведены в столбце  «В», красным цветом выделены значимые параметры.

 Таким  образом мы получим уравнение  регрессии вида:

По итоговой таблице мы делаем вывод, что уравнение значимо (по критерию F-Фишера, p<5%). Значимы и переменные среднегодовая численность работников на 100 с/х угодий и амортизация в расчете на 100 га по критерию t- Стьюдента (p -уров в обоих случаев гораздо меньше выбранной 5%-области).

Информация о работе Построение модели множественной линейной регрессии, оценка параметров модели