Регрессионный и факторный анализы показателей урожайности

Автор работы: Пользователь скрыл имя, 20 Декабря 2013 в 12:31, статья

Краткое описание

Целью данной работы является построение регрессионной модели урожайности, а также провести факторный анализ выбранных показателей.
Задачи, которые будут выполнены в ходе работы:
Построение и первичный анализ корреляционной матрицы
Построение и анализ регрессионной модели с включением
Построение и анализ регрессионной модели с исключением
Провести факторный анализ

Содержание

Обзор литературы
Экономическая постановка задачи
Первичный анализ информации
Исследуемые показатели
Гипотезы исследования
Первичный анализ имеющейся информации
Корреляционный анализ
Корреляционная матрица парных коэффициентов корреляции
Корреляционная матрица частных коэффициентов корреляции
Множественные коэффициенты корреляции
Регрессионный анализ
Исключение данных
Включение данных
Анализ регрессионных остатков на нормальный закон распределения
Интерпретация полученных результатов

Прикрепленные файлы: 1 файл

Эконометрика, отчет № 1.docx

— 72.24 Кб (Скачать документ)

 

 

     (11,622)     (2,744)     (2,923)

 

R = 0,692                F = 7,467

 

 

Уравнение значимо при  α=0.05, т.к. Fнабл=7,467>Fкр=3.20, найденного по таблице F- распределения при α=0.05. Значимы и все коэффициенты регрессии β1 и β4 в уравнении t j >tкр = 2.11.

Из уравнения регрессии  следует, что увеличение на 1 числа  тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 4,431 ц/га (b2=4,431).

Коэффициенты эластичности Э1=0,256 и Э4=0,247 показывают, что при увеличении показателей x1 и x4 на 1% урожайность зерновых повышается соответственно на 0,256% и 0,247 %.

Множественный коэффициент  детерминации ry2=0, 692 свидетельствует о том, что 69,2% вариации урожайности объясняется вошедшими в модель показателями (X2 и X4), то есть насыщенностью растениеводства тракторами и удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов (x2, x3, x5, погодных условий и др.). Средняя относительная ошибка аппроксимации δ =10.5% характеризует адекватность модели, так же, как и величина остаточной дисперсии S2=1.97.

 

    1. Факторный анализ

 

Для начала нужно проанализировать корреляционную матрицу. Это было сделано  на 1-ом шаге. Как видно из таблицы, относительно большие коэффициенты имеются между: Х3Х1, Х2Х1, Х3Х2.

 

Мера адекватности и критерий Бартлетта

Мера выборочной адекватности Кайзера-Мейера-Олкина.

,579

Критерий сферичности  Бартлетта

Прибл. хи-квадрат

88,618

ст.св.

10

Знч.

,000


 

Нулевую гипотезу о том, что  корреляционная матрица является единичной, отклоняем в соответствии с критерием  сферичности Бартлетта. Приближенное значение статистики равно 88,618 с 10 степенью свободы, она является значимой на уровне 0,05. Значение статистики КМО (0,579) большое (>0,5).

Вывод: факторный анализ является приемлемым методом для  анализа корреляционной матрицы.

 

 

 

Общности

 

Начальные

Извлеченные

x1

1,000

,939

x2

1,000

,903

x3

1,000

,962

x4

1,000

,830

x5

1,000

,792

Метод выделения: Анализ главных  компонент.


 

Таблица показывает, какую  часть дисперсии каждой из включенных в анализ переменных объясняет предлагаемая факторная модель. Например, Х1 (Число колесных тракторов) на 93,9% объясняется предложенной моделью. Значения Извлеченных общностей велико, то переменные не следует исключить из анализа.

 

Полная объясненная  дисперсия

Компонента

Начальные собственные значения

Суммы квадратов нагрузок извлечения

Итого

% Дисперсии

Кумулятивный %

Итого

% Дисперсии

Кумулятивный %

1

2,996

59,923

59,923

2,996

59,923

59,923

2

1,430

28,607

88,530

1,430

28,607

88,530

3

,447

8,936

97,466

     

4

,111

2,225

99,691

     

5

,015

,309

100,000

     

Метод выделения: Анализ главных  компонент.


 

Первая главная компонента объясняет 59,92% общей дисперсии, вторая 28,61%. Всего в модели отобрано 2 фактора, которые объясняют 88,53% общей дисперсии.

Также сколько именно нужно  отобрать объясняемых переменных может  показать метод «Каменистой осыпи»

 

 

Также на графике видно, что  нужно взять именно 2 компоненты для анализа.

Теперь нужно определиться с интерпретацией полученных факторов. Для этого нужно обратиться к  Матрице факторных нагрузок.

 

Матрица компонентa

 

Компонента

1

2

x1

,956

-,159

x2

,938

-,154

x3

,949

-,248

x4

,175

,894

x5

,521

,722

Метод выделения: Анализ методом  главных компонент.

a. Извлеченных компонент: 2


 

По данным таблицы можно с легкостью  сделать несколько выводов:.

Первый фактор имеет высокие  корреляции с Х1, Х2, Х3. «Оборудование для обработки урожая».

Второй фактор имеет высокие  корреляции с Х4, Х5. «Количество органических веществ».

Т.к. с помощью матрицы  факторных нагрузок удалось дать интерпретацию факторов, то прибегать  к методам Вращения не нужно.

 

Регрессия на отобранные компоненты:

 

Y – Урожайность зерновых культур (ц/га)

Х1 – Оборудование для обработки урожая

Х2 – Количество органических веществ

 

 

 

Коэффициентыa

Модель

Нестандартизованные коэффициенты

Стандартизованные коэффициенты

t

Знч.

B

Стд. Ошибка

Бета

1

(Константа)

9,663

,392

 

24,670

,000

REGR factor score   1 for analysis 1

,833

,402

,432

2,070

,055

REGR factor score   2 for analysis 1

,657

,402

,341

1,633

,122

a. Зависимая переменная: yi


 

 

 

 

 

По проведенному регрессионному анализу получаем:

 

В нашей работе мы построили  регрессионную модель урожайности  зерновых культур, используя несколько  методов регрессионного анализа:

  • метод пошагового исключения;
  • метод пошагового включения;
  • метод регрессии на главные компоненты.

 

Первые два метода дали нам одинаковые уравнения регрессии (Модель 1):

 

Проведя корреляционный анализ, мы пришли к выводу, что нецелесообразно  применять данную модель, так как  в матрице парных коэффициентов  корреляции было выявлено наличие тесной взаимосвязи некоторых признаков. Для того, чтобы избавиться от мультиколлинеарности мы провели факторный анализ, выделивший нам две компоненты. После этого был проведен регрессионный анализ на главные компоненты и получена следующая модель (Модель 2):

 

Сравним данные модели. Как  мы уже говорили, Модель 2 больше подходит по смыслу, так как включает в  себя все переменные данной нам совокупности. Первое уравнение теряет свою значимость и адекватность потому, что включает в себя только один из тесно взаимосвязанных  признаков. Так же предлагаю обратить внимание на F-критерий Фишера, и коэффициент детерминации, которые говорят о значимости самого уравнения регрессии и степень соответствия между регрессионной моделью и исходными данными:

 

Таблица 21

 

Значимость F

R-квадрат

Модель 1

0,0005

0,613

Модель 2

0,0147

0,439


 

Значимость второй модели выше, потому что в факторном анализе более узко рассматривается влияние некоторых факторов на результативный признак.


Информация о работе Регрессионный и факторный анализы показателей урожайности