Автор работы: Пользователь скрыл имя, 20 Декабря 2013 в 12:31, статья
Целью данной работы является построение регрессионной модели урожайности, а также провести факторный анализ выбранных показателей.
Задачи, которые будут выполнены в ходе работы:
Построение и первичный анализ корреляционной матрицы
Построение и анализ регрессионной модели с включением
Построение и анализ регрессионной модели с исключением
Провести факторный анализ
Обзор литературы
Экономическая постановка задачи
Первичный анализ информации
Исследуемые показатели
Гипотезы исследования
Первичный анализ имеющейся информации
Корреляционный анализ
Корреляционная матрица парных коэффициентов корреляции
Корреляционная матрица частных коэффициентов корреляции
Множественные коэффициенты корреляции
Регрессионный анализ
Исключение данных
Включение данных
Анализ регрессионных остатков на нормальный закон распределения
Интерпретация полученных результатов
(11,622) (2,744) (2,923)
R = 0,692 F = 7,467
Уравнение значимо при α=0.05, т.к. Fнабл=7,467>Fкр=3.20, найденного по таблице F- распределения при α=0.05. Значимы и все коэффициенты регрессии β1 и β4 в уравнении t j >tкр = 2.11.
Из уравнения регрессии следует, что увеличение на 1 числа тракторов на 100 га пашни приводит к росту урожайности зерновых в среднем на 4,431 ц/га (b2=4,431).
Коэффициенты эластичности Э1=0,256 и Э4=0,247 показывают, что при увеличении показателей x1 и x4 на 1% урожайность зерновых повышается соответственно на 0,256% и 0,247 %.
Множественный коэффициент детерминации ry2=0, 692 свидетельствует о том, что 69,2% вариации урожайности объясняется вошедшими в модель показателями (X2 и X4), то есть насыщенностью растениеводства тракторами и удобрениями. Остальная часть вариации обусловлена действием неучтенных факторов (x2, x3, x5, погодных условий и др.). Средняя относительная ошибка аппроксимации δ =10.5% характеризует адекватность модели, так же, как и величина остаточной дисперсии S2=1.97.
Для начала нужно проанализировать корреляционную матрицу. Это было сделано на 1-ом шаге. Как видно из таблицы, относительно большие коэффициенты имеются между: Х3Х1, Х2Х1, Х3Х2.
Мера адекватности и критерий Бартлетта | ||
Мера выборочной адекватности Кайзера-Мейера-Олкина. |
,579 | |
Критерий сферичности Бартлетта |
Прибл. хи-квадрат |
88,618 |
ст.св. |
10 | |
Знч. |
,000 |
Нулевую гипотезу о том, что корреляционная матрица является единичной, отклоняем в соответствии с критерием сферичности Бартлетта. Приближенное значение статистики равно 88,618 с 10 степенью свободы, она является значимой на уровне 0,05. Значение статистики КМО (0,579) большое (>0,5).
Вывод: факторный анализ является приемлемым методом для анализа корреляционной матрицы.
Общности | ||
Начальные |
Извлеченные | |
x1 |
1,000 |
,939 |
x2 |
1,000 |
,903 |
x3 |
1,000 |
,962 |
x4 |
1,000 |
,830 |
x5 |
1,000 |
,792 |
Метод выделения: Анализ главных компонент. |
Таблица показывает, какую часть дисперсии каждой из включенных в анализ переменных объясняет предлагаемая факторная модель. Например, Х1 (Число колесных тракторов) на 93,9% объясняется предложенной моделью. Значения Извлеченных общностей велико, то переменные не следует исключить из анализа.
Полная объясненная дисперсия | ||||||
Компонента |
Начальные собственные значения |
Суммы квадратов нагрузок извлечения | ||||
Итого |
% Дисперсии |
Кумулятивный % |
Итого |
% Дисперсии |
Кумулятивный % | |
1 |
2,996 |
59,923 |
59,923 |
2,996 |
59,923 |
59,923 |
2 |
1,430 |
28,607 |
88,530 |
1,430 |
28,607 |
88,530 |
3 |
,447 |
8,936 |
97,466 |
|||
4 |
,111 |
2,225 |
99,691 |
|||
5 |
,015 |
,309 |
100,000 |
|||
Метод выделения: Анализ главных компонент. |
Первая главная компонента объясняет 59,92% общей дисперсии, вторая 28,61%. Всего в модели отобрано 2 фактора, которые объясняют 88,53% общей дисперсии.
Также сколько именно нужно отобрать объясняемых переменных может показать метод «Каменистой осыпи»
Также на графике видно, что нужно взять именно 2 компоненты для анализа.
Теперь нужно определиться с интерпретацией полученных факторов. Для этого нужно обратиться к Матрице факторных нагрузок.
Матрица компонентa | ||
Компонента | ||
1 |
2 | |
x1 |
,956 |
-,159 |
x2 |
,938 |
-,154 |
x3 |
,949 |
-,248 |
x4 |
,175 |
,894 |
x5 |
,521 |
,722 |
Метод выделения: Анализ методом главных компонент. | ||
a. Извлеченных компонент: 2 |
По данным таблицы можно с легкостью сделать несколько выводов:.
Первый фактор имеет высокие корреляции с Х1, Х2, Х3. «Оборудование для обработки урожая».
Второй фактор имеет высокие корреляции с Х4, Х5. «Количество органических веществ».
Т.к. с помощью матрицы факторных нагрузок удалось дать интерпретацию факторов, то прибегать к методам Вращения не нужно.
Регрессия на отобранные компоненты:
Y – Урожайность зерновых культур (ц/га)
Х1 – Оборудование для обработки урожая
Х2 – Количество органических веществ
Коэффициентыa | ||||||
Модель |
Нестандартизованные коэффициенты |
Стандартизованные коэффициенты |
t |
Знч. | ||
B |
Стд. Ошибка |
Бета | ||||
1 |
(Константа) |
9,663 |
,392 |
24,670 |
,000 | |
REGR factor score 1 for analysis 1 |
,833 |
,402 |
,432 |
2,070 |
,055 | |
REGR factor score 2 for analysis 1 |
,657 |
,402 |
,341 |
1,633 |
,122 | |
a. Зависимая переменная: yi |
По проведенному регрессионному анализу получаем:
В нашей работе мы построили регрессионную модель урожайности зерновых культур, используя несколько методов регрессионного анализа:
Первые два метода дали нам одинаковые уравнения регрессии (Модель 1):
Проведя корреляционный анализ,
мы пришли к выводу, что нецелесообразно
применять данную модель, так как
в матрице парных коэффициентов
корреляции было выявлено наличие тесной
взаимосвязи некоторых
Сравним данные модели. Как мы уже говорили, Модель 2 больше подходит по смыслу, так как включает в себя все переменные данной нам совокупности. Первое уравнение теряет свою значимость и адекватность потому, что включает в себя только один из тесно взаимосвязанных признаков. Так же предлагаю обратить внимание на F-критерий Фишера, и коэффициент детерминации, которые говорят о значимости самого уравнения регрессии и степень соответствия между регрессионной моделью и исходными данными:
Таблица 21
Значимость F |
R-квадрат | |
Модель 1 |
0,0005 |
0,613 |
Модель 2 |
0,0147 |
0,439 |
Значимость второй модели выше, потому что в факторном анализе более узко рассматривается влияние некоторых факторов на результативный признак.
Информация о работе Регрессионный и факторный анализы показателей урожайности