Автор работы: Пользователь скрыл имя, 15 Ноября 2011 в 14:33, контрольная работа
Для нашего примера
Результативный признак (у) – урожайность озимой пшеницы, ц/га
Факторный признак (х) – доза внесения органических удобрений, ц/га
1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (xi yi) (рис.1.1).
Решение:
Для нашего примера
Результативный признак (у) – урожайность озимой пшеницы, ц/га
Факторный
признак (х) – доза внесения органических
удобрений, ц/га
Таблица 1.1. – Исходные данные для анализа
№ региона | Доза внесения
удобрений, ц/га
х |
Урожайность озимой
пшеницы, ц/га
у |
1 | 115 | 202 |
2 | 98 | 209 |
3 | 105 | 204 |
4 | 109 | 169 |
5 | 102 | 214 |
6 | 116 | 195 |
7 | 97 | 174 |
8 | 92 | 200 |
9 | 112 | 194 |
10 | 110 | 198 |
11 | 104 | 199 |
12 | 100 | 189 |
13 | 95 | 209 |
14 | 98 | 196 |
15 | 107 | 201 |
16 | 106 | 204 |
1.
Построим поле корреляции, для
чего отложим на плоскости
в прямоугольной системе
Рис. 1.1. Поле корреляции
Расположение
точек на графике не позволяет
точно определить тип уравнения
регрессии. Для выявления типа зависимости
воспользуемся
2. Для расчета параметров линейной регрессии построим расчетную таблицу (табл.1.2)
Таблица 1.2. – Расчетные значения
№ | х | у | xy | х2 | у2 | (Ai, %) |
||||
1 | 115 | 202 | 23230 | 13225 | 40804 | 195,255 | 3,339 | 45,493 | 118,266 | 4,233 |
2 | 98 | 209 | 20482 | 9604 | 43681 | 198,471 | 5,038 | 188,922 | 37,516 | 1,343 |
3 | 105 | 204 | 21420 | 11025 | 41616 | 197,147 | 3,359 | 76,473 | 0,766 | 0,027 |
4 | 109 | 169 | 18421 | 11881 | 28561 | 196,390 | 16,207 | 689,331 | 23,766 | 0,851 |
5 | 102 | 214 | 21828 | 10404 | 45796 | 197,715 | 7,610 | 351,371 | 4,516 | 0,162 |
6 | 116 | 195 | 22620 | 13456 | 38025 | 195,066 | 0,034 | 0,065 | 141,016 | 5,047 |
7 | 97 | 174 | 16878 | 9409 | 30276 | 198,660 | 14,173 | 451,780 | 50,766 | 1,817 |
8 | 92 | 200 | 18400 | 8464 | 40000 | 199,606 | 0,197 | 22,514 | 147,016 | 5,262 |
9 | 112 | 194 | 21728 | 12544 | 37636 | 195,823 | 0,940 | 1,575 | 62,016 | 2,220 |
10 | 110 | 198 | 21780 | 12100 | 39204 | 196,201 | 0,909 | 7,534 | 34,516 | 1,235 |
11 | 104 | 199 | 20696 | 10816 | 39601 | 197,336 | 0,836 | 14,024 | 0,016 | 0,001 |
12 | 100 | 189 | 18900 | 10000 | 35721 | 198,093 | 4,811 | 39,126 | 17,016 | 0,609 |
13 | 95 | 209 | 19855 | 9025 | 43681 | 199,039 | 4,766 | 188,922 | 83,266 | 2,980 |
14 | 98 | 196 | 19208 | 9604 | 38416 | 198,471 | 1,261 | 0,555 | 37,516 | 1,343 |
15 | 107 | 201 | 21507 | 11449 | 40401 | 196,769 | 2,105 | 33,004 | 8,266 | 0,296 |
16 | 106 | 204 | 21624 | 11236 | 41616 | 196,958 | 3,452 | 76,473 | 3,516 | 0,126 |
Итого | 1666 | 3157 | 328577 | 174242 | 625035 | 3157,000 | 69,036 | 2187,163 | 769,75 | 27,550 |
Ср.зн | 104,125 | 197,3125 | 20536,0625 | 10890,125 | 39064,687 | х | 4,315 | |||
σ | 6,936 | 11,692 | ||||||||
σ2 | 48,109 | 136,698 |
2а. Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 2, имеем:
β= =
a = =
Тогда линейное уравнение парной регрессии имеет вид:
Полученное
уравнение показывает, что с увеличением
дозы внесения органических уравнений
на l ц/га урожайность озимой пшеницы падает
в среднем на 0,189 ц/га.
Рис.
1.2. Зависимость между дозой
Подставляя в полученное уравнение регрессии значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).
2б.
При линейной корреляции между х и
у исчисляют парный линейный коэффициент
корреляции r. Он принимает значения
в интервале –1 £ r £ 1. Знак коэффициента
корреляции показывает направление связи:
«+» – связь прямая, «–» – связь обратная.
Абсолютная величина характеризует степень
тесноты связи.
Учитывая:
,
оценим тесноту линейной связи с помощью линейного коэффициента парной корреляции
Связь между факторами обратная. В соответствии со шкалой Чеддока теснота характеризуется как слабая.
Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.
R2=rху2·100%
Следовательно, вариация урожайности картофеля на 1,3 % объясняется вариацией дозы внесения удобрений, а остальные 98,70% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.
= = 69,036/16=4,315
В среднем расчетные значения отклоняются от фактических на 4,315%. Это значение не превышает допустимый предел, следовательно качество построенной модели высокое. Это, а также небольшое значение коэффициента детерминации говорит о том, что линейный тип модели не достаточно хорошо отражает представленные эмпирические данные.
2г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:
.=
Таким образом, в среднем на 0,1% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.
2д) Для оценки статистической надежности результатов используем F-критерий Фишера.
Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.
Fфакт = = · (n-2)
Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).
В нашем примере k1=1; k=16-1-1=14.
Таким образом. Fтабл.=4,6 при =0,05.
Т.к.
Fфакт.< Fтабл.,
то при заданном уровне вероятности g=0,05
следует принять нулевую гипотезу о статистической
незначимости уравнения регрессии и показателя
тесноты связи.
2е) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.
Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
; ;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.
Если
tтабл < tфакт,
то Но отклоняется, т.е. a, b, r не случайно отличаются
от нуля и сформировались под влиянием
систематически действующего фактора
x. Если tтабл > tфакт,
то гипотеза Но не отклоняется и признается
случайная природа формирования a, b,
r.
; ;
tтабл при уровне значимости g=0,05 и числе степеней свободы равных 16-2=14 равно 2,1448 (приложение 2).
< tтабл, < tтабл, < tтабл,
следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии принимается , т. е. r, b и a статистически незначимы.
Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:
∆a = tтабл ma=2,1448∙217,011=98,613
∆b = tтабл mb=2,1448∙(-0,189)=0,945
Доверительные интервалы:
Для параметра a: (118,399; 315,624)
Для параметра b: (-1,134; 0,756)
Анализ верхних и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем параметр a являются статистически незначимым, т.к. в границы доверительного интервала попадает ноль.