Однофакторные корреляционно - регрессионные модели и возможности их применение при анализе социально-экономических систем

Автор работы: Пользователь скрыл имя, 15 Ноября 2011 в 14:33, контрольная работа

Краткое описание

Для нашего примера
Результативный признак (у) – урожайность озимой пшеницы, ц/га
Факторный признак (х) – доза внесения органических удобрений, ц/га
1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (xi yi) (рис.1.1).

Прикрепленные файлы: 1 файл

Решение.docx

— 215.98 Кб (Скачать документ)

    Решение:

    Для нашего примера 

    Результативный  признак (у) – урожайность озимой пшеницы,      ц/га

    Факторный признак (х) – доза внесения органических удобрений, ц/га 

    Таблица 1.1. – Исходные данные для анализа

№ региона Доза внесения удобрений, ц/га

    х

Урожайность озимой пшеницы, ц/га

у

1 115 202
2 98 209
3 105 204
4 109 169
5 102 214
6 116 195
7 97 174
8 92 200
9 112 194
10 110 198
11 104 199
12 100 189
13 95 209
14 98 196
15 107 201
16 106 204
 

    1. Построим поле корреляции, для  чего отложим на плоскости  в прямоугольной системе координат  точки (xi  yi) (рис.1.1).

    Рис. 1.1. Поле корреляции

    Расположение  точек на графике не позволяет  точно определить тип уравнения  регрессии. Для выявления типа зависимости  воспользуемся экспериментальным  методом. 

    2. Для расчета параметров линейной регрессии построим расчетную таблицу (табл.1.2)

 

     

    Таблица 1.2. – Расчетные значения

х у xy х2 у2
·100%,

(Ai, %)

1 115 202 23230 13225 40804 195,255 3,339 45,493 118,266 4,233
2 98 209 20482 9604 43681 198,471 5,038 188,922 37,516 1,343
3 105 204 21420 11025 41616 197,147 3,359 76,473 0,766 0,027
4 109 169 18421 11881 28561 196,390 16,207 689,331 23,766 0,851
5 102 214 21828 10404 45796 197,715 7,610 351,371 4,516 0,162
6 116 195 22620 13456 38025 195,066 0,034 0,065 141,016 5,047
7 97 174 16878 9409 30276 198,660 14,173 451,780 50,766 1,817
8 92 200 18400 8464 40000 199,606 0,197 22,514 147,016 5,262
9 112 194 21728 12544 37636 195,823 0,940 1,575 62,016 2,220
10 110 198 21780 12100 39204 196,201 0,909 7,534 34,516 1,235
11 104 199 20696 10816 39601 197,336 0,836 14,024 0,016 0,001
12 100 189 18900 10000 35721 198,093 4,811 39,126 17,016 0,609
13 95 209 19855 9025 43681 199,039 4,766 188,922 83,266 2,980
14 98 196 19208 9604 38416 198,471 1,261 0,555 37,516 1,343
15 107 201 21507 11449 40401 196,769 2,105 33,004 8,266 0,296
16 106 204 21624 11236 41616 196,958 3,452 76,473 3,516 0,126
Итого 1666 3157 328577 174242 625035 3157,000 69,036 2187,163 769,75 27,550
Ср.зн 104,125 197,3125 20536,0625 10890,125 39064,687 х 4,315      
σ 6,936 11,692                
σ2 48,109 136,698                

 

     

    2а. Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 2, имеем:

    β= =

    a = =

    Тогда линейное уравнение парной регрессии  имеет вид:

    

    Полученное  уравнение показывает, что с увеличением  дозы внесения органических уравнений на l ц/га урожайность озимой пшеницы падает в среднем на 0,189 ц/га. 

 

    Рис. 1.2. Зависимость между дозой внесения органических удобрений и урожайностью озимой пшеницы (линейная регрессия). 

    Подставляя  в полученное уравнение регрессии  значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).

    2б.  При линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи. 
 

    Учитывая:

           ,

    оценим  тесноту линейной связи с помощью  линейного коэффициента парной корреляции

    

    Связь между факторами обратная. В соответствии со шкалой Чеддока теснота характеризуется как слабая.

    Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.

    R2=rху2·100%

    

    Следовательно, вариация урожайности картофеля на 1,3 % объясняется вариацией дозы внесения удобрений, а остальные 98,70% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.

     = = 69,036/16=4,315

    В среднем расчетные значения отклоняются  от фактических на 4,315%. Это значение не превышает допустимый предел, следовательно качество построенной модели высокое. Это, а также небольшое значение коэффициента детерминации говорит о том, что линейный тип модели не достаточно хорошо отражает представленные эмпирические данные.

    ) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:

  .=

 

    Таким образом, в среднем на 0,1% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.

     

    ) Для оценки статистической надежности результатов используем F-критерий Фишера.

    Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.

    Fфакт = = · (n-2)

    

    Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).

    В нашем примере k1=1;  k=16-1-1=14.

    Таким образом. Fтабл.=4,6 при =0,05.

    Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи. 

    2е) Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

    Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.

    Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

     ; ;

    Случайные ошибки параметров линейной регрессии  и коэффициента корреляции определяются по формулам:

 

Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.

    Если  tтабл < tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r. 

; ;

    tтабл при уровне значимости g=0,05 и числе степеней свободы равных 16-2=14 равно 2,1448 (приложение 2).

     < tтабл,    < tтабл,      < tтабл,

    следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии  принимается , т. е. r, b и a статистически незначимы.

    Для расчета доверительного интервала  определяем предельную ошибку ∆ для  каждого показателя:

    a = tтабл ma=2,1448∙217,011=98,613

    b = tтабл mb=2,1448∙(-0,189)=0,945

    Доверительные интервалы:

    Для параметра a: (118,399;  315,624)

    Для параметра b: (-1,134;  0,756)

    Анализ  верхних и нижних границ доверительных  интервалов приводит к выводу, что  с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем параметр a являются статистически незначимым, т.к. в границы доверительного интервала попадает ноль.

Информация о работе Однофакторные корреляционно - регрессионные модели и возможности их применение при анализе социально-экономических систем