Функциональные и стохастические связи

Автор работы: Пользователь скрыл имя, 19 Октября 2013 в 17:31, контрольная работа

Краткое описание

Для описания причинно-следственной связи между явлениями и процессами используется деление статистических признаков, отражающих отдельные стороны взаимосвязанных явлений, на факторные и результативные. Факторными считаются признаки, обуславливающие изменение других, связанных с ними признаков, являющихся причинами и условиями таких изменений. Результативными являются признаки, изменяющимися под воздействием факторных.

Содержание

Введение.
1. 1. Функциональная связь.
1.2. Стохастическая связь.
1.2.1 Виды стохастических связей.
1.2.2. Стохастические методы моделирования связи.
1.2.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа.
2. Практическая часть. Вариант №2
Литература

Прикрепленные файлы: 1 файл

эконометрика контрольная.doc

— 282.00 Кб (Скачать документ)

Коэффициент парной линейной регрессии a1  имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак a1 указывает направление этого изменения.

Параметры уравнения a0 , a1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных ŷ :

S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min [9]

Для нахождения минимума данной функции приравняем к нулю ее частные производные  и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:

 

    .

Решим эту систему в  общем виде:


Параметры уравнения парной линейной регрессии иногда удобно исчислять  по следующим формулам, дающим тот  же результат:

Определив значения a0 , a1  и подставив их в уравнение  связи   ŷ = a0 + a1x , находим значения ŷ , зависящие только от заданного  значения х.

Рассмотрим  построение однофакторного уравнения регрессии зависимости работающих активов у от капитала х (см. таблица 1). Рассмотрим, что представляет собой эта значимость. Обозначим  коэффициент детерминации, полученный при исключении из правой части уравнения переменной. При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимости включения переменной используется статистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных, статистикой значимости исключения будет. Пошаговая процедура построения модели. Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно построение последовательное построение модели добавлением и удалением блоков переменных. Но мы рассмотрим только работу с отдельными переменными. По умолчанию программа включает все заданные переменные.

Здесь представлены показатели 32 банков: размер капитала и работающих активов. Передо мной стоит  задача определить, есть ли зависимость  между этими двумя признаками и, если она существует, определить форму этой зависимости, то есть уравнение регрессии.

За факторный  признак я взяла размер капитала банка, а за результативный признак  – работающие активы. [11]

Сопоставление данных параллельных рядов признаков х и у показывает, что с убыванием признака х (капитал), в большинстве случаев убывает и признак у (работающие активы). Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).

Следовательно, можно предположить, что между  х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.

Для уточнения  формы связи между рассматриваемыми признаками я использовала графический  метод. Я нанес на график точки, соответствующие значениям х и у, и получила корреляционное поле (см. график 1). Метод включения и исключения переменных состоит в следующем. Из множества факторов, рассматриваемых исследователем как возможные аргументы регрессионного уравнения, отбирается один, который более всего связан корреляционной зависимостью. Далее проводится та же процедура при двух выбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения. Замечание: во избежание зацикливания процесса включения исключения значимость включения устанавливается меньше значимости исключения. Переменные, порождаемые регрессионным уравнением. Сохранение переменных, порождаемых регрессией, производится подкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оценены прогнозные значения зависимой переменной, причем они могут быть вычислены и там, где значения определены, и там где они не определены.

Анализируя  поле корреляции, можно предположить, что возрастание признака у идет пропорционально признаку х. В основе этой зависимости лежит прямолинейная  связь, которая может быть выражена простым линейным уравнением регрессии:

 

ŷ = a0 + a1x,

где ŷ - теоретические  расчётные значения результативного  признака (работающие активы), полученные по уравнению регрессии;

     a0 , a1 -  коэффициенты (параметры) уравнения  регрессии;

     х  – капитал исследуемых банков.

Пользуясь вышеуказанными формулами для вычисления параметров линейного уравнения регрессии и расчётными значениями из таблицы 1, получаем:

 

 

Следовательно, регрессионная модель зависимости  работающих активов от капитала банков может быть записана в виде конкретного  простого уравнения регрессии:

.[4]

Это уравнение  характеризует зависимость работающих активов от капитала банка. Расчётные  значения ŷ , найденные по этому уравнению, приведены в таблице 1. Правильность расчёта параметров уравнения регрессии  может быть проверена сравниванием сумм ∑у = ∑ŷ . В моем случае эти суммы равны. Однако при небольшой взаимосвязи между переменными, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументами в правой части уравнения могут происходить странные вещи. Надежность и значимость коэффициента регрессии. Здесь  обозначен коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята другая переменная. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость - вероятность случайно при нулевом регрессионном коэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное. Значимость включения переменной в регрессию. При последовательном подборе переменных предусмотрена автоматизация, основанная на значимости включения и исключения переменных.

Но для того, чтобы применить мою формулу, надо рассчитать, насколько она приближенна  к реальности, то есть проверить  ее адекватность.

 

 

 

2. Практическая  часть.  Вариант №2

 

 

X

Y

479,7

36,3

489,7

36,6

503,8

37,3

524,9

38,9

542,3

39,6

580,8

42,6

616,3

44,2

646,8

46,9

673,5

46,9

701,3

49,0

722,5

50,0

751,6

49,4

779,2

51,8

810,3

55,4

865,3

59,3

858,4

58,7

875,8

60,9

906,8

63,8

942,9

67,5

988,8

73,6

1015,5

76,7

1021,6

77,9

1049,3

82,6

1058,3

84,2

1095,4

88,5


 

 

 

Необходимо:

  1. определить уравнение регрессии Y по X, сделать вывод по коэффициенту регрессии;
  2. оценить тесноту и направление связи между переменными с помощью коэффициента корреляции;
  3. определить коэффициент детерминации R² и пояснить его смысл;
  4. проверить значимость уравнения регрессии на 5 %-ном уровне по F-критерию;
  5. рассчитать среднюю ошибку аппроксимации;
  6. построить корреляционное поле и линию регрессии.

 

 

 

Решение

1).  Уравнение выборочной линейной регрессии имеет вид

Создаем файл Excel, вводим исходные данные.

 

X

У

479,7

36,3

489,7

36,6

503,8

37,3

524,9

38,9

542,3

39,6

580,8

42,6

616,3

44,2

646,8

46,9

673,5

46,9

701,3

49,0

722,5

50,0

751,6

49,4

779,2

51,8

810,3

55,4

865,3

59,3

858,4

58,7

875,8

60,9

906,8

63,8

942,9

67,5

988,8

73,6

1015,5

76,7

1021,6

77,9

1049,3

82,6

1058,3

84,2

1095,4

88,5


 

 

 

 

 

 

 

 

 

 

 

Используя инструмент анализа данных Регрессия  (смотри Приложение 2) получим:

ВЫВОД ИТОГОВ

               
                 

Регрессионная статистика

             

Множественный R

0,97817227

             

R-квадрат

0,956820989

             

Нормированный R-квадрат

0,954943641

             

Стандартная ошибка

3,44040458

             

Наблюдения

25

             
                 

Дисперсионный анализ

             
 

df

SS

MS

F

Значимость F

     

Регрессия

1

6032,604775

6032,604775

509,6662072

3,39466E-17

     

Остаток

23

272,2368246

11,83638368

         

Итого

24

6304,8416

           
                 
 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-5,375651389

2,836333096

-1,895282115

0,070692124

-11,2430534

0,491750623

-11,2430534

0,491750623

Переменная X 1

0,079637312

0,003527554

22,57578807

3,39466E-17

0,07234001

0,086934613

0,07234001

0,086934613

 
 

Информация о работе Функциональные и стохастические связи