Автор работы: Пользователь скрыл имя, 19 Октября 2013 в 17:31, контрольная работа
Для описания причинно-следственной связи между явлениями и процессами используется деление статистических признаков, отражающих отдельные стороны взаимосвязанных явлений, на факторные и результативные. Факторными считаются признаки, обуславливающие изменение других, связанных с ними признаков, являющихся причинами и условиями таких изменений. Результативными являются признаки, изменяющимися под воздействием факторных.
Введение.
1. 1. Функциональная связь.
1.2. Стохастическая связь.
1.2.1 Виды стохастических связей.
1.2.2. Стохастические методы моделирования связи.
1.2.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа.
2. Практическая часть. Вариант №2
Литература
Коэффициент парной линейной регрессии a1 имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Вышеприведенное уравнение показывает среднее значение изменения результативного признака у при изменении факторного признака х на одну единицу его измерения, то есть вариацию у, приходящуюся на единицу вариации х. Знак a1 указывает направление этого изменения.
Параметры уравнения a0 , a1 находят методом наименьших квадратов (метод решения систем уравнений, при котором в качестве решения принимается точка минимума суммы квадратов отклонений), то есть в основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных yi от выравненных ŷ :
S(yi – ŷ)2 = S(yi – a0 – a1xi)2 ® min [9]
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
.
Решим эту систему в общем виде:
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
Определив значения a0 , a1 и подставив их в уравнение связи ŷ = a0 + a1x , находим значения ŷ , зависящие только от заданного значения х.
Рассмотрим построение однофакторного уравнения регрессии зависимости работающих активов у от капитала х (см. таблица 1). Рассмотрим, что представляет собой эта значимость. Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменной. При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимости включения переменной используется статистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных, статистикой значимости исключения будет. Пошаговая процедура построения модели. Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно построение последовательное построение модели добавлением и удалением блоков переменных. Но мы рассмотрим только работу с отдельными переменными. По умолчанию программа включает все заданные переменные.
Здесь представлены показатели 32 банков: размер капитала и работающих активов. Передо мной стоит задача определить, есть ли зависимость между этими двумя признаками и, если она существует, определить форму этой зависимости, то есть уравнение регрессии.
За факторный признак я взяла размер капитала банка, а за результативный признак – работающие активы. [11]
Сопоставление данных параллельных рядов признаков х и у показывает, что с убыванием признака х (капитал), в большинстве случаев убывает и признак у (работающие активы). Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Следовательно, можно предположить, что между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.
Для уточнения
формы связи между
Анализируя
поле корреляции, можно предположить,
что возрастание признака у идет
пропорционально признаку х. В основе
этой зависимости лежит
ŷ = a0 + a1x,
где ŷ - теоретические расчётные значения результативного признака (работающие активы), полученные по уравнению регрессии;
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х – капитал исследуемых банков.
Пользуясь вышеуказанными формулами для вычисления параметров линейного уравнения регрессии и расчётными значениями из таблицы 1, получаем:
Следовательно, регрессионная модель зависимости работающих активов от капитала банков может быть записана в виде конкретного простого уравнения регрессии:
.[4]
Это уравнение
характеризует зависимость
Но для того, чтобы применить мою формулу, надо рассчитать, насколько она приближенна к реальности, то есть проверить ее адекватность.
2. Практическая часть. Вариант №2
X |
Y |
479,7 |
36,3 |
489,7 |
36,6 |
503,8 |
37,3 |
524,9 |
38,9 |
542,3 |
39,6 |
580,8 |
42,6 |
616,3 |
44,2 |
646,8 |
46,9 |
673,5 |
46,9 |
701,3 |
49,0 |
722,5 |
50,0 |
751,6 |
49,4 |
779,2 |
51,8 |
810,3 |
55,4 |
865,3 |
59,3 |
858,4 |
58,7 |
875,8 |
60,9 |
906,8 |
63,8 |
942,9 |
67,5 |
988,8 |
73,6 |
1015,5 |
76,7 |
1021,6 |
77,9 |
1049,3 |
82,6 |
1058,3 |
84,2 |
1095,4 |
88,5 |
Необходимо:
Решение
1). Уравнение выборочной линейной регрессии имеет вид
Создаем файл Excel, вводим исходные данные.
X |
У |
479,7 |
36,3 |
489,7 |
36,6 |
503,8 |
37,3 |
524,9 |
38,9 |
542,3 |
39,6 |
580,8 |
42,6 |
616,3 |
44,2 |
646,8 |
46,9 |
673,5 |
46,9 |
701,3 |
49,0 |
722,5 |
50,0 |
751,6 |
49,4 |
779,2 |
51,8 |
810,3 |
55,4 |
865,3 |
59,3 |
858,4 |
58,7 |
875,8 |
60,9 |
906,8 |
63,8 |
942,9 |
67,5 |
988,8 |
73,6 |
1015,5 |
76,7 |
1021,6 |
77,9 |
1049,3 |
82,6 |
1058,3 |
84,2 |
1095,4 |
88,5 |
Используя инструмент анализа данных Регрессия (смотри Приложение 2) получим:
ВЫВОД ИТОГОВ |
|||||||||||
Регрессионная статистика |
|||||||||||
Множественный R |
0,97817227 |
||||||||||
R-квадрат |
0,956820989 |
||||||||||
Нормированный R-квадрат |
0,954943641 |
||||||||||
Стандартная ошибка |
3,44040458 |
||||||||||
Наблюдения |
25 |
||||||||||
Дисперсионный анализ |
|||||||||||
df |
SS |
MS |
F |
Значимость F |
|||||||
Регрессия |
1 |
6032,604775 |
6032,604775 |
509,6662072 |
3,39466E-17 |
||||||
Остаток |
23 |
272,2368246 |
11,83638368 |
||||||||
Итого |
24 |
6304,8416 |
|||||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | ||||
Y-пересечение |
-5,375651389 |
2,836333096 |
-1,895282115 |
0,070692124 |
-11,2430534 |
0,491750623 |
-11,2430534 |
0,491750623 | |||
Переменная X 1 |
0,079637312 |
0,003527554 |
22,57578807 |
3,39466E-17 |
0,07234001 |
0,086934613 |
0,07234001 |
0,086934613 | |||