Построение графика зависимости признаков по теоретическим частота

Автор работы: Пользователь скрыл имя, 11 Октября 2012 в 15:16, курсовая работа

Краткое описание

В современном обществе важную роль в механизме управления экономикой выполняет статистика. Она осуществляет сбор, научную обработку, обобщение и анализ информации, характеризующей развитие экономики страны, культуры и уровня жизни населения.

Содержание

ВВЕДЕНИЕ______________________________________________________
1. Виды и способы наблюдения_____________________________________
2. Построение вариационных рядов распределения____________________
3. Анализ вариационных рядов распределения________________________
4. Построение рядов распределения____________________________________
4.1 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)____________________________________
4.2 Нахождение эмпирической функции, построение ее графика____
4.3 Определение теоретических частот по закону нормального распределения. Построение графиков._______________________________
4.4 Проверка гипотезы о подчинение изучаемых признаков нормальному закону распределения_________________________________
5. Оценка параметров генеральной совокупности на основе выборочных данных__________________________________________________________
6. Корреляционно-регрессионный анализ_____________________________
6.1. Отбор факторов в регрессионную модель____________________
6.2. Расчет парного коэффициента корреляции. Анализ зависимости между переменными____________________________________________________
6.3. Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов_______________________
6.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции______________________________________________________
6.5. Построение графика зависимости признаков по теоретическим частотам________________________________________________________
ЗАКЛЮЧЕНИЕ__________________________________________________

Прикрепленные файлы: 1 файл

основная часть.doc

— 562.00 Кб (Скачать документ)

Относительное линейное отклонение для выборки по объему кредитных вложений равно:

%

Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:

Тогда, коэффициент вариации для выборки по объему кредитных вложений равен:

%

Коэффициент вариации для выборки по объему кредитных вложений больше, чем 33% (равен 59,1 %), следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

4. Построение рядов распределения.

4.1 Определение количественных характеристик распределения  (показателей асимметрии и эксцесса).

 

При анализе данных важно представить  не только размер вариации, но и то, как распределены единицы совокупности по всему диапазону значений признака.

Показатели асимметрии и эксцесса используются для количественной оценки симметричности.

Для расчета показателя асимметрии используют формулу:

,

где M3 – центральный момент третьего порядка;

σ – среднее квадратическое отклонение.

В свою очередь центральный  момент третьего порядка рассчитывается по формуле:

Для того, чтобы определить, является ли асимметрия существенной или не существенной, рассчитывается отклонение показателя асимметрии к среднеквадратическому отклонению. Для этого используют соотношение: ,   где As – показатель асимметрии;  - средняя квадратическая ошибка отклонения асимметрии, которая рассчитывается по формуле:

,

    где  n – число единиц в совокупности.

Данное соотношение меньше 3, из этого следует, что асимметрия признается несущественной.

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Расчет производится по следующей формуле:

,

где  M4 – центральный момент четвертого порядка;

σ – среднее квадратическое отклонение.

Момент четвертого порядка  рассчитывается как:

Показатель эксцесса меньше 0, из этого следует что распределение плосковершинное.

4.2 Нахождение эмпирической функции, построение ее графика.

 

 

Построим графики эмпирического  распределения банков в зависимости  от выбранных признаков. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

4.3 Определение теоретических частот по закону нормального распределения. Построение графиков.

 

 

Для удобства вычислений вероятностей случайные величины нормируются, а затем по специальным таблицам находится плотность распределения нормируемой случайной величины. Для этого используются следующие формулы:

,

где t – нормируемое отклонение.

Теоретические частоты  находятся по формуле:

,

где f – эмпирические частоты;

k – величина интервала.

Определим теоретические  частоты для выборки банков по объему кредитных вложений.

Таблица 5 – Расчет теоретических частот по объему кредитных вложений.

№ п/п

Группы банков по объему кредитных  вложений, млн. руб.

Число банков, fi

Середина интервала, xi

Теоретические частоты,

1

34-100

10

67

-1,02

0,2371

5

2

101-167

7

134

-0,34

0,3765

8

3

168-234

6

201

0,34

0,3765

8

4

235-301

4

268

1,02

0,2371

5

5

302-368

1

335

1,69

0,0957

2

6

369-435

2

402

2,37

0,0241

0

Итого

-

30

-

-

-

28


 

По найденным теоретическим  частотам построим график теоретического распределения банков по объему кредитных  вложений.

При совмещении графиков теоретического и эмпирического распределения получится следующее:

4.4  Проверка гипотезы о подчинение изучаемых признаков нормальному закону распределения.

 

Так как все предположения  о характере распределения лишь гипотезы, а не категорические утверждения, то они должны быть подвергнуты статистической проверке с помощью одного из критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между частотами эмпирического и теоретического распределений следует признать несущественными, то есть случайными, а когда существенными (в тех случаях, когда неверно выдвинута гипотеза о законе распределения).

Для проверки гипотезы о  подчинении изучаемых признаков  нормальному закону распределения  воспользуемся критерием Романовского, который рассчитывается по формуле:

,

где h – число групп;

 l – число независимых параметров, которые необходимо знать, чтобы построить кривую теоретического распределения.

В свою очередь  рассчитывается по формуле:

,

где  fi – эмпирические частоты распределения;

fi' – теоретические частоты распределения.

Таблица 6 – Расчет значения критерия Пирсона для распределения по объему кредитных вложений.

№ п/п

Группы банков по объему кредитных вложений, млн. руб.

Эмпирические частоты, fi

Теоретические частоты,

1

34-100

10

5

25

5

2

101-167

7

8

1

0,125

3

168-234

6

8

4

0,5

4

235-301

4

5

1

0,2

5

302-368

1

2

1

0,5

6

369-435

2

0

4

0

Итого

-

30

28

-

6,325


 

Рассчитаем значение критерия Романовского для распределения  по объему кредитных вложений:

Так как критерий Романовского меньше 3 (равен 1,357), то гипотеза о распределении банков в зависимости от объемов кредитных вложений по закону нормального распределения принимается.

5. Оценка параметров генеральной совокупности на основе выборочных данных.

 

Расхождение между генеральной  и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:

,

где n – число единиц в выборочной совокупности;

N – число единиц в генеральной совокупности.

Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности

Суждение о том, что  средняя в генеральной совокупности будет лежать в пределах можно гарантировать не с абсолютной точностью, а с некоторой вероятностью. Для этого рассчитывают предельную ошибку выборки по формуле: ,

где  t – коэффициент доверия, определяемый в зависимости от вероятности по таблицам.

Таким образом, показатели генеральной совокупности для генеральной  средней при заданной вероятности  определяются по показателям выборочной совокупности следующим образом:

Рассчитаем среднюю  ошибку для выборки по объему кредитных  вложений:

(млн.руб.)

Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.

(млн.руб.)

Таким образом, границы, в которых с вероятностью 0,95 будет  находиться среднее значение показателя объемов кредитных вложений, принимают  вид:

      (млн.руб.)

      (млн.руб.)

 

 

6. Корреляционно-регрессионный  анализ.

6.1. Отбор факторов в регрессионную модель.

 

Примем в качестве факторного признака объемы кредитных  вложений, а в качестве результативного  – прибыль. Данный выбор обусловлен спецификой банковской деятельности, где прибыль, в том числе, складывается и из процентов, за выданные кредиты.

6.2. Расчет парного коэффициента корреляции. Анализ зависимости между переменными.

 

Парный коэффициент  корреляции можно вычислить по следующей формуле:

,

где n – число единиц в выборочной совокупности;

xi – значение факторного признака;

yi – значение результативного признака.

Таблица 7 – Расчет парного коэффициента корреляции для выборочной совокупности.

№ п/п

Название банка

Кредитные вложения, млн. руб.

xi

Прибыль, млн. руб.

yi

xi2

yi2

xyi

1

Нефтехимбанк

252

38

63504

1444

9576

2

Ланта-банк

201

3

40401

9

603

3

Совфинтрейд

276

33

76176

1089

9108

4

Еврофинанс

431

-2

185761

4

-862

5

Уралпромстробанк

73

25

5329

625

1825

6

МАПО-Банк

192

47

36864

2209

9024

7

Тори-Банк

51

15

2601

225

765

8

Петровский

368

9

135424

81

3312

9

Нефтепромбанк

156

31

24336

961

4836

10

Оргбанк

253

8

64009

64

2024

11

Евразия-Центр

68

17

4624

289

1156

12

Гарантия

80

18

6400

324

1440

13

Промрадтехбанк

71

50

5041

2500

3550

14

Металлинвестбанк

207

29

42849

841

6003

15

Прио-Внешторг-банк

103

30

10609

900

3090

16

Камчаткомагропром-банк

66

92

4356

8464

6072

17

Тайдон

249

36

62001

1296

8964

18

Роспромстройбанк

122

43

14884

1849

5246

19

Тагилбанк

108

-9

11664

81

-972

20

Подольск-промкомбанк

70

55

4900

3025

3850

21

Мосстройбанк

64

0,5

4096

0,25

32

22

Волгопромбанк

183

7

33489

49

1281

23

Нижний Новгород

34

6

1156

36

204

24

Ставрополье

185

28

34225

784

5180

25

Колыма-банк

110

20

12100

400

2200

26

Экопромбанк

119

1

14161

1

119

27

Преображение

198

11

39204

121

2178

28

Краснодарбанк

394

15

155236

225

5910

29

МЕНАТЕП Санкт-Петербург

128

14

16384

196

1792

30

Ноябрьск-нефте-комбанк

49

22

2401

484

1078

Итого

 

4861

692,5

1114185

28576,25

98584


 

Таким образом, парный коэффициент  корреляции будет равен:

Парный коэффициент  корреляции, равный -0,21247, показывает, что связь между факторным признаком, т.е. объемом кредитных вложений, и результативным, т.е. прибылью, обратная (так как коэффициент имеет отрицательное значение), и практически отсутствует (что определилось по шкале количественных характеристик тесноты связи Чеддока – 0,1-03 – слабая корреляционная связь).

6.3. Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов.

 

Определим вид зависимости  между объемом кредитных вложений и размером прибыли, используя графический метод.

 

По графику можно  предположить, что зависимость прибыли  от объема кредитных вложений все больше приближается к уравнению прямой. Следовательно, сумма квадратов отклонений эмпирических точек от теоретических принимает вид:

В этом случае коэффициенты уравнения регрессии рассчитываются по формулам:

 

 

Рассчитаем данные коэффициенты:

 

 

Таким образом, уравнение регрессии принимает  вид:

6.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции.

 

Поскольку анализ взаимосвязей между явлениями проводят в выборочной совокупности, а данные необходимо обобщить на всю генеральную совокупность, то необходимо проверить коэффициенты уравнения регрессии на статистическую значимость.

При объеме выборки меньше или равном 30 единицам значимость коэффициентов уравнения регрессии определяют с помощью t-критерия Стьюдента, который находится по формуле (для коэффициента a):

,

где a – коэффициент уравнения регрессии;

n – число единиц совокупности;

- остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x), которое находится по формуле:

,

где yi – эмпирические значения результативного признака;

- теоретические значения результативного  признака, найденные по уравнению  регрессии;

n – число единиц в совокупности.

Проверка значимости для коэффициента b осуществляется по формуле:

Информация о работе Построение графика зависимости признаков по теоретическим частота