Автор работы: Пользователь скрыл имя, 24 Декабря 2013 в 16:14, курсовая работа
Целью данной работы является ознакомление с материалами по теме: «Статистика потребления населением товаров и услуг», овладение теоретическими знаниями и применение их на практике.
Задача: во – первых, - раскрыть основные задачи соответствующего раздела статистики, дать определение основных понятий и категорий, характеризующих исследуемое явление; во – вторых, - описать систему статистических показателей и методы исследования динамики этих показателей; в – третьих, - решить задачи в соответствии с номером варианта.
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 10 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d1 < DW и d2 < DW < 4 - d2.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 > 0.49 < 2.5, то автокорреляция остатков присутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=10 и k=1 (уровень значимости 5%) находим: d1 = 1.08; d2 = 1.36.
Поскольку 1.08 < 0.49 и 1.36 < 0.49 < 4 - 1.36, то автокорреляция остатков присутствует.
Очевидно, что потребительские расходы зависят от величины дохода. Проверим это предположение с помощью корреляционно-регрессионного анализа.
Таблица 10
Среднедушевые доходы и расходы в ВО, руб.
Период |
Доходы, X |
Расходы, Y |
2000 |
2 023 |
1169 |
2001 |
2 719 |
1561 |
2002 |
3 481 |
1992 |
2003 |
4 411 |
2432 |
2004 |
5 245 |
2965 |
2005 |
6 345 |
3585 |
2006 |
8 682 |
4623 |
2007 |
10 521 |
5806 |
2008 |
12 230 |
7153 |
2009 |
12 239 |
7259 |
2010 |
14 115 |
8624 |
2011 |
15 638 |
10050 |
Уравнение парной регрессии.
Использование графического метода.
Этот метод
применяют для наглядного изображения
формы связи между изучаемыми
экономическими показателями. Для этого
в прямоугольной системе
Совокупность
точек результативного и
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Здесь ε - случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование
переменных. Например, функция суммарного
потребления – это попытка
общего выражения совокупности
решений отдельных индивидов
о расходах. Это лишь аппроксимация
отдельных соотношений,
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками
параметров α и β
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Для оценки параметров α и β - используют МНК (метод наименьших квадратов). Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии.
Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (ε) и независимой переменной (x).
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
12a + 97649 b = 57219
97649 a + 1040043677 b = 619004763
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.625, a = -317.4446
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.625 x - 317.4446
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Для расчета параметров регрессии построим расчетную таблицу (табл. 11)
Таблица 11
Расчетные данные
x |
y |
x2 |
y2 |
x • y |
2023 |
1169 |
4092529 |
1366561 |
2364887 |
2719 |
1561 |
7392961 |
2436721 |
4244359 |
3481 |
1992 |
12117361 |
3968064 |
6934152 |
4411 |
2432 |
19456921 |
5914624 |
10727552 |
5245 |
2965 |
27510025 |
8791225 |
15551425 |
6345 |
3585 |
40259025 |
12852225 |
22746825 |
8682 |
4623 |
75377124 |
21372129 |
40136886 |
10521 |
5806 |
110691441 |
33709636 |
61084926 |
12230 |
7153 |
149572900 |
51165409 |
87481190 |
12239 |
7259 |
149793121 |
52693081 |
88842901 |
14115 |
8624 |
199233225 |
74373376 |
121727760 |
15638 |
10050 |
244547044 |
101002500 |
157161900 |
97649 |
57219 |
1040043677 |
369645551 |
619004763 |
Параметры уравнения
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X весьма высокая и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 0.62 x -317.44
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент
регрессии b = 0.62 показывает среднее
изменение результативного
Коэффициент a = -317.44 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в
уравнение регрессии
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.
Коэффициент эластичности.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.
Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.
Коэффициент эластичности находится по формуле:
В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.
Бета – коэффициент
Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
Т.е. увеличение x на величину среднеквадратического отклонения Sx приведет к увеличению среднего значения Y на 1 среднеквадратичного отклонения Sy.
Ошибка аппроксимации.
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации
в пределах 5%-7% свидетельствует о
хорошем подборе уравнения
Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 1.
Полученная величина свидетельствует о том, что фактор x существенно влияет на y
Для любой
формы зависимости теснота
Данный коэффициент
является универсальным, так как
отражает тесноту связи и точность
модели, а также может использоваться
при любой форме связи
В отличие
от линейного коэффициента корреляции
он характеризует тесноту
Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.
Для оценки качества параметров регрессии построим расчетную таблицу
Таблица 12
Расчетные данные
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
2023 |
1169 |
946.88 |
12954600.56 |
49335.98 |
37386091.17 |
0.19 |
2719 |
1561 |
1381.87 |
10286452.56 |
32088.76 |
29359239.17 |
0.11 |
3481 |
1992 |
1858.1 |
7707564.06 |
17929.54 |
21682216.17 |
0.0672 |
4411 |
2432 |
2439.33 |
5458064.06 |
53.68 |
13886181.17 |
0.00301 |
5245 |
2965 |
2960.56 |
3251710.56 |
19.74 |
8366074.17 |
0.0015 |
6345 |
3585 |
3648.03 |
1400080.56 |
3972.98 |
3212757.51 |
0.0176 |
8682 |
4623 |
5108.6 |
21097.56 |
235809.12 |
296571.01 |
0.11 |
10521 |
5806 |
6257.93 |
1076925.06 |
204244.06 |
5681469.51 |
0.0778 |
12230 |
7153 |
7326.02 |
5687032.56 |
29935.44 |
16749238.34 |
0.0242 |
12239 |
7259 |
7331.64 |
6203835.56 |
5277.06 |
16822985.84 |
0.01 |
14115 |
8624 |
8504.1 |
14866808.06 |
14376.15 |
35731502.51 |
0.0139 |
15638 |
10050 |
9455.94 |
27896883.06 |
352908.83 |
56258750.34 |
0.0591 |
97649 |
57219 |
57219 |
96811054.25 |
945951.35 |
245433076.92 |
0.68 |
Информация о работе Статистика потребления населением товаров и услуг