Автор работы: Пользователь скрыл имя, 28 Января 2015 в 16:59, контрольная работа
Задача 2. В ходе 2%-ного выборочного обследования отелей по методу случайного бесповторного отбора сформирован нижеприведенный массив данных о списочном числе работников (чел.):
135 165 120 155 135 84 161 118 173 139 130 153 111 62 102 147 164 67 161 128 109 92 128 58 246 66 58 90 120 132 87 55 62 105 125 88 182 160 115 149 131 72 44 76 88 144 71 103
С целью выявления типичных характеристик совокупности:
1) произвести группировку предприятий по списочному числу работников, образовав группы с равными интервалами;
2) оценить для интервального ряда моду, медиану и среднюю арифметическую числа работников, показатели вариации ряда;
3) вычислить с вероятностью 0,683 предельную ошибку выборки с указанием пределов, в каких ожидается средняя численность работников отелей по региону в целом;
4) исчислить предельную ошибку и границы доли отелей с число работников свыше 101 чел., приняв Р = 0,954.
Задача 2. Численность населения региона, оцениваемого с точки зрения потенциального числа платежеспособных рекреантов, на начало отчетного года составила 816,2 тыс. чел., в т.ч. трудовых ресурсов - 392 тыс. чел. За предшествующие годы среднегодовые коэффициенты рождаемости, смертности и миграции соответственно составили (в промилле): 19,4; 10,1 и 4,7.
Определить по региону возможные коэффициенты прироста населения за отчетный год, а также перспективную численность населения и трудовых ресурсов на предстоящие 2 года, если изменение численности на¬селения описывается экспонентой, коэффициент общего прироста останется на прежнем уровне, а доля трудовых ресурсов снизится к началу искомого 1-го года на 0,8% относительно уровня отчетного года и на 1,2% относительно доли 2-го года прогноза. Построить погодовые возможные диаграммы, описывающие структуру населения региона с учетом описанных процессов.
Блок 1 3
Блок 2 7
Блок 3 16
Блок 4 19
Блок 5 42
Список использованной литературы 45
Обнаружение автокорреляции
1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения εi с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения εi (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости εi от εi-1
2. Коэффициент автокорреляции.
Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует.
Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки. Стандартная ошибка коэффициента корреляции рассчитывается по формуле:
Коэффициенты автокорреляции случайных данных должны обладать выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным
Если коэффициент автокорреляции первого порядка r1 находится в интервале:
-2.228 • 0.289 < r1 < 2.228 • 0.289
то можно считать, что данные не показывают наличие автокорреляции первого порядка.
Используя расчетную таблицу, получаем:
Свойство независимости остатков не выполняется. Присутствует автокорреляции.
3. Критерий Дарбина-Уотсона.
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
y |
y(x) |
ei = y-y(x) |
e2 |
(ei - ei-1)2 |
760 |
1029.82 |
-269.82 |
72803.11 |
0 |
780 |
1045.16 |
-265.16 |
70307.8 |
21.76 |
820 |
1060.49 |
-240.49 |
57836.33 |
608.33 |
1200 |
1075.83 |
124.17 |
15418.81 |
132980.08 |
1346 |
1091.16 |
254.84 |
64941.81 |
17073.17 |
1400 |
1106.5 |
293.5 |
86142.93 |
1494.93 |
1420 |
1121.83 |
298.17 |
88902.67 |
21.76 |
1500 |
1137.17 |
362.83 |
131645.49 |
4181.48 |
1360 |
1152.51 |
207.49 |
43053.83 |
24129.17 |
1200 |
1167.84 |
32.16 |
1034.17 |
30742.6 |
800 |
1183.18 |
-383.18 |
146824.73 |
172503.71 |
784 |
1198.51 |
-414.51 |
171820.88 |
981.92 |
|
|
|
950732.55 |
384738.9 |
Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона:
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 12 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d1 < DW и d2 < DW < 4 - d2.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 > 0.4 < 2.5, то автокорреляция остатков присутствует.
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=12 и k=1 (уровень значимости 5%) находим: d1 = 1.08; d2 = 1.36.
Поскольку 1.08 > 0.4 и 1.36 > 0.4 < 4 - 1.36, то автокорреляция остатков присутствует.
Проверка наличия гетероскедастичности.
1) Методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения ei, либо их квадраты e2i.
Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
2) При помощи
теста ранговой корреляции
Коэффициент ранговой корреляции Спирмена.
Присвоим ранги признаку ei и фактору X.
X |
ei |
ранг X, dx |
ранг ei, dy |
1 |
269.82 |
1 |
7 |
2 |
265.16 |
2 |
6 |
3 |
240.49 |
3 |
4 |
4 |
124.17 |
4 |
2 |
5 |
254.84 |
5 |
5 |
6 |
293.5 |
6 |
8 |
7 |
298.17 |
7 |
9 |
8 |
362.83 |
8 |
10 |
9 |
207.49 |
9 |
3 |
10 |
32.16 |
10 |
1 |
11 |
383.18 |
11 |
11 |
12 |
414.51 |
12 |
12 |
Матрица рангов.
ранг X, dx |
ранг ei, dy |
(dx - dy)2 |
1 |
7 |
36 |
2 |
6 |
16 |
3 |
4 |
1 |
4 |
2 |
4 |
5 |
5 |
0 |
6 |
8 |
4 |
7 |
9 |
4 |
8 |
10 |
4 |
9 |
3 |
36 |
10 |
1 |
81 |
11 |
11 |
0 |
12 |
12 |
0 |
78 |
78 |
186 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком ei и фактором X слабая и прямая
Оценка коэффициента ранговой корреляции Спирмена.
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку:
где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) = (0.05/2;10) = 2.228
Поскольку Tkp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.
Проверим гипотезу H0: гетероскедастичность отсутсвует.
Поскольку 2.228 > 0.66, то гипотеза об отсутствии гетероскедастичности принимается.
3. Тест Голдфелда-Квандта.
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению xi переменной X в этом наблюдении, т.е. σ2i = σ2x2i , i = 1,2,…,n.
Тест Голдфелда-Квандта состоит в следующем:
1. Все n наблюдений упорядочиваются по величине X.
2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k.
3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений).
4. Для сравнения соответствующих
дисперсий строится
F = S3/S1
Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = (n – c - 2m)/2.
5. Если F > Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется.
Этот же тест может использоваться при предположении об обратной пропорциональности между σi и значениями объясняющей переменной. При этом статистика Фишера имеет вид:
F = S1/S3
1. Упорядочим все значения по величине X.
2. Находим размер подвыборки k = (12 - 3)/2 = 5.
где c = 4n/15 = 4*12/15 = 3
3. Оценим регрессию для первой подвыборки.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y•t
Для наших данных система уравнений имеет вид:
5a0 + 15a1 = 4906
15a0 + 55a1 = 16310
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a0 = 159.2, a1 = 503.6
x |
y |
x2 |
y2 |
x • y |
y(x) |
(y-y(x))2 |
1 |
760 |
1 |
577600 |
760 |
662.8 |
9447.84 |
2 |
780 |
4 |
608400 |
1560 |
822 |
1764 |
3 |
820 |
9 |
672400 |
2460 |
981.2 |
25985.44 |
4 |
1200 |
16 |
1440000 |
4800 |
1140.4 |
3552.16 |
5 |
1346 |
25 |
1811716 |
6730 |
1299.6 |
2152.96 |
15 |
4906 |
55 |
5110116 |
16310 |
4906 |
42902.4 |
Здесь S1 = 42902.4
Оценим регрессию для третьей подвыборки.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y•t
Для наших данных система уравнений имеет вид:
5a0 + 50a1 = 5644
50a0 + 510a1 = 54448
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a0 = -199.2, a1 = 3120.8
x |
y |
x2 |
y2 |
x • y |
y(x) |
(y-y(x))2 |
8 |
1500 |
64 |
2250000 |
12000 |
1527.2 |
739.84 |
9 |
1360 |
81 |
1849600 |
12240 |
1328 |
1024 |
10 |
1200 |
100 |
1440000 |
12000 |
1128.8 |
5069.44 |
11 |
800 |
121 |
640000 |
8800 |
929.6 |
16796.16 |
12 |
784 |
144 |
614656 |
9408 |
730.4 |
2872.96 |
50 |
5644 |
510 |
6794256 |
54448 |
5644 |
26502.4 |
Здесь S3 = 26502.4
Число степеней свободы v1 = v2 = (n – c - 2m)/2 = (12 - 3 - 2*1)/2 = 3.5
Fkp(3.5,3.5) = 7.71
Строим обратную F-статистику:
Информация о работе Контрольная работа по дисциплине «Статистика сферы гостеприимства»