Выборочное наблюдение в статтистике

Автор работы: Пользователь скрыл имя, 25 Октября 2014 в 23:24, курсовая работа

Краткое описание

Изучение статистических совокупностей, состоящих из множеств единиц, связано с большими трудовыми и материальными затратами.
С давних пор представлялось заманчивым не изучать все единицы совокупности, а отобрать лишь некоторую часть, по которой можно было бы судить о свойствах всей совокупности в целом.

Содержание

Введение…………………………………………………………………………..3
1.Теоретические аспекты статистического наблюдения……………………....5
1.1.Понятие и значение выборочного наблюдения………………………….5
1.2.Виды отбора при выборочном наблюдении……………………………….
1.3.Ошибки выборочного отбора……………………………………………..
2.Способы отбора, обеспечивающие репрезентативность…………………....
2.1.Определение и оценка существенности расхождения выборочных средних………....…………………………………………………………………………
2.2.Малые выборки………………………………………………………………
Заключение……………………………………………………………………….
Список использованных источников…………………………………………...

Прикрепленные файлы: 1 файл

курсовая по статистике.docx

— 129.40 Кб (Скачать документ)

 

 

Если  n  достаточно велико, то  близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.

Средняя ошибка выборочной доли определяется по формуле

где  – дисперсия выборочной доли.

Для показателя доли альтернативного признака (выборочной доли) дисперсия определяется по формуле

Приведенная формула средней ошибки выборочной доли применяется при повторном отборе.

При бесповторном отборе численность генеральной совокупности сокращается, поэтому дисперсия умножается на коэффициент  Формулы расчета средних ошибок выборочной доли для различных способов отбора единиц из генеральной совокупности приведены в табл. 2.

 

 

 

                                                                                                       Таблица 1.2

Формулы расчета средних ошибок выборочной доли и выборочной средней8:

Метод

 отбора выборки

Средняя ошибка

выборочной доли

выборочной средней

Механический и собственно–случайный повторный

 

 

     Серийный при                     б бесповторном отборе              с      серий

Типический при повторном отборе случайных групп

 

 

Типический при бесповторном случайном отборе внутри групп

 

 


 

 

 

 

где            N     – численность генеральной совокупности;

                   – межсерийная дисперсия выборочной доли;

                 r      – число отобранных  серий;

                 R     – число серий в  генеральной совокупности;

                 – средняя из групповых дисперсий выборочной доли;

                  – дисперсия признака  x;

                   – межсерийная дисперсия выборочных средних;

                  – средняя из групповых дисперсий выборочной средней.

Дисперсии в формулах расчета средних ошибок выборочной доли в табл.1.2 определяется следующим образом:

      – межсерийная дисперсия выборочной доли

где    wj  –  выборочная доля в   j  -й серии;

         –  средняя величина доли во всех сериях;

 

     – средняя из групповых дисперсий

где      wj     –  выборочная доля в  j  -й  типической группе;

             nj   –  число единиц  в  j  -й  типической группе;

            k      – число типических  групп.

Предельное значение ошибки выборочной доли определяется по следующей формуле:

Величина средней ошибки выборочной доли  зависит от доли изучаемого признака в генеральной совокупности, числа наблюдений и способа отбора единиц из генеральной совокупности для наблюдения, а величина предельной ошибки    зависит еще и от величины вероятности  , с которой гарантируются результаты выборочного наблюдения.

Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Доля альтернативного признака в генеральной совокупности равна

Ошибка  выборочной  средней

Ошибка выборочной средней  представляет собой расхождение (разность) между выборочной средней  и генеральной средней  , возникающее вследствие не сплошного выборочного характера наблюдения9. Величина ошибки выборочной средней определяется как предел отклонения  от  , гарантируемый с заданной вероятностью:

где   – средняя ошибка выборочной средней.

При повторном отборе средняя ошибка определяется следующим образом:

где  – средняя величина дисперсии количественного признака  , которая рассчитывается по формуле средней арифметической невзвешенной

или средней арифметической взвешенной

где     fi     – статистический вес.

Формулы расчета средней ошибки выборочной средней для различных способов отбора выборочной совокупности приведены в табл.1.2.

Межсерийная дисперсия выборочных средних  и средняя из выборочных дисперсий типических групп вычисляются следующим образом:

где  – среднее значение показателя    в  j - й серии;

      – дисперсия признака   x   в   j - й  типической группе;

       nj    – число единиц в   j  - й  типической группе.

Предельная ошибка выражается следующим образом:

и зависит от вариации изучаемого признака в генеральной совокупности, объема и доли выборки, способа отбора единиц из генеральной совокупности и от величины вероятности, с которой гарантируются результаты выборочного наблюдения.      

Средняя величина количественного признака в генеральной совокупности определяется с учетом предельной ошибки выборочной средней 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.Способы отбора, обеспечивающие репрезентативность

 

2.1.Определение и оценка существенности расхождения выборочных средних

К расчетам ошибок случайной выборки прибегают не только для того, чтобы оценить степень репрезентативности выборочных данных, но и для того, чтобы сравнить между собой средние величины данного признака по двум совокупностям.

Известно, например, что средний расход сырья на единицу продукции при существующем методе производства составляет 2,8 условных единиц. После внесения изменений в существующую технологию изготовления продукции по результатам проверки достаточно большой партии изделий средний расход сырья на единицу продукции составил 2,6 условные единицы. Средняя ошибка выборки оказалась равной 0,1. Возникает вопрос, действительно ли применение нового метода обработки приводит к снижению материалоемкости продукции?

Нулевая гипотеза состоит в том, что между новым и существующим методами производства изделий отсутствуют существенные различия с точки зрения влияния их на материалоемкость, т.е. что между генеральными средними при старом и новом методах производства нет существенной разницы, а отклонение выборочной средней от достигнутого уровня при существующем методе обусловлено только случайностями выборки, т.е. означает, что , где и - средний расход сырья на единицу продукции соответственно при существующем и новом методах производства.

Альтернативная гипотеза может быть сформулирована двояко:

1. Применение нового метода  обработки приводит к изменению  расхода сырья на единицу продукции, т.е. состоит в том, что . Примем уровень значимости равным 0,05, тогда и критическая область соответственно задается неравенством . По таблицам интегральной функции Лапласа определяем коэффициент доверия t=1,96. Таким образом, величина предельного расхождения двух средних с вероятностью, равной 0,95, не должна превышать . Следовательно, с вероятностью 0,95 доверительные пределы для генеральной средней при новом методе будут равны .

Средний расход материала при применении новой технологии составляет 2,6, т.е. попадает в критическую область. Следовательно, данные наблюдения не являются совместимыми с выдвинутой гипотезой о том, что между новым и существующим методами производства изделий отсутствуют существенные различия с точки зрения влияния их на материалоемкость.

2. Применение нового метода  обработки приводит к снижению  расхода сырья на единицу продукции. В этом случае рассматривается область больших отрицательных отклонений. В данном варианте критическая область определяется неравенством. Нулевая гипотеза не будет опровергаться, если средний расход материала на единицу продукции будет больше величины. Так как по новой технологии расход сырья составляет 2,6 условных единиц, то с вероятностью 0,995 можно считать, что нулевая гипотеза должна быть отвергнута и что, следовательно, применение новой технологии приводит к снижению расхода сырья на изготовление продукции.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.2.Малые выборки

Малые выборки - статистические выборки столь малого объёма n, что к ним нельзя применить простые классические формулы, действующие лишь асимптотически при n → ∞. Особенности статистической оценки параметров по М. в. легче всего понять на примере нормального распределения (для которого малыми обычно считают выборки объёма n ≤ 30). Пусть необходимо оценить неизвестное среднее значение a выборкиx1, x2, ..., xn из нормальной совокупности с неизвестной дисперсией σ2. Обозначим

 

        

 

   

 

        

 

       

 

         Исходным пунктом при  оценке a служит то обстоятельство, что распределение вероятностей величины

 

        

 

         не зависит от а и σ.

 

         Вероятность ω неравенства  — tω < t < tω и равносильного ему неравенства

 

        

 

         (1)

 

         вычисляется при этом  по формуле

 

         ω = 

 

         где s(t, n — 1) есть плотность вероятности для так называемого Стьюдента распределения с n — 1 степенями свободы. Определяя для заданных n и ω (0 < ω < 1) соответствующее tω (что можно сделать, например, по таблицам), получают правило (1) нахождения доверительных границ  для величины а, имеющей  ω.

 

         При больших n формула (2), связывающая ω и tω, приближённо может быть заменена формулой

 

        

 

         Эту формулу иногда  неправильно применяют для определения tω при небольших n, что приводит к грубым ошибкам. Так, для ω = 0,99 по формуле находим t0,99 = 2,58; истинные значения t0,99 для малых n приведены в следующей таблице:

 

        ------------------------------------------------------------------------------------------------------------------

 

        | n          | 2          | 3          | 4          | 5          | 10        | 20        | 30         |

 

        |----------------------------------------------------------------------------------------------------------------|

 

        | t0,99       | 63,66    | 9,92      | 5,84      | 4,60      | 3,25      | 2,86      | 2,76      |

 

        ------------------------------------------------------------------------------------------------------------------

 

 

        Если пользоваться формулой (3) при n = 5, то получится вывод, что неравенство

 

        

 

        выполняется с вероятностью 0,99. В действительности в случае пяти наблюдений вероятность этого неравенства равна лишь 0,94, а вероятностью 0,99 обладает в соответствии с приведённой таблицей неравенство

 

        

 

         Об оценке по М. в. теоретической дисперсии σ2 см. «Хи-квадрат» распределение. Разработаны также аналогичные методы оценки по М. в. параметров многомерных распределении (например, коэффициента корреляции).

 

 

 

 

 

 

Заключение

 

Таким образом, статистика как наука в широком смысле изучает все массовые явления, к какой бы области они не относились. Изучая массовое явление, статистика характеризует его не только количественно. С помощью числовых величин, но и качественно, выявляя его содержание и динамику развития.

Экономическая информация состоит из сведений, сообщаемых самыми различными общегосударственными, хозяйственными, юридическими и физическими лицами и т.п.

Одной из задач, которые стоят перед исследователем при проведении исследования, является сбор необходимых эмпирических данных об объекте исследования. Множество элементов, составляющих объект исследования, называют генеральной совокупностью. Наиболее простым, на первый взгляд, способом сбора данных является сплошное обследование генеральной совокупности. Однако применение сплошного обследования не всегда представляется возможным. В этом случае применяется выборочное обследование. Суть выборочного метода заключена в том, что обследованию подвергается только часть элементов генеральной совокупности, которая называется выборочной совокупностью. Изобретателем выборочного метода была сама жизнь. Действительно, еще до теоретического обоснования возможностей применения выборочного метода, статистики были вынуждены проводить выборочные обследования. Основными причинами для этого были отсутствие времени и средств . Выборочный метод позволяет не только сократить временные и материальные затраты на проведения исследования, но и повысить достоверность результатов исследования. Это утверждение может вызвать недоумение: как можно получить более достоверные данные, обследовав меньшую часть генеральной совокупности? Однако практика показывает, что достоверность полученной информации при использовании выборочного метода может быть не только не ниже, чем при сплошном обследовании, но и выше вследствие возможности привлечения персонала более высокого класса и применения различных процедур контроля качества получаемой информации. Кроме того выборочный метод имеет более широкую область применения. Широта области применения выборочного метода объясняется тем, что небольшой объем выборки позволяет использовать более сложные методы обследования, включая использование различных технических средств (например, видео- и аудиосредства, персональные компьютеры и Интернет, а также сложную измерительную технику).

 

 

Информация о работе Выборочное наблюдение в статтистике