Автор работы: Пользователь скрыл имя, 11 Января 2015 в 10:55, реферат
1. Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называют сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.
Математическая статистика и её связь с теорией вероятности;
Основные задачи и понятия математической статистики;
Определение выборки и выборочного распределения;
Графическое изображение выборки;
Определение понятие полигона и гистограммы;
Санитарная (медицинская) статистика — отрасль статистической науки
«Узловский филиал Тульского областного медицинского колледжа»
Реферат по математике на тему: «Математическая статистика и её роль в медицине и здравоохранении»
2014 г
-1-
Содержание:
Математическая статистика и её связь с теорией вероятности;
Основные задачи и понятия математической статистики;
Определение выборки и выборочного распределения;
Графическое изображение выборки;
Определение понятие полигона и гистограммы;
Санитарная (медицинская) статистика — отрасль статистической науки
-2-
1. Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называют сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.
Предмет и метод математической статистики.
Статистическое описание совокупности, с одной стороны, и описанием совокупности по ее общим свойствам, совсем не требующим ее расчленения на отдельные объекты, с другой. По сравнению с первым способом статистические данные всегда в большей или меньшей степени обезличены и имеют лишь ограниченную ценность в случаях, когда существенны именно индивидуальные данные. С другой стороны, по сравнению с данными о наблюдаемых извне суммарных свойствах совокупности статистические данные позволяют глубже проникнуть в существо дела. Например, данные гранулометрического анализа породы (т. е. данные о распределении образующих породу частиц по размерам) дают ценную дополнительную информацию по сравнению с испытанием не расчлененных образов породы, позволяя в некоторой мере объяснить свойства породы, условия ее образования и пр.
Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим. Статистический метод применяется в самых различных областях знания. Однако черты статистического метода в применении к объектам различной природы столь своеобразны, что было бы бессмысленно объединять, например, социально-экономическую статистику, физическую статистику, звездную статистику и т. п. в одну науку.
Общие черты статистического метода в различных областях знания сводятся к подсчету числа объектов, входящих в те или иные группы, рассмотрению распределения количественных признаков, применению выборочного метода (в случаях, когда детальное исследование всех объектов обширной совокупности затруднительно), использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая
-3-
сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математической статистики.
Связь математической статистики с теорией вероятностей
Связь математической статистики с теорией вероятностей имеет в разных случаях различный характер. Теория вероятностей изучает не любые массовые явления, а явления случайные и именно «вероятностно случайные», т. е. такие, для которых имеет смысл говорить о соответствующих им распределениях вероятностей. Тем не менее теория вероятностей играет определенную роль и при статистическом изучении массовых явлений любой природы, которые могут не относиться к категории вероятностно случайных. Это осуществляется через основанные на теории вероятностей теорию выборочного метода и теорию ошибок. В этих случаях вероятностным закономерностям подчинены не сами изучаемые явления, а приемы их исследования.
Более важную роль играет теория вероятностей при статистическом исследовании вероятностно случайных явлений. Здесь в полной мере находят применение такие основанные на теории вероятностей разделы математической статистики, как проверка статистических гипотез, статистическое оценивание распределений вероятностей и входящих в них параметров и т. д. Область же применения этих более глубоких статистических методов значительно уже, т. к. здесь требуется, чтобы сами изучаемые явления были подчинены достаточно определенным вероятностным закономерностям. Например, статистическое изучение режима турбулентных водных потоков или флюктуаций в радиоприемных устройствах производится на основе теории стационарных случайных процессов. Однако применение той же теории к анализу экономических временных рядов может привести к грубым ошибкам в виду того, что входящее в определение стационарного процесса допущение наличия сохраняющихся в течении длительного времени неизменных распределений вероятностей в этом случае, как правило, совершенно неприемлемо.
Вероятностные закономерности получают статистическое выражение (вероятности осуществляются приближенно в виде частот, а математические ожидания – в виде средних) в силу закона больших чисел.
-4-
2.ОСНОВНЫЕ ПОНЯТИЯ СТАТИСТИКИ
Объект исследования — это область научных знаний, в пределах которой выявлена и существует изучаемая проблема, это процесс или явление, порождающее проблемную ситуацию и выбранное для изучения.
Предмет исследования — отдельная проблема определенной области знаний, которую исследователь собирается изучать и анализировать.
Цель исследования — это желаемый конечный результат исследовательской деятельности. Цель исследования определяет тактику организации научной деятельности.
Задачи исследования — это перечень проблем, которые должны быть всесторонне рассмотрены для полноценного анализа изучаемой темы.
Субъект — непосредственные исполнители медико-статистического исследования. Статистическая совокупность — группа относительно однородных элементов в конкретных условиях времени и пространства.
В зависимости от охвата единиц наблюдения статистическая совокупность может быть:
– генеральная — состоит из всех качественно однородных единиц наблюдения, которые могут быть к ней отнесены в зависимости от целей исследования;
– выборочная — часть генеральной совокупности, отобранная специальным выборочным методом и предназначенная для характеристики генеральной совокупности.
Общий обзор
В статистике популяция представляет целую группу индивидуумов, которые нас интересуют. Вообще, изучать целую популяцию довольно дорого и трудоемко, а в некоторых случаях просто невозможно, так как популяция может быть гипотетической, поэтому собирают данные по выборке индивидуумов, как предполагают, представителей этой популяции, и используют их для того, чтобы сделать выводы ( т.е. делать заключения) относительно этой популяции.
Когда берут выборку из популяции, имеют ввиду, что информация в выборке не может
-5-
полностью отражать то, что истинно в этой популяции. Возможна ошибка, обусловленная выборкой, так как изучалась только часть популяции.
Далее мы разберем, как использовать теоретическое распределение вероятности для определения величины этой ошибки.
Репрезентативная выборка
Репрезентативная выборка (representative sample) - одно из ключевых понятий анализа данных. Репрезентативная выборка - это выборка из генеральной совокупности с распределением F(x), представляющая основные особенности генеральной совокупности.
Например, если в городе проживает 100 000 человек, половина из которых мужчины и половина женщины, то выборка 1000 человек из которых 10 мужчин и 990 женщин, конечно, не будет репрезентативной.
Построенный на ее основе опрос общественного мнения, конечно, будет содержать смещение оценок и приводит к фальсификации результатов.
Необходимым условием построения репрезентативной выборки является равная вероятность включения в нее каждого элемента генеральной совокупности.
Выборочная (эмпирическая) функция распределения дает при большом объеме выборки достаточно хорошее представление о функции распределения F(x) исходной генеральной совокупности.
Оценка параметров популяции: точечные оценки
Мы часто заинтересованы в оценке параметра в популяции, среднего или стандартного отклонения. Обычно обозначают среднее популяции как , а стандартное отклонение популяции как .
В статистике принято обозначать популяционные параметры (генеральные) буквами греческого алфавита, а выборочные – соответствующими им буквами латинского алфавита, например, и m , и и т. д.
Мы оцениваем значение параметра, используя данные, собранные в выборке.
-6-
Эта оценка – точечная оценка генерального параметра ( т.е. она принимает только одно значение) в отличие от интервальной оценки, которая имеет интервал значений.
Точечную оценку описывает выборочная статистика.
Выборочная дисперсия, выборочное стандартное отклонение
Если повторить извлечение выборок того же самого объема из популяции, маловероятно, что оценки параметра популяции будут точно такими же в каждой выборке. Однако все оценки должны быть близки к истинному значению параметра (генеральному параметру) в популяции и подобны друг другу.
Определяя величину вариабельности этих оценок, мы поймем, насколько они точны, и таким образом сможем оценить ошибку, обусловленную выборкой.
Обычно берут только одну выборку из популяции. Однако можно использовать знания о теоретическом распределении выборочных оценок для того, чтобы сделать выводы относительно генерального параметра популяции.
Выборочное стандартное отклонение s оценивается по наблюдаемой реализации выборки:
Стандартное отклонение отражает вариабельность в значениях данных и должно быть указано, если нужно пояснить изменчивость в наборе данных.
Выборочное распределение среднего, ошибка среднего
Предположим, что мы заинтересованы в оценке среднего популяции; можно брать много повторных выборок объема n из популяции и оценить среднее в каждой выборке.
Если объем выборки разумно большой, оценки среднего имеют нормальное распределение при любом распределении исходных данных в популяции.
Данное утверждение следует из теоремы, известной как центральная предельная теорема:
→ N (0,1) при n → ∞
-7-
Если объем выборки небольшой, оценки среднего отвечают нормальному распределению при условии, что данные в популяции также отвечают нормальному распределению;
Среднее этих оценок – несмещенная оценка истинного среднего в популяции
(генерального среднего), т.е. среднее этих оценок эквивалентно истинному среднему в популяции;
Вариабельность распределения выражается стандартным отклонением оценок, известным как стандартная ошибка среднего (часто обозначают как Standard Error Means, SEM).
Если бы мы знали стандартное отклонение популяции σ, тогда стандартная ошибка среднего описывалась бы так:
В случае если есть, как обычно, только одна выборка, нашей лучшей оценкой среднего популяции будет выборочное среднее, а так как редко бывает известно стандартное отклонение в популяции (генеральный стандарт), то стандартную ошибку среднего оценивают следующим образом:
где s – стандартное отклонение в выборке.
Стандартная ошибка среднего отражает точность нашей оценки.
Большая стандартная ошибка указывает, что оценка неточна;
Небольшая стандартная ошибка указывает, что оценка точна;
Стандартная ошибка уменьшится, т.е. мы получим более точную оценку, если:
Объем выборки увеличится;
Данные имеют небольшое рассеяние.
Итак, стандартная ошибка отображает точность выборочного среднего и должна быть указана, если интересует среднее значение набора данных.
-8-
3. Выборка (sample, set) — конечный набор прецедентов (объектов, случаев, событий, испытуемых, образцов, и т.п.), некоторым способом выбранных из множества всех возможных прецедентов, называемого генеральной совокупностью.
Если исследователь не имеет возможности управлять выбором прецедентов, то обычно предполагается, что выбор прецедентов случаен. Если же выбором
прецедентов можно управлять, то возникают задачи оптимального формирования выборки, см. также активное обучение, планирование экспериментов, выборочное обследование.
По каждому прецеденту собираются (измеряются) некоторые данные (data), образующие описание прецедента. Совокупность описаний всех прецедентов выборки является входной информацией для статистического анализа данных, интеллектуального анализа данных, машинного обучения.
Термины выборка (sample, set) и данные (data) взаимозаменяемы; иногда они употребляются вместе как один термин выборка данных (data set). Поэтому анализ данных можно понимать также как анализ конечных выборок. Основные цели анализа данных:
проверка гипотез относительно имеющейся выборки данных;
эмпирическая индукция — выявление общих закономерностей, присущих всей генеральной совокупности, по имеющийся выборке данных;
прогнозирование — формирование статистически обоснованных предсказаний относительно новых данных, которые ещё не наблюдались.
Вероятностная модель порождения данных
Случайная выборка
Вероятностная модель порождения данных предполагает, что выборка из генеральной совокупности формируется случайным образом. Объём (длина) выборки считается произвольной, но фиксированной, неслучайной величиной.
Формально это означает, что
с генеральной совокупностью связывается вер
-9-
выборок длины , — заданная на этом множестве сигма-алгебра событий, — вероятностная мера, как правило, неизвестная.
Случайная выборка — это последовательность из прецедентов, выбранная из множества согласно вероятностной мере .
Однородная выборка
Выборка называется однородной, если все её прецеденты одинаково распределёны, то есть выбраны из одного и того же распределения .
Информация о работе Математическая статистика и её роль в медицине и здравоохранении