Исторически первой
появились некоторые области
статистики объектов нечисловой
природы (в частности, задачи
оценивания доли брака и проверки
гипотез о ней) и одномерная статистика. Математический
аппарат для них проще, поэтому на их примере
обычно демонстрируют основные идеи математической
статистики.
Лишь те методы
обработки данных, т.е. математической
статистики, являются доказательными,
которые опираются на вероятностные модели соответствующих
реальных явлений и процессов. Речь идет
о моделях поведения потребителей, возникновения
рисков, функционирования технологического
оборудования, получения результатов
эксперимента, течения заболевания и т.п.
Вероятностную модель реального явления
следует считать построенной, если рассматриваемые
величины и связи между ними выражены
в терминах теории вероятностей. Соответствие
вероятностной модели реальности, т.е.
ее адекватность, обосновывают, в частности,
с помощью статистических методов проверки
гипотез.
Невероятностные методы
обработки данных являются поисковыми,
их можно использовать лишь
при предварительном анализе
данных, так как они не дают
возможности оценить точность и надежность
выводов, полученных на основании ограниченного
статистического материала.
Вероятностные и
статистические методы применимы
всюду, где удается построить
и обосновать вероятностную модель
явления или процесса. Их применение
обязательно, когда сделанные
на основе выборочных данных выводы переносятся
на всю совокупность (например, с выборки
на всю партию продукции).
В конкретных областях
применений используются как
вероятностно-статистические методы
широкого применения, так и специфические.
Например, в разделе производственного менеджмента,
посвященного статистическим методам
управления качеством продукции, используют
прикладную математическую статистику
(включая планирование экспериментов).
С помощью ее методов проводится статистический
анализ точности и стабильности технологических
процессов и статистическая оценка качества.
К специфическим методам относятся методы
статистического приемочного контроля
качества продукции, статистического
регулирования технологических процессов,
оценки и контроля надежности и др.
Широко применяются
такие прикладные вероятностно-статистические
дисциплины, как теория надежности
и теория массового обслуживания.
Содержание первой из них ясно
из названия, вторая занимается
изучением систем типа телефонной
станции, на которую в случайные моменты времени
поступают вызовы - требования абонентов,
набирающих номера на своих телефонных
аппаратах. Длительность обслуживания
этих требований, т.е. длительность разговоров,
также моделируется случайными величинами.
Большой вклад в развитие этих дисциплин
внесли член-корреспондент АН СССР А.Я.
Хинчин (1894-1959), академик АН УССР Б.В.Гнеденко
(1912-1995) и другие отечественные ученые.
Коротко об истории математической
статистики. Математическая статистика как наука
начинается с работ знаменитого немецкого
математика Карла Фридриха Гаусса (1777-1855),
который на основе теории вероятностей
исследовал и обосновал метод наименьших
квадратов, созданный им в 1795 г. и примененный для обработки астрономических
данных (с целью уточнения орбиты малой
планеты Церера). Его именем часто называют
одно из наиболее популярных распределений
вероятностей – нормальное, а в теории
случайных процессов основной объект
изучения – гауссовские процессы.
В конце XIX в.
– начале ХХ в. крупный вклад в математическую статистику
внесли английские исследователи, прежде
всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962).
В частности, Пирсон разработал критерий
«хи-квадрат» проверки статистических
гипотез, а Фишер – дисперсионный анализ,
теорию планирования эксперимента, метод
максимального правдоподобия оценки параметров.
В 30-е годы ХХ
в. поляк Ежи Нейман (1894-1977) и
англичанин Э.Пирсон развили общую
теорию проверки статистических
гипотез, а советские математики
академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН
СССР Н.В.Смирнов (1900-1966) заложили основы
непараметрической статистики. В сороковые
годы ХХ в. румын А. Вальд (1902-1950) построил
теорию последовательного статистического
анализа.
Математическая статистика бурно развивается и в настоящее
время. Так, за последние 40 лет можно выделить
четыре принципиально новых направления
исследований [2]:
- разработка и внедрение
математических методов планирования
экспериментов;
- развитие статистики объектов нечисловой
природы как самостоятельного направления
в прикладной математической статистике;
- развитие статистических методов,
устойчивых по отношению к
малым отклонениям от используемой
вероятностной модели;
- широкое развертывание работ по
созданию компьютерных пакетов программ,
предназначенных для проведения статистического
анализа данных.
Вероятностно-статистические
методы и оптимизация. Идея оптимизации пронизывает современную
прикладную математическую статистику
и иные статистические методы. А именно,
методы планирования экспериментов, статистического
приемочного контроля, статистического
регулирования технологических процессов
и др. С другой стороны, оптимизационные
постановки в теории принятия решений,
например, прикладная теория оптимизации
качества продукции и требований стандартов,
предусматривают широкое использование
вероятностно-статистических методов,
прежде всего прикладной математической
статистики.
В производственном менеджменте,
в частности, при оптимизации качества
продукции и требований стандартов особенно
важно применять статистические методы
на начальном этапе жизненного цикла продукции,
т.е. на этапе научно-исследовательской
подготовки опытно-конструкторских разработок
(разработка перспективных требований
к продукции, аванпроекта, технического
задания на опытно-конструкторскую разработку).
Это объясняется ограниченностью информации,
доступной на начальном этапе жизненного
цикла продукции, и необходимостью прогнозирования
технических возможностей и экономической
ситуации на будущее. Статистические методы
должны применяться на всех этапах решения
задачи оптимизации – при шкалировании
переменных, разработке математических
моделей функционирования изделий и систем,
проведении технических и экономических
экспериментов и т.д.
В задачах оптимизации, в
том числе оптимизации качества
продукции и требований стандартов,
используют все области статистики.
А именно, статистику случайных
величин, многомерный статистический
анализ, статистику случайных процессов
и временных рядов, статистику объектов
нечисловой природы. Выбор статистического
метода для анализа конкретных данных
целесообразно проводить согласно рекомендациям
Суть вероятностно-статистических
методов принятия решений
Как подходы, идеи и результаты
теории вероятностей и математической
статистики используются при
принятии решений?
Базой является вероятностная модель
реального явления или процесса,
т.е. математическая модель, в которой
объективные соотношения выражены
в терминах теории вероятностей. Вероятности
используются прежде всего для описания
неопределенностей, которые необходимо
учитывать при принятии решений. Имеются
в виду как нежелательные возможности
(риски), так и привлекательные («счастливый
случай»). Иногда случайность вносится
в ситуацию сознательно, например, при
жеребьевке, случайном отборе единиц для
контроля, проведении лотерей или опросов
потребителей.
Теория вероятностей позволяет
по одним вероятностям рассчитать
другие, интересующие исследователя.
Например, по вероятности выпадения герба
можно рассчитать вероятность того, что
при 10 бросаниях монет выпадет не менее
3 гербов. Подобный расчет опирается на
вероятностную модель, согласно которой
бросания монет описываются схемой независимых
испытаний, кроме того, выпадения герба
и решетки равновозможны, а потому вероятность
каждого из этих событий равна ½. Более
сложной является модель, в которой вместо
бросания монеты рассматривается проверка
качества единицы продукции. Соответствующая
вероятностная модель опирается на предположение
о том, что контроль качества различных
единиц продукции описывается схемой
независимых испытаний. В отличие от модели
с бросанием монет необходимо ввести новый
параметр – вероятность р того, что единица продукции является
дефектной. Модель будет полностью описана,
если принять, что все единицы продукции
имеют одинаковую вероятность оказаться
дефектными. Если последнее предположение
неверно, то число параметров модели возрастает.
Например, можно принять, что каждая единица
продукции имеет свою вероятность оказаться
дефектной.
Обсудим модель контроля качества с
общей для всех единиц продукции
вероятностью дефектности р. Чтобы при анализе модели «дойти до
числа», необходимо заменить р на некоторое конкретное значение. Для
этого необходимо выйти из рамок вероятностной
модели и обратиться к данным, полученным
при контроле качества. Математическая
статистика решает обратную задачу по
отношению к теории вероятностей. Ее цель
– на основе результатов наблюдений (измерений,
анализов, испытаний, опытов) получить
выводы о вероятностях, лежащих в основе
вероятностной модели. Например, на основе
частоты появления дефектных изделий
при контроле можно сделать выводы о вероятности
дефектности (см. теорему Бернулли выше).
На основе неравенства Чебышева делались
выводы о соответствии частоты появления
дефектных изделий гипотезе о том, что
вероятность дефектности принимает определенное
значение.
Таким образом, применение
математической статистики опирается
на вероятностную модель явления
или процесса. Используются два параллельных
ряда понятий – относящиеся к теории (вероятностной
модели) и относящиеся к практике (выборке
результатов наблюдений). Например, теоретической
вероятности соответствует частота, найденная
по выборке. Математическому ожиданию
(теоретический ряд) соответствует выборочное
среднее арифметическое (практический
ряд). Как правило, выборочные характеристики
являются оценками теоретических. При
этом величины, относящиеся к теоретическому
ряду, «находятся в головах исследователей»,
относятся к миру идей (по древнегреческому
философу Платону), недоступны для непосредственного
измерения. Исследователи располагают
лишь выборочными данными, с помощью которых
они стараются установить интересующие
их свойства теоретической вероятностной
модели.
Зачем же нужна вероятностная
модель? Дело в том, что только
с ее помощью можно перенести
свойства, установленные по результатам
анализа конкретной выборки, на
другие выборки, а также на
всю так называемую генеральную
совокупность. Термин «генеральная совокупность»
используется, когда речь идет о большой,
но конечной совокупности изучаемых единиц.
Например, о совокупности всех жителей
России или совокупности всех потребителей
растворимого кофе в Москве. Цель маркетинговых
или социологических опросов состоит
в том, чтобы утверждения, полученные по
выборке из сотен или тысяч человек, перенести
на генеральные совокупности в несколько
миллионов человек. При контроле качества
в роли генеральной совокупности выступает
партия продукции.
Чтобы перенести выводы с
выборки на более обширную
совокупность, необходимы те или
иные предположения о связи
выборочных характеристик с характеристиками
этой более обширной совокупности.
Эти предположения основаны на
соответствующей вероятностной модели.
Конечно, можно обрабатывать
выборочные данные, не используя
ту или иную вероятностную
модель. Например, можно рассчитывать
выборочное среднее арифметическое,
подсчитывать частоту выполнения
тех или иных условий и т.п.
Однако результаты расчетов будут относиться
только к конкретной выборке, перенос
полученных с их помощью выводов на какую-либо
иную совокупность некорректен. Иногда
подобную деятельность называют «анализ
данных». По сравнению с вероятностно-статистическими
методами анализ данных имеет ограниченную
познавательную ценность.
Итак, использование вероятностных
моделей на основе оценивания
и проверки гипотез с помощью
выборочных характеристик – вот
суть вероятностно-статистических
методов принятия решений.
Подчеркнем, что логика использования
выборочных характеристик для принятия
решений на основе теоретических моделей
предполагает одновременное использование
двух параллельных рядов понятий, один
из которых соответствует вероятностным
моделям, а второй – выборочным данным.
К сожалению, в ряде литературных источников,
обычно устаревших либо написанных в рецептурном
духе, не делается различия между выборочными
и теоретическими характеристиками, что
приводит читателей к недоумениям и ошибкам
при практическом использовании статистических
методов.