Многофакторный дисперсионный
анализ
Кафедра: «Медицинской биофизики, информатики
и математической статистики»
- Многофакторный дисперсионный анализ
- Общая схема двухфакторного эксперимента
- Таблица – Показатели качества изделий
- Двухфакторная дисперсионная модель
- Групповые средние находятся по формулам
- Базовая таблица дисперсионного анализа
- С точки зрения техники вычислений для нахождения сумм квадратов Q1, Q2, Q3, Q4, Q целесообразнее использовать формулы
- Заключение
- Список использованных источников
- Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.
Прочие неучитываемые (случайные)
факторы
Фактор B:
3 уровня
Зависимая переменная xi
Взаимодействие факторов A и B
Фактор А:
2 уровня
- Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.
- Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:
- А - партия изделий;
- B - станок.
- В результате получается переход к задаче двухфакторного дисперсионного анализа.
- Все данные представлены в таблице 1.2, в которой по строкам - уровни Ai фактора А, по столбцам — уровни Bj фактора В, а в соответствующих ячейках, таблицы находятся значения показателя качества изделий xijk
(i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).
B1
B2
…
Bj
…
Bl
A1
x11l,…,x11k
x12l,…,x12k
…
x1jl,…,x1jk
…
x1ll,…,x1lk
A2
x21l,…,x21k
x22l,…,x22k
…
x2jl,…,x2jk
…
x2ll,…,x2lk
…
…
…
…
…
…
…
Ai
xi1l,…,xi1k
xi2l,…,xi2k
…
xijl,…,xijk
…
xjll,…,xjlk
…
…
…
…
…
…
…
Am
xm1l,…,xm1k
xm2l,…,xm2k
…
xmjl,…,xmjk
…
xmll,…,xmlk
- Двухфакторная дисперсионная модель имеет вид:
-
- xijk=μ+Fi+Gj+Iij+εijk,
-
- где xijk - значение наблюдения в ячейке ij с номером k;
- μ - общая средняя;
- Fi - эффект, обусловленный влиянием i-го уровня фактора А;
- Gj - эффект, обусловленный влиянием j-го уровня фактора В;
- Iij - эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке ij от суммы первых трех слагаемых в модели;
- εijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.
- Предполагается, что εijk имеет нормальный закон распределения N(0; с2), а все математические ожидания F*, G*,
Ii*, I*j равны нулю.
по строке:
в ячейке:
по столбцу:
общая средняя:
Групповые средние находятся по формулам:
Компоненты дисперсии
Сумма квадратов
Число степеней свободы
Средние квадраты
Межгрупповая (фактор А)
m-1
Межгрупповая (фактор B)
l-1
Взаимодействие
(m-1)(l-1)
Остаточная
mln - ml
Общая
mln - 1
- Проверка нулевых гипотез HA, HB, HAB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , ,
(для случайной модели II) с соответствующими табличными значениями F – критерия Фишера – Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями – как в модели I.
- Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q3
из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.
С точки зрения техники вычислений
для нахождения сумм квадратов
Q1, Q2, Q3,
Q4, Q целесообразнее использовать
формулы:
Q3 = Q – Q1 – Q2 – Q4.
- Отклонение от основных предпосылок дисперсионного анализа — нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) — не сказывается существенно на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы.
- Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.
- Благодаря автоматизации дисперсионного анализа исследователь может проводить различные статистические исследования с применение ЭВМ, затрачивая при этом меньше времени и усилий на расчеты данных. В настоящее время существует множество пакетов прикладных программ, в которых реализован аппарат дисперсионного анализа. Наиболее распространенными являются такие программные продукты как:
- - MS Excel;
- - Statistica;
- - Stadia;
- - SPSS.
- В современных статистических программных продуктах реализованы большинство статистических методов. С развитием алгоритмических языков программирования стало возможным создавать дополнительные блоки по обработке статистических данных.
- Дисперсионный анализ является мощным современным статистическим методом обработки и анализа экспериментальных данных в психологии, биологии, медицине и других науках. Он очень тесно связан с конкретной методологией планирования и проведения экспериментальных исследований.
- Дисперсионный анализ применяется во всех областях научных исследований, где необходимо проанализировать влияние различных факторов на исследуемую переменную.
- 1 Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити – Дана, 2002.-343с.
- 2 Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2003.-523с.
- 3 www.sutd.ru
- 4 www.conf.mitme.ru
- 5 www.pedklin.ru
- 6 www.webcenter.ru
- 7 www.infections.ru
- 8 www.encycl.yandex.ru
- 9 www.infosport.ru
- 10 www.medtrust.ru
- 11 www.flax.net.ru
- 12 www.jdc.org.il
- 13 www.big.spb.ru
- 14 www.bizcom.ru
- 15 Гусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М.: Учебно-методический коллектор «Психология», 2000.-136с.
- 16 www.gpss.ru
- 17 www.econometrics.exponenta.ru
- 18 www.optimizer.by.ru
- 19 www2.econ.msu.ru