Дисперсионный анализ

Автор работы: Пользователь скрыл имя, 03 Мая 2013 в 09:47, реферат

Краткое описание

Дисперсионный анализ – анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов.
Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:
- Вариативность, обусловленную действием каждой из исследуемых независимых переменных.
- Вариативность, обусловленную взаимодействием исследуемых независмых переменных.
- Вариативность случайную, обусловленную всеми неучтенными обстоятельствами.

Прикрепленные файлы: 1 файл

реферат дисперсионный анализ.docx

— 56.21 Кб (Скачать документ)

КАЗАХСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ  ИМ. АЛЬ-ФАРАБИ

Факультет химии и химической технологии

Кафедра аналитической, коллоидной химии и технологии редких элементов

 

 

 

 

 

 

 

РЕФЕРАТ

Тема: Дисперсионный анализ

 

 

 

Подготовил: Курмангалиев Н.С.

Проверила: Шалдыбаева А. М.

 

 

 

 

 

 

 

Алматы 2013 г.

 

Понятие, назначение дисперсионного анализа. Виды дисперсионного анализа.

Дисперсионный анализ –  анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов.

Обобщенно задача дисперсионного анализа состоит в том, чтобы  из общей вариативности признака выделить три частные вариативности:

- Вариативность, обусловленную  действием каждой из исследуемых независимых переменных.

- Вариативность, обусловленную  взаимодействием исследуемых независмых переменных.

- Вариативность случайную,  обусловленную всеми неучтенными  обстоятельствами.

Виды дисперсионного анализа.

Дисперсионный анализ схематически можно подразделить на несколько  категорий. Это деление осуществляется, смотря по тому, сколько, во-первых, факторов принимает участие в рассмотрении, во-вторых, - сколько переменных подвержены действию факторов, и, в-третьих, - по тому, как соотносятся друг с другом выборки значений.

При наличии одного фактора, влияние которого исследуется, дисперсионный  анализ именуется однофакторным, и распадается на две разновидности:

- Анализ несвязанных (то  есть – различных) выборок.  Например, одна группа респондентов  решает задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая  гипотеза звучала бы так: «среднее  время решения задач такого-то  типа будет одинаково в тишине  и в шумном помещении», то есть не зависит от фактора шума.)

- Анализ связанных выборок.  То есть: двух замеров, проведенных  на одной и той же группе  респондентов в разных условиях. Тот же пример: в первый раз  задача решалась в тишине, второй  – сходная задача – в условиях  шумовых помех. (На практике к  подобным опытам следует подходить  с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.)

В случае, если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.

Если же воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе.

1. Однофакторный  дисперсионный анализ

Дисперсионным анализом называется метод организации (планирования), статистического анализа и интерпретации результатов экспериментов, в которых изучается зависимость количественной переменной y от сочетания градаций качественных переменных(факторов) X.

Однофакторный дисперсионный  анализ используется в тех случаях, когда есть в распоряжении три  или более независимые выборки, полученные из одной генеральной  совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.

Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).

Пусть xik – i – элемент ( i=1..n) k -выборки ( k=1..,m ), где m – число выборок, n– число данных в k -выборке. Тогда  – выборочное среднее k -выборки определяется по формуле

 

 .

 

Общее среднее вычисляется  по формуле

 , где

 

Основное тождество дисперсионного анализа имеет следующий вид:

 

Q=Q1+Q,

 

где Q– сумма квадратов отклонений выборочных средних  от общего среднего  (сумма квадратов отклонений между группами); Q– сумма квадратов отклонений наблюдаемых значений xik от выборочной средней  (сумма квадратов отклонений внутри групп); Q – общая сумма квадратов отклонений наблюдаемых значений xik от общего среднего  .

Расчет этих сумм квадратов  отклонений осуществляется по следующим  формулам:

 

 

В качестве критерия необходимо воспользоваться критерием Фишера:

 

 .

 

Если расчетное значение критерия Фишера будет меньше, чем  табличное значение F(λ;m-1;n-m) – нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений, в противном случае, независимый фактор оказывает существенное влияние на разброс средних значений (λ– уровень значимости, уровень риска, обычно для экономических задач λ=0,05).

Недостаток однофакторного анализа: невозможно выделить те выборки, которые отличаются от других. Для этой цели необходимо использовать метод Шеффера или проводить парные сравнения выборок.

 

2. Двухфакторный  дисперсионный анализ

 

В двухфакторном дисперсионном  анализе проверяется гипотеза о  равенстве математических ожиданий выходного контролируемого параметра y при различных уровнях двух факторов. Например, производится выпуск одинаковых изделий различными предприятиями, использующих различных поставщиков. Здесь два фактора: предприятия и поставщики. Необходимо проверить гипотезу о равенстве математических ожиданий выходного контролируемого параметра (например качества изделия) при различных уровнях (предприятиях) первого и различных уровнях (поставщиках) второго фактора. Модель исследуемого объекта имеет вид:

 

 

В этой модели входные переменные xи xпринимают дискретные значения, а выходная переменная y является непрерывной случайной величиной, вероятностная природа которой обусловлена наличием аддитивной помехи e.

Двухфакторный дисперсионный  анализ базируется на следующих предпосылках:

1) В каждом наблюдении  eимеет нормальное распределение с нулевым МО и конечной дисперсией.

2) Для любого i дисперсия  eявляется величиной постоянной.

Рассмотрим вычислительную процедуру двухфакторного дисперсионного анализа.

 

x1\x2

1

n2

 

1

 

   

n1

 

   
   

   

 

r – число наблюдений в эксперименте;

n1, n2 – число уровней для 1 и 2 факторов (число строк и столбцов в таблице исходных данных).

 

Источник вариации

Число степеней свободы

Сумма квадратов

Дисперсия

S2

F

Фактор x1

n1-1

     

Фактор x2

n2-1

     

Взаимодействие x1x2

n1n2-n1-n2+1

     

Остатки (ошибки)

n1n2(r-1)

   

-

Общий

n1n2r-1

Q=Q1+Q2+Q12+Q0

(Полная сумма квадратов наблюдений для двухфакторного анализа)

-

-


 

, то фактор x1 влияет на входную величину, иначе не влияет.

, то фактор x2 влияет на выходную величину, иначе не влияет.

, то серии x1x2 влияют на выходную величину, иначе не влияют.

 

3. Параметрические  модели однофакторного и двухфакторного  дисперсионного анализа

 

Математическая модель однофакторного дисперсионного анализа (когда оценивается влияние одного качественного признака на количественную переменную): где yij - значение результирующего показателя для i-го (i=1,nj) наблюдения при уровне градации j (j=1,P) качественного признака; nj – количество наблюдений, когда фактор находится на уровне j (Σnj=N, j=1,P); - среднее значение результирующего показателя по всем наблюдениям всех градаций качественного признака; α j - эффект влияния фактора на j-ом уровне; εij - случайная компонента, отражающая влияние всех прочих факторов

Параметрическая модель для  двухфакторного анализа в общем  случае имеет вид:

 

 ,

 

где , - эффекты 1 и 2 факторов соответственно,

– эффект взаимодействия, - ошибка.

 

4. Латинские планы.  Определение плана. Применение. Достоинства  и недостатки латинских планов

 

Латинским квадратом порядка n называется таблица латинских символов с n строками и n столбцами, такая, что каждый символ появляется в каждой строке и в каждом столбце только один раз.

 

a

b

c

b

c

a

c

a

b


дисперсионный анализ параметрический  латинский план

Латинскому квадрату можно  сопоставить план эксперимента, в  котором строки соответствуют различным  значениям одного фактора, столбцы  – значениям другого, а латинские  буквы – значениям третьего фактора, т.е. латинский квадрат позволяет  исследовать влияние не более  чем трех факторов. 

Применение плана, построенного на основе латинского квадрата, позволяет  оценить дифференциальный (разностный) эффект пар уровней, но не дает информации о взаимодействии между факторами (иначе говоря, факторы не зависят  друг от друга).

Планы латинских квадратов  используются в тех случаях, когда  требуется оценить влияние факторов, варьируемых более чем на двух уровнях и заранее известно, что  между факторами нет взаимодействий или этим взаимодействиями можно  пренебречь.

 

5. Греколатинские планы. Определение. Способы построения

 

Латинские квадраты можно  накладывать друг на друга, образуя греко-латинские квадраты.

Например, два латинских  квадрата 3´3 можно преобразовать  в греко-латинский квадрат

 

a

b

c

b

c

a

c

a

b


+

a

b

c

c

a

b

b

c

a


=

a a

b b

c c

b c

c a

a b

c b

a c

b a


 

Здесь латинские буквы  образуют один латинский квадрат, а  греческие буквы – другой латинский  квадрат. Каждая латинская буква  встречается в паре с конкретной греческой буквой только один раз. С  помощью этого греко-латинского квадрата можно оценить главные  эффекты четырех 3-х уровневых  факторов (фактора строк, фактора  столбцов, римских букв и греческих  букв) проведя только 9 опытов.

Если наложить друг на друга  три различных варианта латинских  квадратов, то получится план гипер-греко-латинского квадрата. С его помощью можно оценить главные эффекты пяти факторов (фактора строк, столбцов и трех расположений квадратов). В частности, для пяти трехуровневых факторов потребуется провести только 9 опытов вместо 243 опытов при переборе всех возможных сочетаний факторов.

Планы греко-латинских квадратов  используются в тех случаях, когда  требуется оценить влияние факторов, варьируемых более чем на двух уровнях и заранее известно, что  между факторами нет взаимодействий или этим взаимодействиями можно  пренебречь.

 

Список использованной литературы

  1. Чарыков А.К. Математическая обработка результатов химического анализа. Ленинград «Химия» 1984 г. 148-154 с.
  2. 1   Кремер Н.Ш. Теория вероятности и математическая статистика. М.: Юнити – Дана, 2002.-343с.
  3. 2   Гмурман В.Е.  Теория  вероятностей  и математическая  статистика. – М.: Высшая школа, 2003.-523с.
  4. 3   www.sutd.ru
  5. 4   www.conf.mitme.ru
  6. 5   www.pedklin.ru
  7. 6   www.webcenter.ru
  8. 7   www.infections.ru
  9. 8   www.encycl.yandex.ru
  10. 9   www.infosport.ru
  11. 10 www.medtrust.ru
  12. 11 www.flax.net.ru
  13. 12 www.jdc.org.il
  14. 13 www.big.spb.ru
  15. 14 www.bizcom.ru

Информация о работе Дисперсионный анализ