Дисперсионный анализ

Автор работы: Пользователь скрыл имя, 02 Сентября 2013 в 11:33, реферат

Краткое описание

Результаты эксперимента в химии и химической промышленности были и остаются главным критерием при решении практических задач и при проверке теоретических гипотез. Изучение сложных технологических процессов сопряжено с трудоемким и длительным экспериментом. Для увеличения эффективности научных исследований, сокращения сроков разработки новых технологических процессов необходима оптимизация экспериментальных исследований на всех стадиях разработки, исследования, внедрения и эксплуатации химико-технологических процессов.

Содержание

Введение…………………………………………………………………………....3
1.Задача дисперсионного анализа……………………………………………...4
2. Однофакторный дисперсионный анализ ………………….………………..6
3.Двухфакторный дисперсионный анализ…………………………………….11
4. Планирование эксперимента при дисперсионном анализе.
Латинские и гипер-греко-латинские квадраты.………………..…………......22
Заключение...............................................................................................................30
Литература................................................................................................................32

Прикрепленные файлы: 1 файл

0402491_0C0F7_dispersionnyy_analiz.docx

— 93.87 Кб (Скачать документ)

Если  же справедливо неравенство (1.12), различие между дисперсиями  и значимо и, следовательно значимо влияние фактора А. Определим оценку фактора А из (1.11):

                                               (1.22)

При этом нулевая гипотеза m1=m2=…=mk=m отвергается, и различие между средними m1, m2,…,mk следует считать значимым. Для выяснения вопроса, какие именно средние различны, применяются критерии Стьюдента, Фишера или ранговый критерий Дункана.

При интерпретации  результатов дисперсионного анализа  для модели со случайными уровнями обычно интересуются не проверкой гипотез относительно средних, а оценкой компонент дисперсий. В отличие от модели с фиксированными уровнями выводы по случайной модели распространяются на всю генеральную совокупность уровней.

Рассмотрим  схему вычислений для разного  числа параллельных наблюдений. Пусть на уровне ai проведено ni параллельных наблюдений. Общее число всех наблюдений равно

 

Определим: 1. итоги по столбцам

                                     (1.23)

2. суммы квадратов наблюдений

                                            (1.24)

3. сумма квадратов итогов по столбцам, деленных на число наблюдений в соответствующем столбце

                                                (1.25)

4. общего итога, деленный на число наблюдений

                                      (1.26)

Дальнейшие  расчеты проводятся по формулам (1.17) – (1.21). Если дисперсии и значимо отличаются друг от друга, дисперсию фактора А вычисляют по формуле:

                           (1.27)

3. Двухфакторный дисперсионный анализ.

Изучается влияние процессов одновременно факторов А и В. Фактор А исследуется на уровнях a1, а2,…, аk, фактор В – на уровнях b1,b2,…,bm. Допустим, что при каждом сочетании факторов А и В проводятся n параллельных наблюдений (таблица №2)

Таблицы №2.

Данные  для двухфакторного дисперсионного анализа с повторениями.

 

В

А

 

Итого

а1

а2

аj

ak

b1

y111, y112,…, y11n

y211, y212,…, y21n

 

yi11, yi12,…, yi1n

 

yk11, yk12,…, yk1n

B1

b2

y121, y122,…, y12n

y221, y222,…, y22n

 

yi21, yi22,…, yi2n

 

yk21, yk22,…, yk2n

B2

bj

y1j1, y1j2,…, y1nj

y2j1, y2j2,…, y2jn

yij1, yij2,…, yijn

ykj1, ykj2,…, ykjn

Bj

bm

y1m1, y1m2,…, y1mn

y2m1, y2m2,…,

y2mn

yim1, yim2,…, yimn

ykm1, ykm2,…, ykmn

Bm

Итоги

A1

A2

Ai

Ak

 

 

Общее число  наблюдений равно N=nkm. Результат наблюдения можно представить в виде следующей модели:

                                   (1.28)

где,

μ – общее  среднее;

αi – эффект фактора А на i-м уровне, i=1,2,…,k;

βj – эффект фактора В на j-м уровне j=1,2,…, m;

αiβi – эффект взаимодействия факторов.

Эффект  взаимодействия представляет собой  отклонение среднего по наблюдениям в ij-й серии от суммы первых трех членов в модели (11.28), а (q=1,2,…,n) учитывается вариацию внутри серии наблюдений (ошибка воспроизводимости). Будем полагать, как и прежде, что распределена нармально с нулевым математическим ожиданием и дисперсией . Если предложить, что между факторами нет взаимодействия, то можно принять линейную модель:

                                        (1.29)

Эта модель обычно применяется при отсутствии параллельных наблюдений:

Таблицы №3.

Данные  для двухфакторного дисперсионного анализа без повторениями.

 

В

А

 

Итоги

а1

а2

аk

b1

y11

y21

yk1

В1

b2

y12

y22

yk2

В2

bm

y1m

y2m

ykm

Вm

Итоги

A1

A2

Ak

 

 

Рассмотрим  вначале линейную модель. Через  обозначим среднее, соответственно по столбцам и по строкам:

                                                     (1.30)

                                                    (1.31)

через  - среднее всех результатов:

                                                (1.32)

Рассеяние по столбцам , ,.., относительно общего среднего не зависит от фактора В, так как все уровни факторов В усреднены. Это рассеяние связано с влиянием фактора А и случайного фактора А. Так как дисперсия среднего в m раз меньше дисперсии единичного измерения, имеем:

                            (1.33)

В свою очередь  рассеяние в средних по строчкам не зависит от фактора А и связано с влиянием фактора В:

                             (1.34)

Равенства (1.33) и (1.34) позволяет оценить влияние факторов А и В, если известна оценка дисперсии . Чтобы оценить фактор случайности при отсутствии параллельных наблюдений, поступим следующим образом. Найдем дисперсию наблюдений по i-му столбцу:

                                 (1.35)

Эта дисперсия  обусловлена влиянием фактора В и фактор случайности

                                                

Равенство станет более точным, если вместо использовать средневзвешенную дисперсию по всем столбцам:

                      (1.36)

Вычитая (11.35) из (11.34), получим

              (1.37)

Отсюда

           (1.38)

Обозначим полученную оценку (11.38) для дисперсии  через . Число степеней свободы равно (k-1)(m-1). Введем также следующее обозначение:

                           (1.39)

                           (1.40)

Величины  и можно считать выборочными дисперсиями с (k-1) и (m-1) степеней свободы соответственно. проверяют нулевые гипотезы о незначимости влияния фактора А и В по критерию Фишера. Если дисперсионное отношение

             

                              (1.41)  

принимается гипотеза Н0: αi=0. Если 

                                         (1.42)

нулевая гипотез  отвергается. и влияние фактора А считается значимым. Аналогично, если

      

                              (1.43)

принимается гипотеза  Н0: βi=0. при справедливости неравенства

                                           (1.44) 

влияние фактора  В считается значимым. при проверке нулевых гипотез односторонний критерий Фишера, так как альтернативой равенства служит неравенство при проведении дисперсионного анализа в условиях линейной модели (1.29) удобно использовать следующий алгоритм расчета. Находят: 1. итоги по столбцам

                                     (1.45)

2. итоги по строкам

                                      (1.46)

3. сумму квадратов всех наблюдений

                                              (1.47)

4. сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце,

                                          (1.48)                    

5. сумму квадратов итогов по строкам, деленную на число наблюдений в строке

                                           (1.49)

6. квадрат  общего итога, деленный на число  всех наблюдений (корректирующий член),

                         (1.50)

7. сумму  квадратов столбца

                                    (1.51)

8. сумму квадратов для строки

                                     (1.52)

9. общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом

                                   (1.53)

10. остаточную сумму квадратов

  (1.54)

11. дисперсию

                                             (1.55)

12. дисперсию

                                            (1.56)

13. дисперсию

                                (1.57)

Результаты  расчета можно представить в  виде таблицы дисперсионного анализа.

 

Таблицы №4.

Двухфакторный дисперсионный анализ (без повторениями опытов).

Источник

дисперсии

Число степеней свободы

Сумма

квадратов

Средний

квадрат

Математическое ожидание среднего квадрата

А

k-1

     

В

m-1

     

Остаток

(k-1)(m-1)

 

 

 

 
 

Общая сумма

km-1

 

 

 

-

 

-


 

Установив при помощи дисперсионного анализа  значимость влияния данного фактора, выясним затем при помощи критерия Стьюдента или рангового критерия Дункана, какие именно средние значения y различны.

Линейная  модель (1.29) справедлива, если между  факторами А и В нет взаимодействия. В противном случае взаимодействию как фактору присуща своя дисперсия . Взаимодействие АВ, служит мерой того, насколько влияние фактора А зависит от уровня В, и наоборот, насколько влияние фактора В зависит от уровня А. В приведенном алгоритме при наличии взаимодействия между факторами , как составная часть, входит в дисперсию . Выделить можно только при наличии параллельных наблюдений.

Пусть при  каждом сочетании уровней факторов А и В производится n параллельных опытов. Так, в таблице №2 в ячейке, образованной пересечением i-го столбца и j-й строки целая серия наблюдений yij1, yij2,…, yijn. Сохраним обозначение за средним результатом в ячейке. Выборочная дисперсия результатов в каждой ячейке

                                 (1.58)

имеет n-1 степеней свободы. Если выборочные дисперсии по всем ячейкам однородны, их можно усреднить и использовать полученную средневзвешенную дисперсию

                                        (1.59)

в качестве оценки дисперсии воспроизводимости σ2. Число степеней свободы равно mk(n-1). Более удобная формула для вычисления дисперсии воспроизводимости

                       (1.60)

где

- сумма наблюдений в ij-й ячейке.

При проведении дисперсионного анализа при нелинейной модели удобно использовать следующий  алгоритм расчета. По таблице №2 находят: 1. суммы наблюдений в каждой ячейке

 

 

                                                   (1.61)

2. квадрат  сумм наблюдений в каждой ячейке

                                       (1.62)

3.итоги по столбцам

                                      (1.63)

4. итоги  по строкам

                                      (1.64)

5. сумму всех наблюдений (общий итог)

                      (1.65)

6. сумму  квадратов всех наблюдений

                               (1.66)

7. сумму квадратов итогов по столбцам, деленную на число наблюдений в строке

                                              (1.67)

8. сумму  квадратов по итогам по строкам,  деленную на число наблюдений  в строке

Информация о работе Дисперсионный анализ