Автор работы: Пользователь скрыл имя, 23 Июня 2014 в 19:49, лекция
Рассмотрены идеология имитационного моделирования (основы системного подхода), процедура построения моделей (табличное программирование), приемы и примеры моделирования реальных биоэкологических объектов, в том числе аппроксимация функций, декомпозиция сложных криволинейных зависимостей на более простые, декомпозиция сложных распределений на серию нормальных, интеграция серии простых моделей в общую более сложную модель, описание динамики многокомпонентных систем с помощью латентных переменных и мн. др.
Блок функции отличий (невязки) образован множеством формул, рассчитывающих отличие каждой пары комплиментарных реальных и модельных значений вида (Пэнтл, 1979):
ф = ВЧ×( Y' —Y)2,
где
В – “вес” данной переменной в общем массиве переменных.
Если переменных больше, чем одна, формула принимает вид (для одного временного шага):
ф = SS ВjЧ×( Y'j —Yj)2,
где
j – индекс переменной, всего m переменных (j = 1, 2,…m),
SS – суммирование по всем m переменным.
На листе Excel массив из этих формул образует блок различий между всеми парами значений модельных и реальных переменных. Сумма отличий по всем шагам образует искомую функцию отличий:
Ф = SSSS ВjЧ×( Y'ji —Yji)2. ,
где
i – индекс шага модели, всего n шагов (i = 1, 2,…n),
SS – суммирование по всем n шагам и по всем m переменным.
Эта сумма занимает отдельную ячейку и используется для настройки модели. В простейшем случае, когда “вес” единственной переменной принимают за единицу, имеем:
Ф = SS(Y'i —Yi)2.
Блок настройки модели служит для поиска параметров модели. Механизм настройки состоит в исследовании качества работы модели с разными наборами значений параметров и выборе лучшего из них. Исходно вычисляют функцию невязки (Ф1) при некоторых заданных базовых значениях параметров. Затем изменяют их на некоторую небольшую величину и рассчитывают новое значение функции невязки (Ф2). Если Ф2<Ф1, значит, новые значения параметров лучше прежних, их принимают за очередные базовые и процедура повторяется. Существуют эффективные алгоритмы быстрого поиска лучших значений параметров. Процедура заканчивается, когда функция отличий снизится до минимально возможного уровня, в идеале – до нуля: при А ®® оптимум, Ф ®® 0.
Можно полагать, что в этом случае полученные значения параметров будут оптимально характеризовать механизм наблюдаемого явления. Часто говорят не “настройка параметров модели”, а “настройка модели”, подразумевая, что модель приобретает некоторые свойства реального природного объекта.
Поставленная задача – уменьшение значений функции отличий до нуля при изменении неких параметров – есть математическая задача минимизации (частный случай задачи оптимизации), которая решается с помощью численных методов. Теоретическая подоплека процедуры оптимизации детально изложена в четвертой главе Теория оптимизации.
На первых порах экологу нет необходимости проникать во все нюансы метода, первая главная задача состоит в освоении процедуры построения моделей и их настройки в среде Excel. Однако ответственное отношение к результатам моделирования требует понимания существа процесса, происходящего во время настройки.
С практической точки зрения достаточно того, что пакет Excel располагает встроенной программой оптимизации – это “Решатель” (“Solver”), который вызывается командой “Поиск решения” (меню “Сервис”). Помимо действий по заполнению открывшегося окна этого макроса, описанных во Введении, может потребоваться перенастройка параметров его работы (см. раздел Параметры макроса) или задание условий выполнения настройки (см. раздел Процедура моделирования, Прогноз как гипотеза).
Блок статистической оценки служит для решения вопроса: соответствует ли модель реальным данным? Распространены четыре способа:
1) расчет коэффициента корреляции между модельными и опытными переменными (Акоф, Сасиени, 1971, с. 457),
2) проверка работы
модели на независимо
3) оценка значимости модельных параметров с использованием статистической ошибки, полученной путем рандомизации (Безель, 1987),
4) оценка остаточной
дисперсии и дисперсионный
Рассмотрим последний достаточно простой способ. Как правило, многие значения изучаемой реальной переменной y не совпадают с модельными значениями той же переменной Y и на диаграмме располагаются по соседству с модельной линией графика. При этом отклонение отдельной варианты yij от общей средней Y будет состоять из двух слагаемых: отклонения варианты от своего модельного прогноза и отклонения прогноза от средней величины признака для всей выборки: (yij –Y) = (yij – Yi ) + (Yi –Y).
Обобщая эту модель для всех вариант, приходят к схеме дисперсионного анализа (Браунли, 1977, с. 309-320): изменчивость признака y складывается из варьирования, учтенного моделью, и из варьирования по случайным причинам, т. е. остаточного (табл. 2.9).
На листе Excel некоторые из этих величин уже рассчитаны. Значение функции отличия численно равно остаточной сумме квадратов:
Ф = Состат.= SS (yi – Yi)2;
остаточная дисперсия определяется из отношения:
s2 остат. = Ф/(n-1).
Общую сумму квадратов (Собщ. = SS(yi –Y)2) можно вычислить, используя встроенную в Excel функцию стандартного отклонения (=СТАНДОТКЛОН(блок ячеек)), возведя полученное значение в квадрат и умножив на число степеней свободы. Модельная сумма квадратов (С мод. = SS(Yi –Y)2) есть разность между общей и остаточной:
С мод. = Собщ. – Состат. ;
это же значение равно модельной дисперсии, поскольку ее число степеней свободы df мод.=1:
s2 мод.= С мод. / df мод. = С мод. / 1 = С мод.
После предварительных расчетов с помощью критерия Фишера можно проверить нулевую гипотезу Но: а=0, параметр модели значимо от нуля не отличается (Браунли, 1977, с. 314), или предсказания модели в целом неадекватно описывают исходные данные. Конструкция критерия исследует вопрос: превышает ли варьирование, учтенное моделью, случайное (остаточное) варьирование? Критерий Фишера вычисляется как отношение модельной и остаточной дисперсии:
F(0.05; 1, n-2) = s2 мод./s2 остат.
Если значение критерия окажется выше табличного, значит, дисперсия реального признака y приближается по величине к дисперсии модельного признака Y, т. е. существенно превышает (случайные) отличия между ними. Значение критерия ниже табличного свидетельствует о существенных отличиях между реальными и модельными данными, о плохом согласовании модели с реальностью, о неадекватности модели.
Таблица 2.9. Дисперсионный анализ для проверки адекватности модели исходным данным
Составля-ющие дисперсии |
Суммы квадратов
С |
Формулы расчета суммы квадратов |
Степени свободы df |
Дисперсии |
Наклон модельной линии |
С мод. = SS (Yi –Y)2 |
Cxy 2 / Cx2 |
1 |
s2 мод.= C мод./df мод. |
Отклонения вариант от точек модели |
С ост. = SS (yi – Yi)2 |
C общ. – C мод. |
n–2 |
s2 остат.= Cост./df остат. |
Общая дисперсия (всего) |
С общ. = SS (yi –Y)2 |
SS yi2 – (SSyi)2 /n |
n–1 |
s2 общ = C общ../df общ. |
Имитационные модели позволяют рассчитать значения не одной переменной (Y'), но нескольких (Y1', Y2' …), каждая из которых может иметь свою статистическую природу. Комплексным показателем может служить показатель точности имитации (Безель, 1987, с. 28):
_________________________
S = Ö 100 SS [(aЭ – aM)/ aM] 2/ (m-1),
где aЭ, aM – эмпирические и модельные средние арифметические для m переменных.
Для обобщенной оценки адекватности имитационной модели используют метрики сходства корреляционных (или ковариационных) матриц, рассчитанных по исходным данным и модельным прогонам. Значение таких методов состоит в возможности статистического доказательства адекватности модели с помощью критерия хи-квадрат.
Блок графического представления результатов есть ни что иное, как диаграмма; возможности для визуализации данных в среде Excel необычайно широки. Отображение связи между зависимыми и независимыми переменными уже на самых первых шагах моделирования поможет определить вид модели, выбрать подходящие формулы для ее построения. Диаграмма помогает найти уклонения модельных приближений от действительности.
Отношения между компонентами имитационной системы формируют функциональное единство, ориентированное на достижение общей цели – оценку параметров модели (рис. 2.6, табл. 2.10). В осуществлении отдельных функций, обозначенных стрелками, одновременно участвуют по несколько элементов. С тем чтобы не загромождать картину, на схеме не отражены блоки графического представления и рандомизации. Имитационная система призвана обслуживать любые изменения конструкций модели, которые в случае необходимости могут быть внесены исследователем. Базовые конструкции имитационных систем, а также возможные пути их декомпозиции и интеграции представлены в разделе Фреймы имитационных систем.
Таблица 2.10. Частные функции имитационной системы
№ стрелки |
Выполняемая функция |
1 |
Наблюдаемое природное явление: независимые реальные переменные влияют на зависимые |
2 |
Расчет значений модельных переменных с использованием значений независимых реальных переменных и значений параметров |
3 |
Расчет функции отклонения между реальными и модельными переменными |
4 |
Настройка параметров модели с помощью макроса “Поиск решения” (оптимизация) |
5 |
Оценка адекватности модели (дисперсионный анализ: расчет значений общей и остаточной дисперсии) |
Блоки имитационной системы в среде Excel располагаются на одном листе. В дальнейшем мы в основном будем придерживаться указанного порядка размещения компонентов имитационной системы (рис. 2.5). Специальные задачи (рандомизация, графическое представление результатов и пр.) могут увеличивать число компонентов.
Пример с популяцией гадюки
Предварительно рассчитанная динамика встречи меченых гадюк в пробах плохо соответствует реальным значениям. Рассчитаем степень отличия модели от наблюдений, используя формулу:
ф=(m-m')2 , или
[I3] =(C3-G3)^2,…(табл. 2.11, графа ф),
и суммировав все найденные отличия:
[I8] =СУММ(I3:I6).
В таблице 2.11 величина обобщенного отличия (функция невязки) составила Ф=109. Понятно, что если бы модель абсолютно точно описывала реальность, то это значение было бы равно нулю.
Таблица 2.11. Имитационная система с моделью снижения числа меченых гадюк до настройки параметров
A |
B |
C |
D |
E |
F |
G |
H |
I | |
1 |
Год |
n |
m |
N' |
d' |
M' |
m' |
ф | |
2 |
1994 |
158 |
5000 |
158 |
|||||
3 |
1995 |
365 |
18 |
5000 |
0.1 |
142 |
10 |
58 | |
4 |
1996 |
273 |
10 |
5000 |
0.1 |
128 |
7 |
9.1 | |
5 |
1997 |
214 |
10 |
5000 |
0.1 |
115 |
5 |
26 | |
6 |
1998 |
238 |
9 |
5000 |
0.1 |
104 |
5 |
17 | |
7 |
|||||||||
8 |
S= |
4.2 |
N= |
5000 |
Ф= |
109 | |||
9 |
df= |
3 |
Nd= |
500 |
DОСТ.= |
36 | |||
10 |
SQ= |
53 |
Nb= |
500 |
F= |
-1.6 | |||
11 |
DМод..= |
-57 |
d%= |
10 |
Информация о работе Имитационное моделирование в среде ms excel