Автор работы: Пользователь скрыл имя, 23 Июня 2014 в 19:49, лекция
Рассмотрены идеология имитационного моделирования (основы системного подхода), процедура построения моделей (табличное программирование), приемы и примеры моделирования реальных биоэкологических объектов, в том числе аппроксимация функций, декомпозиция сложных криволинейных зависимостей на более простые, декомпозиция сложных распределений на серию нормальных, интеграция серии простых моделей в общую более сложную модель, описание динамики многокомпонентных систем с помощью латентных переменных и мн. др.
2.1. Увеличение числа значений независимой переменной
Ставя задачей поиск закономерностей, эмпирические данные группируют в массивы; блоки реальных независимых и зависимых переменных представлены уже не единичным значением, а сериями. Можно говорить о четырех основных способах тиражирования (декомпозиции) значений независимой переменной (нетрудно представить их комбинации):
— временные ряды (серия шагов по временной, возрастной шкале),
— градация фактора (серия доз, уровней факторов, расстояния и пр.),
— статус, габитус (множество объектов разного качества),
— выборка (наборы однотипных, но индивидуально различимых вариант).
Чисто технически расширение имитационной системы состоит во вводе дополнительных строк, каждой из которых отвечает новый временной шаг (доза, варианта). Интеграция усложнившейся системы идет по двум направлениям. Это, во-первых, обобщение всех квадратов разности в одно значение функции невязки (ФН), во-вторых, организация блока критерия адекватности (КА) модели исходным данным. Вместе с ними имитационная система состоит уже из 7 блоков, что соответствует детальной схеме, рассмотренной выше в разделе Имитационная система, и примеру из Введения.
2.2. Отличия шагов: весовые коэффициенты у объектов
Репрезентативность исходных данных, относящихся к разным строкам массива (обычно зависимых переменных), может отличаться. В этом случае их участие в настройке модельных параметров должно быть скорректировано с помощью весовых коэффициентов (В), оформленных отдельным блоком. Понятно, что чем больше "вес" объекта, тем выше должен быть его вклад в целевую функцию ФН = СУММ(В*КР). В простейшем случае роль весов могут играть соответствующие объемы выборок; пример приведен в разделе Экстремумы.
2.3. Исключение шагов: пробелы в исходных данных
Если значения зависимых переменных получены не для всех временных шагов (градаций, объектов), исходный массив будет содержать пропуски. Поскольку динамическая модель "живет своей жизнью", она воспроизведет соответствующие расчетные значения, которые, тем не менее, не с чем сравнивать. В этом случае значения квадратов разности (КР) в соответствующих строках не рассчитываются, и минимизация функции невязки идет с учетом только имеющихся данных. Настройка модели осуществляется по отдельным опорным точкам. Пример рассмотрен в разделе Пробелы в данных.
2.4. Объединение шагов
Когда по методическим причинам регистрация данных на каждом временном шагу невозможна, появляются массивы данных, содержащие накопленный результат за несколько временных шагов. В этом случае модельный блок должен состоять из двух компонентов:
— модели, отражающей "правильную" временную динамику с регулярным ходом времени,
— модели, аккумулирующей результаты первого блока в соответствии со структурой исходных данных.
Такой случай характерен при изучении возрастного состава популяций, когда известна численность животных не каждого возраста отдельно, а лишь для разновозрастных групп, объединяющих особей разного возраста — молодых, взрослых, старых; пример расчетов дан в разделе Сети связей.
2.5 Дифференциация шагов
Часто встречается ситуация, когда отдельные временные шаги (градации фактора) представлены выборками вариант (причем разного объема). Здесь становится важным не только отразить общую динамику системы, но и не утратить информацию по индивидуальным отличиям (см. раздел Индивидуализация модельных переменных). Модельный блок вновь включает две части:
— общую модель, реализующую "плавный", последовательный ход времени (шаг 1, 2, 3…),
— модель, имитирующую особенности вариант в пределах каждого шага (1a, 1b… 2a, 2b, 2c…).
3. Увеличение числа независимых переменных
В природе, как правило, состояние объектов определяется несколькими факторами внешней среды. Модель, изучающая влияние нескольких независимых переменных на одну зависимую, должна содержать уже несколько наборов параметров (П1 и П2), на основе которых вычисляются модельные переменные; пример на этот счет показан в разделе Сети связей.
4. Увеличение числа зависимых переменных
Обычно у изучаемых объектов регистрируют несколько признаков. В этом случае блок внешних данных включает несколько зависимых переменных (ЗП1, ЗП2). Понятно, что и модельный блок должен содержать соответствующее число явных переменных (ЯП1, ЯП2) со своими наборами параметров (на рис. 3.1 они не указаны, также опущены связи с независимыми переменными).
По существу, речь идет о создании двух соподчиненных моделей. Их интеграция в рамках имитационной системы должна идти путем формирования общей функции невязки. Каждая комплиментарная пара зависимых и явных переменных (ЗП1 и ЯП1, ЗП2 и ЯП2) служит для расчета своей, частной, целевой функции (ФН1 и ФН2). Когда единицы измерения или порядок величин разных переменных отличаются, тогда нельзя вычислять общую целевую функцию путем простого суммирования этих значений, необходимо вводить весовые коэффициенты для отдельных переменных (В1, В2). В простейшем случае в качестве весов можно принять обратную величину от средней арифметической данной зависимой переменной. Такой вариант рассмотрен в разделах Усреднение…, Сети связей.
5. Синтез нескольких моделей
Этот случай формально похож на предыдущий. Когда один и тот же объект исследования описан разными частными моделями, может появиться задача сведения их в единую общую модель (подробнее см. раздел Сети связей). С позиций перестройки имитационной системы это означает:
— установление взаимосвязи между моделями (создание перекрестных ссылок в модельных формулах),
— взвешенное обобщение частных модельных функций невязки в одно общее значение.
6.1. Увеличение числа модельных переменных: наведение
Самая интригующая сторона имитационного моделирования — это изучение ненаблюдаемых переменных. Модельный блок расширяется за счет организации скрытых переменных. Эти скрытые переменные (СП1, СП2) со своими параметрами (П1, П2) участвуют в формировании явной переменной (ЯП), которая вместе с независимой переменной используется для расчета функции невязки.
В простейшем случае скрытые переменные выступают в роли неизвестного фактора среды (имитация независимой переменной), влияние которого сказывается на динамике системы. Пример приведен в разделе Скрытые переменные.
6.2. Увеличение числа модельных переменных: декомпозиция
Второе применение латентных переменных состоит в декомпозиции изучаемого объекта на слагаемые. Скрытые переменные (СП1, СП2) в сумме формируют явную переменную, которая и сопоставляется с независимой переменной. Наиболее интересны случаи декомпозиции сложной функции (раздел Декомпозиция кривой), сложного распределения (Анализ распределения), динамики многокомпонентной модели (Усреднение или параметризация), а также в особых случаях создания переменного параметра (Пропуски в данных).
Все рассмотренные фреймы имитационных систем применялись автором для решения разнообразных проблем, возникающих в практике биолого-экологического исследования.
Аппроксимация кривой
В среде пакета Excel есть возможность строить уравнения простых зависимостей (линейной, степенной, экспоненциальной) с помощью встроенной функции “Добавить линию тренда”. Доступ к этой функции открывается, если выбрать стрелкой предварительно построенную диаграмму типа “Линия” или “Зависимость х-у” и вызвать контекстное меню (правой кнопкой мыши). В случаях, когда зависимость между изучаемыми признаками имеет более сложную форму, приходится пользоваться специальными статистическими пакетами типа StatGraphics.
Предлагаемая нами система моделирования позволяет строить уравнения зависимости переменных самого разнообразного характера и снабжать их оценкой адекватности исходным данным.
В качестве примера рассмотрим описание характера реакции представителей пресноводного зоопланктона Карелии Simocephalus serrulatus на калий – основной компонент сточных вод Костомукшского горно-обогатительного комбината (данные любезно предоставила Н. М. Калинкина). Изучали две группы рачков – взятых непосредственно из лабораторной культуры и выросших в среде с небольшой добавкой токсиканта (20 мг/л). Учитывали долю (Dреал., %) погибших животных в средах с разной концентрацией ионов калия [K]. Результаты представлены на рис. 3.2. Они хорошо могут быть описаны S-образной кривой, характеризующей реакции типа “доза-эффект” большого класса биосистем (Прозоровский, 1962; Безель и др., 1994).
Для количественной характеристики этой зависимости используется логистическое уравнение (Лакин, 1973) вида:
У = C + A/ (1+eaХ+b),
где С – нижний предел изменения зависимой переменной У,
А – верхний предел.
В нашем случае С=0 (нет гибели в низких концентрациях), А=100 (полная гибель в высоких концентрациях). В табл. 3.1 представлена имитационная система, использующая формулу логистической кривой для построения модели вымирания по данным опыта:
Dмод. = A/ (1+ea[K]+b).
В формате Excel уравнение принимает следующий вид (для ячейки C6):
[C6] = C$3/(1+EXP(C$1*A6+C$2)).
При настройке модели в качестве изменяемых параметров были взяты только a и b, третий, А=100, оставался неизменным. Модель значима (р<<0.001).
Расчеты позволили построить гладкие кривые логистической зависимости “доза-эффект”, по которым можно графически определить важный токсикометрический параметр – среднюю смертельную концентрацию, LC50, опустив нормаль на ось абсцисс (C) из точки кривой D=50%. Как видно по этим данным (рис. 3.2), акклимированные рачки переносят гораздо более высокие концентрации калия (LC50=112), чем контрольные (LC50=68 мг/л).
Пропуски в данных
Реальные ряды наблюдений зачастую содержат пропуски, пробелы и разрывы, когда в очередной момент времени определенное значение какой-либо переменной осталось неизмеренным, неизвестным.
При статистическом анализе многомерного массива данных исследователь всегда оказывается перед дилеммой: либо выбросить ряд (или столбец) с пробелом, либо заполнить его каким-либо значением. В практике многомерного анализа используется заполнение значением средней арифметической, рассчитанным прямо или по регрессии, а также с помощью метода главных компонент (Енюков, 1986, с. 56-61). После заполнения всех пропусков массив данных может быть обработан одним из методов. Когда результаты статистических расчетов начинают характеризовать специфику метода заполнения пробелов, их ликвидация становится неоправданной.
Таблица 3.1. Фрагмент листа Excel с результатами расчета параметров логистической зависимости доли погибших рачков от концентраций токсиканта.
A |
B |
C |
D |
E | |
1 |
a = |
-0.181 |
|||
2 |
b = |
12.684 |
|||
3 |
А = |
100 |
Ф = |
722 | |
4 |
Конц. |
Dреал. |
Dмод. |
||
5 |
45 |
0 |
1 |
1 | |
6 |
50 |
0 |
3 |
7 | |
7 |
55 |
10 |
6 |
14 | |
8 |
60 |
30 |
14 |
253 | |
9 |
65 |
20 |
29 |
79 | |
10 |
70 |
50 |
50 |
0 | |
11 |
75 |
60 |
71 |
128 | |
12 |
80 |
100 |
86 |
195 | |
13 |
85 |
100 |
94 |
38 | |
14 |
90 |
100 |
97 |
7 | |
15 |
|||||
16 |
Варьирование |
С |
df |
S2 | |
17 |
Общее |
17122 |
10 |
||
18 |
Остаточное |
722 |
8 |
90 | |
19 |
Модельное |
16400 |
1 |
16400 | |
20 |
F = |
182 |
Информация о работе Имитационное моделирование в среде ms excel