Имитационное моделирование в среде ms excel

Автор работы: Пользователь скрыл имя, 23 Июня 2014 в 19:49, лекция

Краткое описание

Рассмотрены идеология имитационного моделирования (основы системного подхода), процедура построения моделей (табличное программирование), приемы и примеры моделирования реальных биоэкологических объектов, в том числе аппроксимация функций, декомпозиция сложных криволинейных зависимостей на более простые, декомпозиция сложных распределений на серию нормальных, интеграция серии простых моделей в общую более сложную модель, описание динамики многокомпонентных систем с помощью латентных переменных и мн. др.

Прикрепленные файлы: 1 файл

Имитационное моделирование в среде ms excel (на примерах из экол.doc

— 3.27 Мб (Скачать документ)

Стохастические модели исследуют сложное поведение случайных величин и для расчетов используют формулы законов распределения. Кроме того, для них требуется специфическая организация расположения частей модели на листе Excel. Объектами настройки в таких моделях выступают параметры распределений – средние, дисперсии, объемы выборок.

Автоматные модели, отражающие дискретные события и поведение, должны содержать логические функции, в первую очередь функцию листа Excel =ЕСЛИ(). Эта функция определяет смену состояний моделируемой системы в соответствии с изменившимися внешними условиями среды. При этом динамика состояния окружающей среды может быть описана алгебраическими моделями. Цель автоматного моделирования состоит в определении критических (штатных) уровней переменных, на стабилизацию которых направлено поведение системы.

 

Пример с популяцией гадюки

На этапе Декомпозиция выбираем для нашего случая  (см. раздел Этапы моделирования) алгебраическую модель.

В популяционной экологии для оценки репродуктивных параметров популяции по реальным данным повторного отлова меченых животных обычно используются детерминистические модели (Коли, 1979). Простейший метод расчета численности (метод Петерсена) основан на “химической” пропорции, учитывающей “растворение” меченых и выпущенных особей среди остальных членов популяции: доля меченых особей в частной пробе (m/n) равна доле меченых животных во всей популяции (M/N):

m/ n  = M/ N, 

где

   m – число меченых особей в пробе,

n – объем пробы,

M – число меченых  особей в популяции,

N – численность всей  популяции.

Отсюда вытекает известная формула для расчета общей численности популяции:

N = M· n/ m,

а также формула для расчета числа меченых особей в отдельной пробе:

m = M· n / N.

В отношении островной популяции гадюк этот метод частично пригоден (отсутствуют массовые миграции особей с острова), частично не пригоден (в промежутках между отловами животные гибнут). Для того чтобы метод подходил к конкретному случаю, следует модифицировать базовую формулу, введя, во-первых, дополнительную переменную, ежегодную смертность (Nd), во-вторых, развернуть модель по вектору времени. Конструирование модели показано далее.

 

Построение блок-схемы

 

На этом этапе моделирования можно эффективно воспользоваться простыми правилами, описанными в разделе Системный подход. Схема может быть структурно-функциональной (блоками обозначены потоки, а стрелками – функции) или функционально-структурной (блоками обозначены функции, стрелками – потоки).

 

Пример с популяцией гадюки

Процесс мечения и повторного отлова гадюк представлен в виде структурно-функциональной блок-схемы (рис. 2.2). Она соответствует модели Петерсена, дополненной блоками гибели и пополнения животных. На каждом этапе мечения (в каждый год) из популяции численностью N особей отлавливается выборка из ni особей. Если это не первый отлов, то среди них может оказаться mi меченых животных. Остальных Mi немеченых метят, затем всех отпускают. После “перемешивания” концентрация меченых особей в популяции увеличивается. В последующий период до очередного мечения часть животных в популяции погибает (Nd), часть переходит из младших возрастных групп в старшие и начинает встречаться на маршрутах (Nb). Таким образом концентрация меченых особей в популяции уменьшается.

Регрессионные и имитационные модели

 

Для обоих видов моделей основой выступают конкретные характеристики реальной системы. Однако способ вычисления модельных параметров и область применения моделей существенно отличаются в пользу имитационных моделей. Они могут полностью выполнить функции регрессионного анализа; для этого строятся описательные модели (когда значения переменных определяются текущим состоянием системы). Кроме того, имитационные модели могут отображать преемственное развитие процесса, т. е. они могут быть динамическими (когда значения переменных определяются предыдущим состоянием системы). Эти отличия связаны с конструктивными особенностями моделей разных видов.

 

Конструкция и настройка

Имитационная модель самодостаточна. Во-первых, она физически существует в электронной среде, она реализуется отдельными  формулами  для  каждого  шага,  для  каждой варианты. Во-вторых, ее параметры не вычисляются, но назначаются — либо самим исследователем, либо внешней процедурой оптимизации. Реальные данные используются  лишь для придания смысла уже существующим значениям модельной выборки или модельной динамики. По этой причине для настройки модели достаточно всего двух исходных значений — стартового и контрольного.

Регрессионная модель не самостоятельна. Вычисление коэффициентов регрессии обеспечивает виртуальное существование модели (уравнения регрессии): это потенциальный способ описания связи переменных, который может быть и не представлен реально в виде теоретических значений переменных. При этом регрессионная модель целиком и полностью определяется имеющимися наблюдениями, значениями исходных переменных.

Описание и имитации

По определению, статистическая варианта, или значение случайной величины, состоит из двух частей: из доли, привнесенной влиянием на изучаемый объект систематических (регулярных, доминирующих, регистрируемых, изучаемых) факторов, и доли, добавленной действием случайных (неизвестных) факторов:

Yобщ.=Yсистем.±±Yслучайн.

В центре регрессионного анализа стоит варианта, несущая пару значений, Xi и Yi, привязанных к текущему i-му моменту наблюдений. Роль систематического фактора отводится независимой переменной X:

Xi ® Yi и формула варианты имеет вид: Yобщ.=YX±±Yслучайн.

Это выражение означает, что величина признака X отразилась на величине признака Y, а для каждой варианты — что значение Xi уже полностью сказалось на значении Yi. История становления значения Yi не рассматривается, техника расчетов не принимает во внимание никакие предыдущие значения Xi-1 или Yi-1, участвующие в формировании текущего значения Yi.

Применяемая в имитационном моделировании процедура настройки модельных параметров снимает практически любые ограничения не темпоральную удаленность влияний. В результате меняется и строение варианты, и строение модели, которая становится динамической. Отдельное значение варианты любой переменной рассматривается как результат влияния предыдущих значений других переменных, причем как известных, так и неизвестных:

Yобщ.=YX1, Z2…±±Yслучайн. 

···                   Z i-2

 

X i-1 


 

           Y i

Тем самым каждое значение переменной оказывается обусловленным не только текущим состоянием системы, но всей предшествующей историей ее существования. При этом включение в модель эффектов влияния предшествующих значений переменных происходит без изменения исходной структуры данных. Произвольно изменяя продолжительность задержки влияния одних переменных на другие, можно обнаружить источники этих задержек, в частности, выйти на недостающие звенья в причинно-следственной цепи событий.

Аналогичный анализ можно провести и с помощью регрессионных моделей, смещая временные ряды переменных на один или несколько временных шагов для каждого варианта пересчета модели. Однако для этого каждый раз требуется перестраивать исходную матрицу, что особенно сложно выполнить для многомерных моделей. Пример динамической модели с задержками рассмотрен в разделе Сети связей.

 

Моделирование обратных связей

Существенные преимущества имитационной модели перед регрессионной состоят в возможности учета синхронного взаимовлияния переменных, когда предыдущее значение переменной Xi-1 определяет текущее значение переменной Yi, и одновременно с этим предыдущее значение переменной Yi-1 определяет текущее значение переменной Xi. Речь идет о количественном описании обратной связи.

Xi-1         Yi-1


 

Xi          Yi

Здесь регрессионная модель серьезно проигрывает. Чисто технически два уравнения системы (Xi = f(Yi-1) и Yi = f(Xi-1)) много проще получить, настроить и изучить путем имитации, безо всякой перестройки исходной матрицы данных, тогда как для расчета соответствующих двух уравнений регрессии требуется сформировать два разных массива:

X2, …Xi, …   Xn            

Y1,… Yi-1, …Yn-1       — для расчета зависимости Xi = f(Yi-1) и

Y2, …Yi , …  Yn

X1, …Xi-1, …Xn-1       — для расчета зависимости Yi = f(Xi-1).

Если переменных больше, чем две, задача учета взаимовлияния требует гигантской вычислительной работы (Славин, 1989, с. 169–190), становясь практически неразрешимой; сеть обратных связей нельзя изучить иным способом, нежели их имитацией. Коэффициент корреляции не может быть выходом из этой сложной ситуации, поскольку он сообщает лишь “силу” зависимости переменных, но не дает формулу преобразования потоков.

 

Описание данных с пропусками

Сильной стороной имитационной системы выступает регулируемая степень зависимости модели от исходных данных. Имитационная модель “живет своей жизнью”, лишь косвенным путем черпая в исходных данных информацию об уровнях параметров — через сравнение блока расчетных значений переменных и блока аналогичных реальных значений. При этом натурные данные могут содержать пропуски, могут быть даже фрагментарны и отстоять друг от друга на значительные промежутки времени. Все равно, используя технику минимизации функции невязки, можно оценить величины параметров модели.

Более того, построив “самостоятельно живущую” модель, появляется возможность организовать проверку совпадения модели с реальностью раздельно на разных участках рядов наблюдений. Тем самым можно последовательно приближаться к наилучшему решению (оптимальным значениям параметров), постепенно добавляя все новые “точки соприкосновения” модели с реальностью при расчете функции отличий.

Регрессионная же модель требует, чтобы все пары вариант содержали числа. Фрагментарность в данных недопустима. Если в исходных материалах встречаются пропуски, то применяется специальная техника для их заполнения. Например, вместо отсутствующих реальных значений переменных вставляются их средние значения или величины, рассчитанные на базе компонентного анализа (Енюков, 1986, с. 59). В любом случае доля пропусков должна быть невелика, иначе такая модель станет характеристикой способа заполнения пробелов в наблюдениях. Особенно ощутимо для регрессионных моделей отсутствие данных во временных рядах, поскольку при этом утрачивается преемственность явлений и анализ лишается смысла. Необходимый пример показан в разделе Пропуски в данных.

 

Имитация систем без явных данных

С помощью имитационного моделирования можно не откладывать “на потом” анализ остатков, как это практикуется в регрессионном исследовании, но одновременно с настройкой параметров по известным (явным) переменным пытаться изучить и неизвестные факторы, влияющие на систему, введя их в модель как скрытые переменные (см. разделы Описание переменных). Рассчитанные в процессе моделирования значения этих переменных могут рассматриваться в качестве оценок неких факторов (или их совокупности), идентифицировать которые можно, если сопоставить эти оценки с дополнительными наборами характеристик околосистемной среды. Примеры на эту тему рассмотрены во многих последующих разделах (см. Скрытые переменные).

 

Упрощение  модельной структуры

Одно из развитых направлений биометрических исследований с помощью регрессионного анализа — это поиск сложных эмпирических уравнений, как можно более точно описывающих взаимосвязь переменных. В вариационной статистике разработаны достаточно простые методы преобразования исходных данных, позволяющие в конечном итоге получать модель любого вида. С точки зрения биоэколога, такого рода обобщенные описания служат лишь первым шагом в изучении причин явлений. Дальнейшие шаги должны быть направлены на выяснение причин сложного вида зависимости переменных. Исходные уравнения при этом должны быть декомпозированы на составные компоненты, на более простые уравнения, описывающие отношения между элементами системы. Так удается установить тонкие механизмы изучаемого процесса (содержащего обратные связи), и, кроме того, во многом упростить вид описывающих его частных моделей. Становится возможным перейти от одного сложного уравнения кривой к нескольким более простым или разделить общее сложное распределение на серию универсальных (например, нормальных), имеющих прозрачную биологическую интерпретацию. Сделать это, оказывается, проще всего с помощью имитационной модели. Эти приемы показаны в разделах Декомпозиция кривой, Анализ распределения.

 

Точность описания криволинейных зависимостей

Построение имитационных моделей позволяет упростить процедуру оценки значений параметров криволинейных зависимостей и даже уточнить эти значения. Общеизвестно, что коэффициенты регрессии вычисляют с помощью метода наименьших квадратов, который требует линейной зависимости между переменными (Браунли, 1977). Если исходные признаки фактически связаны криволинейно, то для получения уравнения криволинейной регрессии эти данные предварительно преобразуют (логарифмируют, извлекают корень, находят обратные значения и т. д.) (Лакин, 1973; Зайцев, 1990 и др.). Выбор вида преобразования зависит от предполагаемой формы связи переменных и в случае сложной зависимости представляет отдельную проблему (Тьюки, 1981, с. 105–106). После этого этапа рассчитываются параметры линейной модели для преобразованных данных. Наконец, в завершение всего выполняют обратное преобразование, но уже параметров модели. Уравнение при этом принимает вид криволинейной зависимости.

Но вот выясняется, что первоначальное преобразование данных не полностью компенсируется последующим обратным преобразованием параметров, при этом накапливается систематическая ошибка (Гильманов, 1987, с. 88). В частности, при расчете параметров степенной функции исходные данные логарифмируются, после чего отыскивается наименьшая сумма квадратов отклонений логарифмированных данных от линии регрессии. Но квадраты логарифмов значений при обратном преобразовании отличаются от квадратов исходных значений, поэтому и местоположение построенной таким способом линии регрессии отличается от динамики групповых средних. В отличие от описанной процедуры настройка параметров имитационной модели не требует предварительного преобразования, она рекомендуется для получения более точных оценок параметров криволинейных моделей любого вида (Zar, 1968; цит. по: Гильманов, 1987, с. 88).

В качестве примера рассмотрим модель из Введения. Настройка имитационной модели по исходным данным дает степенное уравнение N м. = 63.2·У2.41 (табл. 2.2, блок параметров С1:С2). Следующего, пятого, укуса приходится ждать от гадюки под номером 3073. Регрессионная модель, построенная по тем же данным, имеет другие коэффициенты N р. = 12.3·У3.68 и дает другой прогноз — роковой станет 4555 особь. В поисках источника различий построим блок расчета функции невязки с этими значениями параметров (табл. 2.2, блок E1:F9). Хорошо видно, что регрессионная модель хуже описывает исходные данные, поскольку  для нее функция невязки оказалась выше, чем для имитационной модели (268702>117686). Ясен и источник — третья и четвертая точки данных (квадраты разности, значения ф, для первой больше, чем для второй: 185004>53879 и 79333> 4839.2).

Информация о работе Имитационное моделирование в среде ms excel