Автор работы: Пользователь скрыл имя, 17 Декабря 2012 в 08:48, курсовая работа
Математическая прогнозная модель представляет собой набор формул с коэффициентами, которые формируются в процессе разработки модели, на стадии численного моделирования. В формулы подставляются факторы, отобранные в процессе разработки модели, на стадии качественного моделирования.
Введение 3
Глава 1. Прогнозирование 4
1.1. Критерии качества прогнозных моделей 4
1.2. Проработка спецификации 5
1.3. Разработка прогнозной модели 6
1.4. Технология создания систем прогнозирования 7
Глава 2. Классификация прогнозных моделей 10
2.1. Методы прогнозирования, основанные на сглаживании, экспоненциальном сглаживании и скользящем среднем 11
2.1.1. «Наивные» модели прогнозирования 11
2.1.2. Средние и скользящие средние 12
2.1.3. Методы Хольта и Брауна 15
2.1.4. Метод Винтерса 16
2.1.5. Регрессионные методы прогнозирования 16
2.2. Методы Бокса-Дженкинса (ARIMA) 18
2.2.1. AR(p) -авторегрессионая модель порядка p. 19
2.2.2. MA(q) -модель со скользящим средним порядка q. 20
Заключение 21
Литература 22
Аналитические модели по сравнению с алгоритмическими, как правило, дают более точные прогнозы. Однако они могут давать сильную погрешность, если нет достоверной информации по всем факторам. Для расчета прогнозного значения нужно знать точные значения факторов в прошлом и будущем. Это является основным ограничением длины прогнозного периода в ходе применения аналитических моделей. Горизонт прогнозирования алгоритмических моделей сильно зависит от типа модели: он может не превышать одного периода, а может быть теоретически неограниченным.
Разработка аналитических моделей — это, как правило, более длинный и сложный процесс по сравнению с разработкой алгоритмических моделей. Аналитические модели отражают самую суть функционирования исследуемой системы. Алгоритмические модели отражают основные законы изменения прогнозируемого показателя. Это сезонность, цикличность, годовые и ежемесячные темпы роста, зависимость показателя от его предыдущих значений (автокорреляция).
Процесс
получения прогнозов с помощью
математических моделей можно начать
даже в ситуации, когда нет никакой
статистики, но для поддержки принятия
решения уже требуются
В такой ситуации необходимо как можно быстрее пройти постановочную часть разработки модели и наладить процесс регистрации текущих значений прогнозируемых показателей. В этом случае сразу открывается дорога к построению простейших алгоритмических моделей. Далее, по мере прохождения стадии качественного моделирования, выясняется круг факторов и налаживается процесс регистрации их текущих значений.
Также необходимо начать работы по поиску статистической информации за прошлые периоды времени. Как показывает практика, часть информации доступна в открытых источниках, а часть можно восстановить даже по разрозненным файловым источникам данных, если предприятие имеет историю. На начальной стадии построения прогнозной модели даже самая незначительная информация играет большую роль, так как позволяет уточнить спецификацию модели на качественном уровне [5].
Общепризнанные методы прогнозирования временных рядов:
При создании
«наивных» моделей
Самой простой моделью является
Y(t+1)=Y(t),
что соответствует предположению, что «завтра будет как сегодня».
Вне всякого сомнения, от такой примитивной модели не стоит ждать большой точности [9]. Она не только не учитывает механизмы, определяющие прогнозируемые данные (этот серьезный недостаток вообще свойственен многим статистическим методам прогнозирования), но и не защищена от случайных флуктуаций, она не учитывает сезонные колебания и тренды. Впрочем, можно строить «наивные» модели несколько по-другому
Y(t+1)=Y(t)+[Y(t)-Y(t-1)],
Y(t+1)=Y(t)*[Y(t)/Y(t-1)],
такими способами мы пытаемся приспособить модель к возможным трендам
Y(t+1)=Y(t-s),
это попытка учесть сезонные колебания
Самой простой моделью, основанной на простом усреднении является
Y(t+1)=(1/(t))*[Y(t)+Y(t-1)+..
и в отличии
от самой простой «наивной»
В приведенной выше формуле предполагалось, что ряд усредняется по достаточно длительному интервалу времени. Однако как правило, значения временного ряда из недалекого прошлого лучше описывают прогноз, чем более старые значения этого же ряда. Тогда можно использовать для прогнозирования скользящее среднее
Y(t+1)=(1/(T+1))*[Y(t)+Y(t-1)+
Смысл его заключается в том, что модель видит только ближайшее прошлое (на T отсчетов по времени в глубину) и основываясь только на этих данных строит прогноз.
При прогнозировании довольно часто используется метод экспоненциальных средних, который постоянно адаптируется к данным за счет новых значений. Формула, описывающая эту модель записывается как
Y(t+1)=a*Y(t)+(1-a)*^Y(t),
где Y(t+1) – прогноз на следующий период времени, Y(t) – реальное значение в момент времени t
^Y(t) – прошлый прогноз на момент времени t
a – постоянная сглаживания (0<=a<=1))
В этом методе есть внутренний параметр a, который определяет зависимость прогноза от более старых данных, причем влияние данных на прогноз экспоненциально убывает с «возрастом» данных. Зависимость влияния данных на прогноз при разных коэффициентах a приведена на графике.
|
Видно, что при a->1, экспоненциальная модель стремится к самой простой «наивной» модели. При a->0, прогнозируемая величина становится равной предыдущему прогнозу [11].
Если производится прогнозирование с использованием модели экспоненциального сглаживания, обычно на некотором тестовом наборе строятся прогнозы при a=[0.01, 0.02, ..., 0.98, 0.99] и отслеживается, при каком a точность прогнозирования выше. Это значение a затем используется при прогнозировании в дальнейшем.
Хотя описанные выше модели («наивные»
алгоритмы, методы, основанные на средних,
скользящих средних и экспоненциального
сглаживания) используются при бизнес-прогнозировании
в не очень сложных ситуациях,
например, при прогнозировании продаж
на спокойных и устоявшихся
Вместе с этим хотелось бы отметить,
что описанные алгоритмы вполне
успешно можно использовать как
сопутствующие и
В середине
прошлого века Хольт предложил
|
Здесь первое уравнение описывает сглаженный ряд общего уровня.
Второе уравнение служит для оценки тренда. Третье уравнение определяет прогноз на p отсчетов по времени вперед.
Постоянные сглаживания в
Частным случаем метода Хольта является метод Брауна, когда a=ß.
Хотя описанный выше метод Хольта (метод двухпараметрического экспоненциального сглаживания) и не является совсем простым (относительно «наивных» моделей и моделей, основанных на усреднении), он не позволяет учитывать сезонные колебания при прогнозировании. Говоря более аккуратно, этот метод не может их «видеть» в предыстории. Существует расширение метода Хольта до трехпараметрического экспоненциального сглаживания. Этот алгоритм называется методом Винтерса [19]. При этом делается попытка учесть сезонные составляющие в данных. Система уравнений, описывающих метод Винтерса выглядит следующим образом:
|
Дробь в первом уравнении служит для исключения сезонности из Y(t). После исключения сезонности алгоритм работает с «чистыми» данными, в которых нет сезонных колебаний. Появляются они уже в самом финальном прогнозе, когда «чистый» прогноз, посчитанный почти по методу Хольта умножается на сезонный коэффициент.
Наряду с описанными выше методами, основанными на экспоненциальном сглаживании, уже достаточно долгое время для прогнозирования используются регрессионные алгоритмы. Коротко суть алгоритмов такого класса можно описать так.
Существует прогнозируемая переменная Y (зависимая переменная) и отобранный заранее комплект переменных, от которых она зависит - X1, X2, ..., XN (независимые переменные). Природа независимых переменных может быть различной. Например, если предположить, что Y - уровень спроса на некоторый продукт в следующем месяце, то независимыми переменными могут быть уровень спроса на этот же продукт в прошлый и позапрошлый месяцы, затраты на рекламу, уровень платежеспособности населения, экономическая обстановка, деятельность конкурентов и многое другое [6]. Главное - уметь формализовать все внешние факторы, от которых может зависеть уровень спроса в числовую форму.
Модель
множественной регрессии в
В более простом варианте линейной регрессионной модели зависимость зависимой переменной от независимых имеет вид:
Здесь - подбираемые коэффициенты регрессии, e- компонента ошибки. Предполагается, что все ошибки независимы и нормально распределены.
Для построения регрессионных моделей необходимо иметь базу данных наблюдений примерно такого вида [17]:
переменные | |||||
независимые |
зависимая | ||||
№ |
X1 |
X2 |
... |
XN |
Y |
1 |
x_11 |
x_12 |
... |
x_1N |
Y_1 |
2 |
x_21 |
x_22 |
... |
x_2N |
Y_2 |
... |
... |
... |
... |
... |
... |
m |
x_M1 |
x_M2 |
... |
x_MN |
Y_m |
С помощью таблицы значений прошлых наблюдений можно подобрать (например, методом наименьших квадратов) коэффициенты регрессии, настроив тем самым модель.
При работе с регрессией надо соблюдать определенную осторожность и обязательно проверить на адекватность найденные модели. Существуют разные способы такой проверки. Обязательным является статистический анализ остатков, тест Дарбина-Уотсона [4]. Полезно, как и в случае с нейронными сетями, иметь независимый набор примеров, на которых можно проверить качество работы модели.
В середине
90-х годов прошлого века был разработан
принципиально новый и
Информация о работе Статистические методы прогнозирования социально-экономических явлений