Статистические пакеты для обработки и анализа данных

Автор работы: Пользователь скрыл имя, 21 Июня 2013 в 20:54, реферат

Краткое описание

Международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.
Разнообразие статистических пакетов обусловлено многоплановостью задач обработки данных с применением различных типов статистических процедур анализа для поиска ответов на вопросы из различных областей человеческой деятельности.
Перед пользователями различных категорий встает вопрос выбора оптимального статистического пакета для поиска верных ответов на существующие вопросы. Очевидно, что оптимальным является вариант, сочетающий в себе необходимые функциональные возможности, высокое качество работы и умеренную цену.

Прикрепленные файлы: 1 файл

Статистические пакеты для обработки и анализа данных.doc

— 317.00 Кб (Скачать документ)

Сезонное и несезонное экспоненциальное сглаживание

В модуле Временные ряды полностью реализованы все 12 классических моделей экспоненциального сглаживания. Задание модели может включать аддитивную или мультипликативную сезонную составляющую и/или линейный, экспоненциальный или демпфированый тренд; в частности, доступны популярные модели с линейным трендом Холта-Винтера. Пользователь может задавать начальное значение параметров сглаживания, начальное значение тренда и (если требуется) сезонные факторы. Для тренда и сезонной составляющей могут быть заданы независимые параметры сглаживания. Для определения лучшей комбинации параметров используется метод поиска на сетке; в таблицах результатов для всех комбинаций значений параметров сглаживания вычисляется средняя ошибка, средняя абсолютная ошибка, сумма квадратов ошибок, среднеквадратическая ошибка, средняя относительная ошибка и средняя абсолютная относительная ошибка. Наименьшие значения этих ошибок выделяются цветом. Имеется возможность автоматического поиска лучшего набора параметров в смысле среднеквадратической, средней абсолютной или средней абсолютной относительной ошибки (для этого используется общая процедура минимизации). Все результаты преобразования экспоненциальным сглаживанием, остатки и прогноз на требуемое число шагов доступны для дальнейшего анализа и вывода на график. Для оценки адекватности модели используются графики, на которых вместе с исходным рядом в подходящем масштабе по оси Y изображаются его сглаженный вариант, прогноз и ряд остатков.

Классическая сезонная декомпозиция (метод Census I)

Имеется возможность  задать произвольный сезонный лаг и выбрать либо аддитивную, либо мультипликативную сезонную модель. Программа вычисляет скользящие средние, отношения или разности, сезонные компоненты, ряд с сезонной поправкой, сглаженную тренд-циклическую и нерегулярную компоненты. Все эти составляющие ряда доступны для дальнейшего анализа; например, для проверки адекватности можно построить гистограммы, графики на нормальной вероятностной бумаге и т.д.

Месячная и квартальная  сезонная X-11-декомпозиция и корректировка (метод Census II)

Модуль Временные ряды включает полную реализацию варианта X-11 метода сезонной корректировки, принятого Статистическим управлением США (US Bureau of the Census). Структура всех функций и диалоговых окон соответствует требованиям и соглашениям, описанным в документации Bureau of the Census. Можно выбрать либо аддитивные, либо мультипликативные модели. Пользователь может дополнительно вычислить априорные поправки на число рабочих дней и сезонные поправки. Колебания числа рабочих дней оцениваются регрессионными методами (с правильной обработкой крайних членов ряда) и затем (по желанию) используются для корректировки ряда. Реализованы стандартные средства для градуировки выбросов, вычисления сезонных факторов и вычисления тренд-циклической компоненты (имеется возможность выбирать несколько типов взвешенного скользящего среднего; кроме того, программа может сама находить оптимальную длину и тип скользящего среднего). Итоговые компоненты ряда (сезонная, тренд-циклическая, нерегулярная) и ряд с внесенной сезонной поправкой всегда доступны для дальнейшего анализа и вывода на график; кроме того, все они могут быть сохранены для дальнейшего исследования другими методами и/или в других программах. Все компоненты выводятся на графики в различной форме, включая категоризованные графики по месяцам (кварталам).

Полиномиальные модели распределенных лагов

С помощью реализованных  в модуле Временные ряды методов полиномиальных распределенных лагов можно выполнять оценку моделей с обычными лагами и лагами Алмона. Для анализа распределений переменных модели имеется ряд графических средств.

Спектральный (Фурье) анализ и кросс-спектральный анализ

Модуль Временные ряды включает полную реализацию методов спектрального или Фурье анализа одного ряда и кросс-спектральный анализ двух рядов. Преимущества реализации спектрального анализа в STATISTICA особенно отчетливо проявляются при анализе очень длинных временных рядов (с более чем 250 тыс. наблюдений) и не предполагают каких-либо ограничений на длину ряда (в частности, длина исходного ряда не обязана быть четной). Вместе с тем, иногда бывает разумно предварительно увеличить или уменьшить длину ряда. Стандартные методы предварительной обработки ряда включают косинус-сглаживание, вычитание среднего и удаление тренда. Результаты обычного спектрального анализа содержат коэффициенты частоты, периода, коэфициенты при синусах и косинусах, периодограмма и оценка спектральной плотности. Оценка плотности может быть вычислена с помощью весов Даниеля, Хэмминга, Бартлетта, Тьюки, Парзена или с весами и шириной, заданными пользователем. Очень полезно, особенно при работе с длинными рядами, иметь возможность выводить в убывающем порядке заранее заданное число точек периодограммы или спектральной плотности; таким образом можно легко обнаружить резкие пики периодограммы и спектральной плотности для длинных рядов. Имеется возможность вычислить d-критерий Колмогорова-Смирнова для значений периодограммы чтобы проверить, подчиняются ли они экспоненциальному распределению (является ряд белым шумом или нет). Для представления результатов анализа имеются различные типы графиков; можно отобразить коэффициенты при синусах и косинусах, периодограмму, лог- периодограмму, спектральную и лог-спектральную плотность по отношению к частотам, периодам и лог- периодам. В случае длинного исходного ряда имеется возможность выбрать конкретный сегмент (период), для которого будут изображаться соответствующие периодограмма и график спектральной плотности, тем самым будет улучшено их "разрешение". При кросс-спектральном анализе, в дополнение к результатам обычного спектрального анализа каждого отдельного ряда, вычисляется кросс- периодограмма (вещественная и мнимая часть), ко-спектральная плотность, квадратурный спектр, кросс-амплитуда, значения когерентности, усиления и фазовый спектр. Все эти величины могут быть выведены на график, где по горизонтальной оси будет откладываться частота, период или лог-период либо для всего интервала периодов (соответственно, частот), либо для выбранного пользователем диапазона. Указанное пользователем количество наибольших значений кросс-периодограммы (вещественных или мнимых) может быть выведено в убывающем порядке в виде таблицы результатов, что позволяет легко выявлять на ней резкие пики для длинных исходных рядов. Как и во всех других процедурах модуля Временные ряды, все полученные ряды могут быть добавлены в активную рабочую область и затем подвергнуты дальнейшему исследованию с помощью других методов анализа временных рядов или средствами других модулей системы STATISTICA.

Прогнозирование на основе регрессионных методов

Наконец, в системе STATISTICA реализованы регрессионные методы анализа временных рядов для переменных с запаздыванием (лагом) или без него, в том числе - регрессия, проходящая через начало координат, нелинейная регрессия и интерактивное "что-если" прогнозирование.

 

 

 

 

 

 

 

 

Vortex 
Описание Vortex — программа обработки и анализа социологической и маркетинговой информации 8.0. Студенческая

Программа Vortex предназначена для разработки инструментария сбора данных (анкеты, бланка интервью, теста, html-формы и т.п.), ввода, обработки и анализа информации, представления полученных результатов в виде таблиц, текстов и диаграмм с возможностью их переноса в другие приложения. Области применения: любые исследования связанные с опросами населения, сотрудников или экспертов, анализ данных наблюдений, статистики. Социологические исследования: комплекс наиболее востребованных процедур обработки и анализа количественных социологических данных, в том числе: — расчет объема выборки и определение ошибки репрезентативности; — экстраполяция данных на генеральную совокупность; — обработка вопросов с множественным выбором, открытых и полузакрытых вопросов; — обработка табличных вопросов, ранговых методик и полярных профилей; — множество методик разработки вторичных показателей; — одномерный, двухмерный и многомерный частотный анализ; — регрессионный, кластерный, детерминационный и другие виды многомерного анализа. Политические исследования: оценка и прогнозирование электоральной активности и политических предпочтений, выявление факторов влияющих на политическое поведение, разработка типологий политического поведения, сегментация электората по актуальным проблемам и информационным источникам. Социально-психологические исследования: обработка данных, полученных в ходе опроса, наблюдения или тестирования сотрудников организации, оценка социально-психологического климата, неформальной структуры группы. Социально-медицинские исследования: обработка данных, полученных в ходе опроса пациентов, наблюдения или оценки результатов анализов. Конструирование и обработка данных психологических тестов: — стандартизация тестов для различных групп испытуемых; — оценка дискриминативности исходных и объективных показателей; — расчет результатов тестирования; — определение процентилей и СТЭНов.

 
1. Область применения  и разработка 
 
Программа «VORTEX» предназначена для:

  •  
    разработки инструментария сбора данных (анкеты, бланка интервью, теста и т.п.);
  •  
    ввода первичной информации, собранной в ходе прикладного исследования;
  •  
    обработки и анализа этой информации;
  •  
    представления полученных результатов анализа в виде таблиц, текстов, графиков и диаграмм с возможностью их переноса в Microsoft Word, Excel и другие приложения Windows.

 
 Области применения: 
 
Любые исследования связанные с опросами населения, сотрудников или экспертов, анализ данных наблюдений, статистики. Программа широко используется в различных сферах, поэтому ниже перечислены только наиболее популярные задачи. 
 
 
Социологические исследования: комплекс наиболее востребованных процедур обработки и анализа количественных социологических данных, в том числе:

  •  
    расчет объема выборки и определение ошибки репрезентативности;
  •  
    экстраполяция данных на генеральную совокупность;
  •  
    обработка вопросов с множественным выбором;
  •  
    обработка открытых и полузакрытых вопросов;
  •  
    обработка табличных вопросов;
  •  
    обработка ранговых методик и полярных профилей;
  •  
    множество методик разработки вторичных показателей;
  •  
    одномерный, двухмерный и многомерный частотный анализ;
  •  
    регрессионный, кластерный, дисперсионный, детерминационный и другие виды многомерного анализа;
  •  
    контент-анализ текстовых данных.

 
 
Маркетинговые исследования: обработка результатов опросов или наблюдений потребителей, покупателей, экспертов, клиентов, поставщиков, заказчиков, конкурентов и других участников рынка в том числе:

  •  
    определение емкости и доли рынка, позиций конкурентов;
  •  
    описание потребительского поведения и предпочтений, в том числе в рамках различных сегментов (целевых групп), разработка типологий и модели потребительского поведения;
  •  
    определение имиджа товара или марки для различных сегментов рынка;
  •  
    разработка кривых спроса и оценка эластичности спроса;
  •  
    определение оптимальной цены товара или услуги для различных сегментов рынка, на основе анализа спроса;
  •  
    сравнительная оценка роли различных атрибутов товара или услуги в процессе выбора потребителем той или иной марки;
  •  
    определение факторов, влияющих на потребительское поведение и предпочтения;
  •  
    прогнозирование изменений в потребительском поведении и предпочтениях под влиянием различных факторов;
  •  
    при помощи картограмм и картодиаграмм учет региональных особенностей потребительского поведения и предпочтений.

 
 
Политические исследования:

  •  
    оценка и прогнозирование электоральной активности и политических предпочтений;
  •  
    выявление факторов влияющих на политическое поведение;
  •  
    разработка типологий и моделей политического поведения;
  •  
    сегментация электората по актуальным проблемам и информационным источникам.
  •  
    анализ частоты упоминания определенных категорий в СМИ (контент-анализ).

 
 
^ Социально-психологические исследования: обработка данных, полученных в ходе опроса, наблюдения или тестирования сотрудников организации, оценка социально-психологического климата, неформальной структуры группы. 
 
^ Социально-медицинские исследования: обработка данных, полученных в ходе опроса пациентов, наблюдения или оценки результатов анализов. 
 
Конструирование и обработка данных психологических тестов:

  •  
    стандартизация тестов для различных групп испытуемых;
  •  
    оценка дискриминативности исходных и объективных показателей;
  •  
    расчет результатов тестирования;
  •  
    определение процентилей и СТЭНов.

 
 

 

 

 

 

Разработка: 
 
Разработка программы ведется с 1990г. Восьмая версия программы разработана в г.Екатеринбурге сотрудником Уральского Госуниверситета, доцентом кафедры прикладной социологии, к.с.н. Шкуриным Д.В. в 2005-2007г. при поддержке Фонда «Социум», г. Екатеринбург. Программа написана на языке Delphi 7 для работы в средах Windows 2000, XP, поддерживает их основные принципы взаимодействия с пользователем. 
 
 
2. Особенности программы: 
 
1. Анализ данных, замеренных по качественным шкалам 
 
В отличие от большинства статистических пакетов, программа Vortex прежде всего ориентирована на то, что основной единицей наблюдения выступает человек, следовательно, большинство показателей имеет качественный (номинальный или порядковый), а не количественный характер (например, пол, уровень образования, род занятий и т.п.). Отсюда наличие в программе специальных процедур анализа качественных показателей:

  •  
    поддержка поливариантных переменных – вопросов, на которые один опрошенный может дать несколько ответов одновременно;
  •  
    возможность присвоения условных индексов, с помощью которых качественные переменные могут использоваться в количественных расчетах;
  •  
    многомерный анализ качественных переменных;
  •  
    описание выделенной группы респондентов с помощью определения ее основных, отличительных и существенных черт, а так же составляющих ее сегментов;
  •  
    определение основных различий любых двух выделенных социальных групп;
  •  
    сводная многомерная таблица;
  •  
    возможность разработки качественных и количественных вторичных переменных.

Информация о работе Статистические пакеты для обработки и анализа данных