Статистические пакеты для обработки и анализа данных

Автор работы: Пользователь скрыл имя, 21 Июня 2013 в 20:54, реферат

Краткое описание

Международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.
Разнообразие статистических пакетов обусловлено многоплановостью задач обработки данных с применением различных типов статистических процедур анализа для поиска ответов на вопросы из различных областей человеческой деятельности.
Перед пользователями различных категорий встает вопрос выбора оптимального статистического пакета для поиска верных ответов на существующие вопросы. Очевидно, что оптимальным является вариант, сочетающий в себе необходимые функциональные возможности, высокое качество работы и умеренную цену.

Прикрепленные файлы: 1 файл

Статистические пакеты для обработки и анализа данных.doc

— 317.00 Кб (Скачать документ)

STADIA - это :

  • исчерпывающий набор самых современных и эффективных методов анализа: описательная статистика, критерии различия, категориальный, дисперсионный, корреляционный и спектральный анализ, сглаживание, фильтрация, прогнозирование, простая, множественная, пошаговая и нелинейная регрессия, дискриминантный, кластерный и факторный анализ, шкалирование, методы контроля качества, вычисление и согласие распределений, анализ и замена пропущенных значений и т. д. 
  • полный комплект деловой и научной графики: функции, зависимости, распределения, диаграммы рассеяния, многомерные диаграммы, карты, поверхности, вращения, сплайны, прогнозы, гистограммы, столбиковые, башенные и круговые диаграммы, дендрограммы, установка размеров, надписей по осям и под рисунком, графический архив и прочее
  • разнообразные преобразования и вычисления, импорт / экспорт данных и результатов в стандартных международных форматах (ASCII и DBF);
  • развитая экранная помощь, совет, понятная интепретация результатов и много сервисов

В отличие от западных, многие отечественные пакеты в гораздо  большей степени подходят для  нужд среднего российского пользователя. Здесь основные операции обычно сразу обозримы из головных меню, а рутинные процедуры выполняются с минимумом действий и разветвлений по принципу: «прямым путем – к понятному результату».

Наиболее развитой системой контекстной экранной помощи включающей объемный справочник-гипертекст и экспертную систему по выбору метода статистического анализа, обладает пакет STADIA. Здесь каждый числовой статистический вывод сопровождается короткой и понятной интерпретацией (впрочем, более искушенный в статистике пользователь может сделать интерпретацию результатов сам, благо все данные для этого также выводятся на экран).

 

Пакет STADIA разработан и поддерживается НПО “Информатика и компьютеры” при активном участи ведущих специалистов МГУ им. М.В.Ломоносова. Пакет содержит широкий набор методов анализа данных из всех областей статистики и доступен широкому кругу прикладных специалистов, менеджеров и студентов. Пакет может появляться в трех вариантах: study, basе и рrоf, различающихся лишь объемами обрабатываемых массивов и ценой. Самый дешевый вариант study имеет максимальный объем матрицы данных в 400 чисел. Он предназначен главным образом для учебных заведений и задач с небольшими объемами данных. Самая дорогая версия рrоf. имеет максимальный объем матрицы данных 20000 чисел и расширенные возможности статистических процедур для их обработки по сравнению с базовыми версиями. У пакета имеется бесплатная учебно-демонстрационная версия, позволяющая обрабатывать большое количество демонстрационных примеров из всех разделов статистического анализа. Эта версия также допускает ввод с клавиатуры и полную обработку данных пользователей. Однако при этом существуют ограничения на объемы вводимых данных, и отсутствует возможность сохранения введенных данных в файле. Документация пакета является одновременно детальным справочником по использованию статистических методов и может быть приобретена отдельно от пакета. Цена пакета составляет от 200 до 500 долларов.

С пакетом  работают даже школьники и учащиеся колледжей и техникумов!  
STADIA давно и успешно используется многоми сотнями профессиональных пользователей!

Только по официальным  данным государственной программы "Университеты России" уже к 1998 году пакетом STADIA  пользовалось более 120 вузов и университетов России, более 60 научно-исследовательских центров, более 90 государственных, медицинских, промышленных и коммерческих организаций. И это не считая неисчислимого количества нелегальных пользователей. 

 

 

 

 

 

 

Пакет Да-система

ДА-система - это универсальный, простой и вместе с тем мощный инструмент обработки и анализа данных. В основу пакета положен Детерминационный Анализ, созданный в России в 70-80-е годы. Это математический метод, принадлежащий к классу методов описательной статистики. Он позволяет работать как с числовыми, так и с нечисловыми показателями. Метод позволяет анализировать связи между различными показателями (характеристиками, свойствами, признаками) и конструировать новые показатели, соответствующие смыслу решаемых проблем. При работе с нечисловыми признаками не требуется приписывать им числовое выражение в виде баллов, нечетких оценок и т.д. Все связи между признаками рассматриваются как основа для получения тех или иных правил.

В нем используется технология, отличающаяся единством всех звеньев  и процедур, позволяющая с единых позиций вести анализ качественных и количественных данных (по отдельности и совместно). Это особенно ценно при решении задач в таких областях, как медицина, социология, биология, маркетинг, а также в любых гуманитарных и междисциплинарных исследованиях

С какими данными работает ДА - система?

Данные, с которыми работает ДА-система, это разного рода документы: анкеты карточки, протоколы, акты экспертизы, формы отчетности, счета, записи результатов  наблюдений, измерений и т.д. Документы могут быть заданы физически, либо в электронном виде. Источниками документов для обработки и анализа с помощью ДА-системы служат: документооборот на предприятиях, фирмах, в учреждениях;

обследования: маркетинговые, социальные, политологические, медицинские;

измерения и эксперименты в физике, химии, технике, биологии, генетике.

Документы где-то накапливаются, их надо вводить в компьютер, анализировать, а результаты оформлять в виде отчета, справки, доклада, презентации  со слайдами, статьи или диссертации. Все эти процедуры обеспечивает ДА-система.

По содержанию данные могут быть какие угодно. ДА-технология равно применима к данным с  любым содержанием, представляющим разные сферы деятельности, разные области научных и деловых  интересов.

Где используется ДА - система?

Пакетом пользуются информационно-аналитические  и маркетинговые отделы фирм, банков и предприятий, социальные службы, службы информационной поддержки деятельности администраций в городах и  регионах, службы эпидемиологического  и экологического мониторинга, медицинские центры и клиники, научно-исследовательские лаборатории и институты, исследовательские центры и лаборатории самых разных направлений - от физики и химии до биологии, генетики и лингвистики.

Анализ связей и построение новых признаков - это две базовые задачи анализа данных в режиме описательной статистики. Детерминационный анализ решает не только эти базовые задачи. Он, кроме того, позволяет удобно и просто организовать работу с данными, а также процедуры ввода данных, построения таблиц и графиков, обмена данными и т.д. Эти возможности, скрытые в математической подоплеке Детерминационного Анализа, использованы в ДА-системе и все вместе образуют единую технологию обработки и анализа данных.

ДА-система применяется  для обработки и анализа количественных, качественных (неколичественных) и смешанных данных. В этой системе традиционный подход, представленный таблицами распределений, сочетается с подходом нетрадиционным, но столь же органичным для социолога, основанным на анализе правил, объясняющих одни ответы или сочетания ответов, через другие ответы или сочетания ответов.

Интерфейс ДА-системы  включает: основные экраны, экраны таблиц и графиков, окна диалога со словарем, окна диалога без словаря.

Графические возможности. В систему включен удобный конструктор, позволяющий строить таблицы распределений и их графики. Есть возможность получать и редактировать более сотни разновидностей плоских и объемных графиков (с выбором ракурса, изменением цветов, фона и т.д.). Для этого в ДА-системе использована русифицированная и адаптированная технология американской фирмы First Impression, напоминающая технологию работы с графиками, реализованную в MS Excel. Графики и таблицы легко переносить в текст отчета, создаваемый в MS Word или MS Excel, а также в другие приложения Windows.

ДА-система применяется  для решения проблем во многих, часто далеких друг от друга областях. Его универсальность объясняется  эффективностью технологии и фундаментальностью математического обеспечения. Любые  особенности содержания данных учитывает Словарь переменных. Все процедуры, реализованные в ДА-системе, необходимы при анализе любых данных, независимо от предметной области. При такой организации дела универсальность не мешает, а помогает. Работа с данными становится более простой, чем при других подходах. ДА-система адресована как новичкам в области анализа данных, так и специалистам-практикам, имеющим опыт работы с данными. Принципы, на которых действует система, легко усваиваются специалистами-предметниками не только с техническим, но и с гуманитарным складом ума. Поэтому она полезна для многих из тех, кто желает иметь доступ к первичным данным и анализировать их без посредничества программистов и математиков.

 

Statistica— современный пакет статистического  анализа

О программе: Описание: это современный пакет статистического анализа, в котором реализованы все новейшие компьютерные и математические методы анализа данных. Программа предназначена для всех отраслей промышленности (бизнес, наука, обучение). В ней реализовано все возможные функции для статистической обработки данных, плюс к этому возможность построения графиков, базы данных и т.д. В программу встроен STATISTICA Visual Basic, что добавляет еще около 10000 новых функций. Синтаксис этого Basic’а полностью совместим с Microsoft Visual Basic. 
Популярный для расчетов пакет анализа, работающая portable — версия.

Возможности: 
STATISTICA — это система статистического анализа данных, включающая широкий набор аналитических процедур и методов:

  • более 100 различных типов графиков,
  • описательные и внутригрупповые статистики,
  • быстрые основные статистики и блоковые статистики,
  • множественная регрессия,
  • непараметрические статистики,
  • разведочный анализ данных, корреляции,
  • общая модель дисперсионного и ковариационного анализа,
  • интерактивный вероятностный калькулятор,
  • T-критерии (и другие критерии групповых различий),
  • таблицы частот, сопряженности, флагов и заголовков,
  • анализ многомерных откликов,
  • подгонка распределений и многое другое.

SSTATISTICA - это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских прило жений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе, а также специальные методы добычи данных. Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и, что очень важно, промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента. Работа со всеми модулями происходит в рамках единого программного пакета, для которого можно выбирать один из нескольких предложенных интерфейсов пользователя. С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных (а STATISTICA предоставляет такие возможности в полной мере) помогает находить новые способы проверки рабочих гипотез и исследования данных.TATISTICA для Windows

 

 

 

ОПИСАТЕЛЬНЫЕ  СТАТИСТИКИ, ГРУППИРОВКА И РАЗВЕДОЧНЫЙ  АНАЛИЗ ДАННЫХ

Система STATISTICA предлагает пользователю широкий выбор методов разведочного анализа данных. Программа вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс (и их стандартные ошибки), гармоническое и геометрическое среднее, а также многие специальные описательные статистики. Как и во всех других модулях системы STATISTICA, проведение разведочного анализа данных поддерживают разнообразные графики и диаграммы, в т.ч. различные виды диаграмм размаха и гистограмм, гистограммы двумерных распределений (трехмерные и категоризованные), двух- и трехмерные диаграммы рассеяния с помеченными подмножествами данных, нормальные и полунормальные вероятностные графики и графики с исключенным трендом, К-К и В-В графики и т.д. Имеется набор критериев для подгонки нормального распределения к данным (критерии Колмогорова-Смирнова, Лилиефорса и Шапиро-Уилкса). Процедуры для подгонки многих других типов распределений можно найти также в описании анализа процессов и графических возможностей системы. Практически все описательные статистики и графики могут быть построены для данных, категоризованных (сгруппированных) по значениям одной или нескольких группирующих переменных. Например, с помощью нескольких щелчков мыши можно сгруппировать имеющиеся данные о людях по полу и возрасту и затем просмотреть категоризованные гистограммы, диаграммы размаха, графики на нормальной вероятностной бумаге, диаграммы рассеяния и т.д. В случае, если было выбрано более двух категоризующих переменных, автоматически будет построен каскад соответствующих графиков. Имеется возможность производить категоризацию по числовым (непрерывным) переменным, например, можно потребовать, чтобы значения переменной были разбиты на заданное число интервалов; с помощью средства перекодировки в реальном времени можно задать конкретный специальный способ перекодировки переменной (возможности практически сколь угодно сложной перекодировки доступны в любой момент, причем перекодировка может быть задана через соотношения между любыми переменными файла данных). В дополнение к этому в системе имеется специализированная процедура иерархической группировки, позволяющая осуществлять категоризацию данных по многим (до шести) переменным и строить различные категоризованные графики, описательные статистики и корреляционные матрицы для подгрупп (пользователь может в интерактивном режиме cделать неучитываемыми некоторые из факторов в полной таблице группировок и изучать статистики для маргинальных таблиц). Многочисленные возможности форматирования и расстановки меток позволяют получать таблицы и отчеты презентационного качества, содержащие длинные метки и описания переменных. При этом важно отметить, что процедура группировки выполняется для чрезвычайно больших объемов данных (например, по одной категоризующей переменной можно построить до 300 групп), а ее результаты содержат все соответствующие статистики дисперсионного анализа (включая полные таблицы ANOVA, критерии проверки гипотез типа критерия Левена однородности дисперсии, семь различных апостериорных (post-hoc) критериев и т.д.). Как и во всех других модулях системы STATISTICA, для достижения высокой - не имеющей аналогов в сравнении с другими пакетами - точности результатов здесь можно производить вычисления с повышенной точностью (если нужно - с четырехкратной). Благодаря интерактивному характеру системы изучение данных становится очень простым делом. Например, графики и диаграммы для разведочных статистик можно получать непосредственно из данных любых выходных таблиц, просто указав мышью на отдельные ячейки или группы ячеек. Одним щелчком мыши можно получать каскады графиков (в том числе сложных, например, со множественными категориями), которые затем можно просматривать в режиме подобном демонстрации слайдов, просто нажимая кнопку Продолжить. В дополнение к большому числу готовых статистических графиков пользователь может самостоятельно задавать различные типы визуализации исходных данных, описательных статистик, взаимосвязей между статистиками, группировок и категоризаций с помощью средств прямого доступа (point-and-click), что позволяет существенно уменьшить требуемое количество действий мышью. Средства графического разведочного анализа объединены с собственно статистичекими процедурами, что существенно облегчает визуальный анализ данных (например, в интерактивном режиме можно удалять выбросы, выделять подмножества данных, осуществлять сглаживание и подгонку функций, а богатые средства работы с кистью позволяют легко выявлять и/или выделять нужные данные).

Информация о работе Статистические пакеты для обработки и анализа данных