Автор работы: Пользователь скрыл имя, 01 Ноября 2013 в 18:46, доклад
Хранилище данных- предметно-ориентированная, интегрированная, вариантная во времени, не разрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений. В настоящее время чаще используют другое определение, практически мало отличающееся от классического: хранилище данных - это предметно ориентированная информационная корпоративная база данных, специально разработанная и предназначенная для анализа бизнес-процессов в организации с целью поддержки принятия решений. Основная цель хранилищ - создание единого логического представления данных, содержащихся в разнотипных базах данных или в единой модели корпоративных данных.
Хранилище данных- предметно-ориентированная, интегрированная, вариантная во времени, не разрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений.
В настоящее время чаще используют другое определение, практически мало отличающееся от классического: хранилище данных - это предметно ориентированная информационная корпоративная база данных, специально разработанная и предназначенная для анализа бизнес-процессов в организации с целью поддержки принятия решений.
Основная цель хранилищ - создание
единого логического
Хранилищам данных присущи следующие черты:
Предметная ориентированность. Информация
в хранилище организована в соответствии
с основными аспектами
Интегрированность. В разных базах одни и те же данные могут быть выражены в разных единицах измерения. При загрузке в хранилище данные должны быть проверены, очищены и приведены к единому виду. Анализировать такие интегрированные данные намного проще.
Привязка ко времени. Данные, выбранные из оперативных баз данных, накапливаются в хранилище в виде «исторических архивов», каждый из которых относится к конкретному периоду времени. Это позволяет анализировать тенденции в развитии бизнеса.
Неизменяемость. Попав в хранилище, данные уже никогда не меняются. Стабильность данных облегчает их анализ.
Существуют следующие отличия типичных хранилищ данных от обычной реляционной базы данных:
1. Базы данных предназначены
для автоматизации бизнес-
2. Базы данных постоянно
3. Базы данных чаще всего
Идея витрин данных (Data Mart) возникла, когда выяснилось, что разработка корпоративного хранилища - длительный и дорогостоящий процесс, требующий значительных усилий по анализу деятельности организации и переориентации ее на новые технологии. Витрины данных возникли с целью избежать трудностей разработки и внедрения хранилищ.
Витрина данных - это специализированное
хранилище, обслуживающее, как правило,
единственное направление деятельности
организации, например, учет складских
запасов. Построение витрин данных является
менее затратным процессом, чем
построение хранилищ данных, так как
бизнес-процессы, происходящие в одном
из направлений деятельности организации,
лучше изучены и не столь сложны,
как процессы в масштабах всей
организации. При современном уровне
развития информационных технологий витрину
подразделения можно
Успех внедрения витрин привел к появлению концепции замены корпоративного хранилища совокупностью витрин данных. Однако эксплуатация витрин данных показала, что с увеличением количества витрин в организации возрастает сложность их взаимодействия, так как не удается сделать витрины полностью независимыми от хранилищ данных. Поэтому чаще всего разработка корпоративного хранилища идет параллельно с разработкой и внедрением витрин данных.
При построении схемы взаимодействия
корпоративного хранилища и витрин
данных рекомендуется определить некоторую
специальную структуру для
Фактическим стандартом структуры данных при разработке хранилищ и витрин данных является «звезда», основанная на единственной таблице фактов и множестве таблиц измерений.
Таблица фактов содержит числовые параметры и имеет, как правило, небольшое количество полей - не более двадцати. Она может состоять из миллионов строк и содержать суммирующие или фактические данные, ко-
торые могут помочь ответить на требуемые вопросы. В этой таблице соединяются данные, которые хранились бы во многих таблицах традиционных реляционных баз данных.
Таблицы измерений содержат описательную информацию о числовых значениях в таблице фактов, т.е. они содержат атрибуты фактов. Это неизменяемые или редко изменяемые данные. Обычно в них содержится значительно меньше строк, чем в таблицах фактов, но значительно большее число полей. Атрибуты таблиц измерений обычно используются при визуализации данных во всевозможных отчетах и запросах.
Таблица фактов и таблицы измерений
связаны идентифицирующими
1. Для соединения с таблицей
измерений с целью выбора
2. Для выполнения обобщений в
таблице фактов. Так, можно суммировать
содержащиеся в таблице фактов
количественные показатели, которые
относятся к конкретному
Например, в описании продаж таблица фактов может содержать данные о том, какое количество товара реализовано и на какую сумму, а также внешние ключи к таблицам измерений, которые характеризуют операцию продажи (какой товар, когда и кем был продан, какой способ платежа был выбран) [3].
Отношения между таблицей фактов и таблицами измерений должны быть простыми, должен существовать только один возможный путь соединения любых двух таблиц, а смысл этого соединения должен быть очевиден и хорошо понятен.
ЛИТЕРАТУРА
1. Туманов, В.Е. Проектирование хранилищ данных для систем бизнес-аналитики [Текст] / В.Е. Туманов. - М. : Интернет-университет информационных технологий; БИНОМ; Лаборатория знаний, 2010. - 615 с.
2. Туманов, В.Е., Маклаков, С.В. Проектирование реляционных хранилищ данных [Текст] / В.Е. Туманов, С.В. Маклаков. - М. : Диалог-МИФИ, 2007. - 333 с.
3. Чубукова, И. А. Data Mining [Текст] : учеб. пособие / И.А. Чубукова. - М. : Интернет-университет информационных технологий; БИНОМ; Лаборатория знаний, 2006.