Автор работы: Пользователь скрыл имя, 13 Июня 2014 в 10:33, реферат
Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.
Цель данного реферата теоретически рассмотреть многомерную модель баз данных, рассмотреть основные свойства, на чем строиться, выявить достоинства и недостатки.
Введение 4
1. Многомерная модель данных 5
1.1. Представление данных в многомерной модели 5
1.2. Основные свойства многомерной модели 6
1.3. Основные понятия многомерной модели 6
1.4. Организация данных в многомерных СУБД 7
1.5. Специализированные операции в многомерной модели 8
2. Многомерные базы данных 9
2.1. Основные преимущества многомерных СУБД 9
2.2. Области применения многомерных моделей данных 10
2.3. Способы хранения данных в многомерных БД 11
2.4. Оправданность использования многомерных СУБД 15
Заключение 16
Список использованных источников 18
Федеральное агентство железнодорожного транспорта
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
Омский государственный университет путей сообщения
ОмГУПС (ОмИИТ)
Кафедра «Автоматика и системы управления»
Многомерные базы данных
Тематический реферат
по дисциплине «Практика по рабочему профилю»
Студент гр. 22Ф
Штанько Е. О
26.03.2014
Руководитель –
профессор кафедры ИФК
И. К. Тихонова
26.03.2014
Омск 2014
Содержание
Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.
Цель данного реферата теоретически рассмотреть многомерную модель баз данных, рассмотреть основные свойства, на чем строиться, выявить достоинства и недостатки.
Многомерный подход к представлению данных в базе появился практически одновременно с реляционным, но реально работающих многомерных СУБД (МСУБД) до настоящего времени было очень мало. С середины 90-х годов интерес к ним стал приобретать массовый характер.
Толчком послужила в 1993 году программная статья одного из основоположников реляционного подхода Э. Кодда. В ней сформулированы 12 основных требований к системам класса OLAP (Online Analytical Processing – оперативная аналитическая обработка), важнейшие из которых связаны с возможностями концептуального представления и обработки многомерных данных. Многомерные системы позволяют оперативно обрабатывать информацию для проведения анализа и принятия решения.
В развитии концепций информационных систем можно выделить следующие два направления:
Реляционные СУБД предназначались для информационных систем оперативной обработки информации и в этой области были весьма эффективны. В системах аналитической обработки они показали себя несколько неповоротливыми и недостаточно гибкими. Более эффективными здесь оказываются многомерные СУБД.
Многомерная модель данных является узкоспециализированной моделью, предназначенной для оперативной аналитической обработки информации. В основе модели лежит не двумерная, как в реляционной модели, а многомерная таблица и многомерное логическое представление структуры информации при описании данных и в операциях манипулирования данными. По сравнению с реляционной моделью многомерная организация данных обладает более высокой наглядностью и информативностью.
Многомерной модели должны быть присущи агрегируемость, историчность и прогнозируемость данных.
Статичность данных позволяет использовать при их обработке специализированные методы загрузки, хранения, индексации и выборки.
Временная привязка данных необходима для частого выполнения запросов, имеющих значения времени и даты в составе выборки. Необходимость упорядочения данных по времени в процессе обработки и предоставления данных пользователю накладывает требования на механизмы хранения и доступа к информации. Так, для уменьшения времени обработки запросов желательно, чтобы данные всегда были отсортированы в том порядке, в котором они наиболее часто запрашиваются.
Если речь идет о многомерной модели с мерностью больше двух, то не обязательно визуально информация представляется в виде многомерных объектов (трех-, четырех- и более мерных гиперкубов). Пользователю и в этих случаях более удобно иметь дело с двумерными таблицами или графиками. Данные при этом представляют собой как бы «срезы» из многомерного хранилища данных, выполненные с разной степенью детализации.
Рассмотрим основные понятия многомерных моделей данных, к числу которых относятся измерение и ячейка.
Измерение (Dimension) – упорядоченный набор значений, принимаемых конкретным параметром, и соответствующий одной из граней гиперкуба.
Примерами наиболее часто используемых временных измерений являются Дни, Месяцы, Кварталы и Годы. В качестве географических измерений широко употребляются Города, Районы, Регионы и Страны. В многомерной модели данных измерения играют роль индексов (рис. 3), служащих для идентификации конкретных значений в ячейках гиперкуба.
Ячейка (Cell) или показатель (Measure) – это поле, значение которого однозначно определяется фиксированным набором измерений.
Тип поля чаще всего определен как цифровой. В зависимости от того, как формируются значения некоторой ячейки, обычно она может быть переменной (значения изменяются и могут быть загружены из внешнего источника данных или сформированы программно) либо формулой (значения, подобно формульным ячейкам электронных таблиц, вычисляются по заранее заданным формулам).
B существующих
МСУБД используются два
B полукубической схеме предполагается, что в БД может быть определено несколько гиперкубов с различной размерностью и с различными измерениями в качестве граней. Примером системы, поддерживающей поликубический вариант БД, является сервер Оrас1е Express Server.
B случае гиперкубической схемы предполагается, что все показатели определяются одним и тем же набором измерений. Это означает, что при наличии нескольких гиперкубов БД все они имеют одинаковую размерность и совпадающие измерения. Очевидно, в некоторых случаях информация в БД может быть избыточной (если требовать обязательное заполнение ячеек).
В случае многомерной модели данных применяется ряд специальных операций, к которым относятся: формирование «среза», «вращение», агрегация и детализация.
«Срез» (Slice) представляет собой подмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений. Формирование «срезов» выполняется для ограничения используемых пользователем значений, т.к. все значения гиперкуба практически никогда одновременно не используются.
Операция «вращение» (Rotate) применяется при двумерном представлении данных. Суть ее заключается в изменении порядка измерений при визуальном представлении данных.
Операцию «вращение» можно обобщить и на многомерный случай, если под ней понимать процедуру изменения порядка следования измерений. В простейшем случае, например, это может быть взаимная перестановка двух произвольных измерений.
Отношения и иерархические отношения. В нашем примере значения Показателей определяются только тремя измерениями. На самом деле их может быть гораздо больше и между их значениями обычно существуют множество различных Отношений (Relation) типа «один ко многим».
Переход от более агрегированных к более детализированным данным называется операцией «детализации» (Drill Down). Например, начав анализ на уровне Региона, пользователь может захотеть получить более точную информацию о работе конкретного Подразделения или Менеджера.
Многомерные базы данных отличаются от реляционных прежде всего многомерностью – поддержкой неограниченного числа значений в поле, и находят свое применение там, где необходима эффективная и простая работа с большими массивами символьной информации.
В многомерных СУБД данные организованы в виде упорядоченных многомерных массивов, удовлетворяющих требованиям защиты от несанкционированного доступа в организации. Они обеспечивают более быструю реакцию на запросы данных за счет того, что обращения поступают к относительно небольшим блокам данных, необходимых для конкретной группы пользователей. Для достижения сравнимой производительности реляционные системы требуют тщательной проработки схемы базы данных, определения способов индексации и специальной настройки. Ограничения SQL не позволяют реализовать в реляционных СУБД многие встроенные функции, легко обеспечиваемые в системах, основанных на многомерном представлении данных.
Основными преимуществами многомерных СУБД являются:
Многомерные модели данных имеют три важных области применения, связанных с проблематикой анализа данных:
Многомерные базы данных рассматривают данные как кубы, которые являются обобщением электронных таблиц на любое число измерений. Кубы поддерживают иерархию измерений и формул без дублирования их определений. Набор соответствующих кубов составляет многомерную базу данных (или хранилище данных).
Хранилища данных, как правило, содержат следующие три типа фактов. Факты представляют субъект – некий шаблон или событие, которые необходимо проанализировать. В большинстве многомерных моделей данных факты однозначно определяются комбинацией значений измерений; факт существует только тогда, когда ячейка для конкретной комбинации значений не пуста:
Параметры состоят из двух компонентов:
В многомерной базе данных параметры, как правило, представляют свойства факта, который пользователь хочет изучить.