Многомерные базы данных

Автор работы: Пользователь скрыл имя, 13 Июня 2014 в 10:33, реферат

Краткое описание

Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.
Цель данного реферата теоретически рассмотреть многомерную модель баз данных, рассмотреть основные свойства, на чем строиться, выявить достоинства и недостатки.

Содержание

Введение 4
1. Многомерная модель данных 5
1.1. Представление данных в многомерной модели 5
1.2. Основные свойства многомерной модели 6
1.3. Основные понятия многомерной модели 6
1.4. Организация данных в многомерных СУБД 7
1.5. Специализированные операции в многомерной модели 8
2. Многомерные базы данных 9
2.1. Основные преимущества многомерных СУБД 9
2.2. Области применения многомерных моделей данных 10
2.3. Способы хранения данных в многомерных БД 11
2.4. Оправданность использования многомерных СУБД 15
Заключение 16
Список использованных источников 18

Прикрепленные файлы: 1 файл

реферат по бд.docx

— 46.13 Кб (Скачать документ)

Федеральное агентство железнодорожного транспорта

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

Омский государственный университет путей сообщения

ОмГУПС (ОмИИТ)

 

 

Кафедра «Автоматика и системы управления»

 

 

 

 

 

 

 

 

Многомерные базы данных

 

Тематический реферат

по дисциплине «Практика по рабочему профилю»

 

 

 

 

 

 

Студент гр. 22Ф

Штанько Е. О

26.03.2014

 

Руководитель –

профессор кафедры ИФК

И. К. Тихонова

26.03.2014

 

 

 

 

 

 

 

 

 

 

 

Омск 2014

 
Содержание

 

 
Введение

Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.

 

Цель данного реферата теоретически рассмотреть многомерную модель баз данных, рассмотреть основные свойства, на чем строиться, выявить достоинства и недостатки.

 

1. Многомерная модель данных

Многомерный подход к представлению данных в базе появился практически одновременно с реляционным, но реально работающих многомерных СУБД (МСУБД) до настоящего времени было очень мало. С середины 90-х годов интерес к ним стал приобретать массовый характер.

Толчком послужила в 1993 году программная статья одного из основоположников реляционного подхода Э. Кодда. В ней сформулированы 12 основных требований к системам класса OLAP (Online Analytical Processing – оперативная аналитическая обработка), важнейшие из которых связаны с возможностями концептуального представления и обработки многомерных данных. Многомерные системы позволяют оперативно обрабатывать информацию для проведения анализа и принятия решения.

В развитии концепций информационных систем можно выделить следующие два направления:

  • системы оперативной (транзакционной) обработки;
  • системы аналитической обработки (системы поддержки принятия решений).

Реляционные СУБД предназначались для информационных систем оперативной обработки информации и в этой области были весьма эффективны. В системах аналитической обработки они показали себя несколько неповоротливыми и недостаточно гибкими. Более эффективными здесь оказываются многомерные СУБД.

1.1. Представление данных в многомерной модели

Многомерная модель данных является узкоспециализированной моделью, предназначенной для оперативной аналитической обработки информации. В основе модели лежит не двумерная, как в реляционной модели, а многомерная таблица и многомерное логическое представление структуры информации при описании данных и в операциях манипулирования данными. По сравнению с реляционной моделью многомерная организация данных обладает более высокой наглядностью и информативностью.

1.2. Основные свойства многомерной модели

Многомерной модели должны быть присущи агрегируемость, историчность и прогнозируемость данных.

  • Агрегируемостъ данных означает рассмотрение информации на различных уровнях ее обобщения. В информационных системах степень детальности представления информации для пользователя зависит от его уровня: аналитик, пользователь-оператор, управляющий, руководитель.
  • Историчность данных предполагает обеспечение высокого уровня статичности (неизменности) собственно данных и их взаимосвязей, а также обязательность привязки данных ко времени.

Статичность данных позволяет использовать при их обработке специализированные методы загрузки, хранения, индексации и выборки.

Временная привязка данных необходима для частого выполнения запросов, имеющих значения времени и даты в составе выборки. Необходимость упорядочения данных по времени в процессе обработки и предоставления данных пользователю накладывает требования на механизмы хранения и доступа к информации. Так, для уменьшения времени обработки запросов желательно, чтобы данные всегда были отсортированы в том порядке, в котором они наиболее часто запрашиваются.

  • Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным временным интервалам.

1.3. Основные понятия многомерной модели

Если речь идет о многомерной модели с мерностью больше двух, то не обязательно визуально информация представляется в виде многомерных объектов (трех-, четырех- и более мерных гиперкубов). Пользователю и в этих случаях более удобно иметь дело с двумерными таблицами или графиками. Данные при этом представляют собой как бы «срезы» из многомерного хранилища данных, выполненные с разной степенью детализации.

Рассмотрим основные понятия многомерных моделей данных, к числу которых относятся измерение и ячейка.

Измерение (Dimension) – упорядоченный набор значений, принимаемых конкретным параметром, и соответствующий одной из граней гиперкуба.

Примерами наиболее часто используемых временных измерений являются Дни, Месяцы, Кварталы и Годы. В качестве географических измерений широко употребляются Города, Районы, Регионы и Страны. В многомерной модели данных измерения играют роль индексов (рис. 3), служащих для идентификации конкретных значений в ячейках гиперкуба.

Ячейка (Cell) или показатель (Measure) – это поле, значение которого однозначно определяется фиксированным набором измерений.

Тип поля чаще всего определен как цифровой. В зависимости от того, как формируются значения некоторой ячейки, обычно она может быть переменной (значения изменяются и могут быть загружены из внешнего источника данных или сформированы программно) либо формулой (значения, подобно формульным ячейкам электронных таблиц, вычисляются по заранее заданным формулам).

1.4. Организация данных в многомерных СУБД

B существующих  МСУБД используются два основных  варианта (схемы) организации данных: гиперкубическая и поликубическая.

B полукубической схеме предполагается, что в БД может быть определено несколько гиперкубов с различной размерностью и с различными измерениями в качестве граней. Примером системы, поддерживающей поликубический вариант БД, является сервер Оrас1е Express Server.

B случае гиперкубической схемы предполагается, что все показатели определяются одним и тем же набором измерений. Это означает, что при наличии нескольких гиперкубов БД все они имеют одинаковую размерность и совпадающие измерения. Очевидно, в некоторых случаях информация в БД может быть избыточной (если требовать обязательное заполнение ячеек).

1.5. Специализированные операции в многомерной модели

В случае многомерной модели данных применяется ряд специальных операций, к которым относятся: формирование «среза», «вращение», агрегация и детализация.

«Срез» (Slice) представляет собой подмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений. Формирование «срезов» выполняется для ограничения используемых пользователем значений, т.к. все значения гиперкуба практически никогда одновременно не используются.

Операция «вращение» (Rotate) применяется при двумерном представлении данных. Суть ее заключается в изменении порядка измерений при визуальном представлении данных.

Операцию «вращение» можно обобщить и на многомерный случай, если под ней понимать процедуру изменения порядка следования измерений. В простейшем случае, например, это может быть взаимная перестановка двух произвольных измерений.

Отношения и иерархические отношения. В нашем примере значения Показателей определяются только тремя измерениями. На самом деле их может быть гораздо больше и между их значениями обычно существуют множество различных Отношений (Relation) типа «один ко многим».

Переход от более агрегированных к более детализированным данным называется операцией «детализации» (Drill Down). Например, начав анализ на уровне Региона, пользователь может захотеть получить более точную информацию о работе конкретного Подразделения или Менеджера.

 

2. Многомерные базы данных

2.1. Основные преимущества многомерных СУБД

Многомерные базы данных отличаются от реляционных прежде всего многомерностью – поддержкой неограниченного числа значений в поле, и находят свое применение там, где необходима эффективная и простая работа с большими массивами символьной информации.

В многомерных СУБД данные организованы в виде упорядоченных многомерных массивов, удовлетворяющих требованиям защиты от несанкционированного доступа в организации. Они обеспечивают более быструю реакцию на запросы данных за счет того, что обращения поступают к относительно небольшим блокам данных, необходимых для конкретной группы пользователей. Для достижения сравнимой производительности реляционные системы требуют тщательной проработки схемы базы данных, определения способов индексации и специальной настройки. Ограничения SQL не позволяют реализовать в реляционных СУБД многие встроенные функции, легко обеспечиваемые в системах, основанных на многомерном представлении данных.

Основными преимуществами многомерных СУБД являются:

  • общая простота системы, что позволяет осуществлять быстрое встраивание технологий многомерных СУБД в приложения. Системы на основе многомерных баз данных требуют меньше специальных навыков по разработке и администрированию;
  • относительно низкая общая стоимость владения, а также быстрый возврат инвестиций;
  • в случае использования многомерных СУБД поиск и выборка данных осуществляется значительно быстрее, чем при многомерном концептуальном взгляде на реляционную базу данных, т.к. многомерная база данных обеспечивает оптимизированный доступ к запрашиваемым ячейкам;
  • многомерные СУБД легко справляются с задачами включения в информационную модель разнообразных встроенных функций, тогда как объективно существующие ограничения языка SQL делают выполнение этих задач на основе реляционных СУБД достаточно сложным, а иногда и невозможным.

2.2. Области применения многомерных моделей данных

Многомерные модели данных имеют три важных области применения, связанных с проблематикой анализа данных:

  1. Хранилища данных (ХД) интегрируют для анализа информации из нескольких источников.
  2. Системы оперативной аналитической обработки (OLAP) позволяют оперативно получить ответы на запросы, охватывающие большие объемы данных в поисках общих тенденций.
  3. Приложения добычи данных служат для выявления знаний за счет полуавтоматического поиска ранее неизвестных шаблонов и связей в базах данных.

Многомерные базы данных рассматривают данные как кубы, которые являются обобщением электронных таблиц на любое число измерений. Кубы поддерживают иерархию измерений и формул без дублирования их определений. Набор соответствующих кубов составляет многомерную базу данных (или хранилище данных).

Хранилища данных, как правило, содержат следующие три типа фактов. Факты представляют субъект – некий шаблон или событие, которые необходимо проанализировать. В большинстве многомерных моделей данных факты однозначно определяются комбинацией значений измерений; факт существует только тогда, когда ячейка для конкретной комбинации значений не пуста:

  1. События (event), по крайней мере, на уровне самой большой гранулярности, как правило, моделируют события реального мира, при этом каждый факт представляет определенный экземпляр изучаемого явления.
  2. Мгновенные снимки (snapshot) моделируют состояние объекта в данный момент времени.
  3. Совокупные мгновенные снимки (cumulative snapshot) содержат информацию о деятельности организации за определенный отрезок времени.

Параметры состоят из двух компонентов:

    • численная характеристика факта, например, цена или доход от продаж;
    • формула, обычно простая агрегативная функция, скажем, сумма, которая может объединять несколько значений параметров в одно.

В многомерной базе данных параметры, как правило, представляют свойства факта, который пользователь хочет изучить.

  1. Аддитивные параметры могут содержательным образом комбинироваться в любом измерении.
  2. Полуаддитивные параметры, которые не могут комбинироваться в одном или нескольких измерениях.
  3. Неаддитивные параметры не комбинируются в любом измерении, обычно потому, что выбранная формула не позволяет объединить средние значения низкого уровня в среднем значении более высокого уровня.

Информация о работе Многомерные базы данных