Многомерные базы данных

Автор работы: Пользователь скрыл имя, 13 Июня 2014 в 10:33, реферат

Краткое описание

Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.
Цель данного реферата теоретически рассмотреть многомерную модель баз данных, рассмотреть основные свойства, на чем строиться, выявить достоинства и недостатки.

Содержание

Введение 4
1. Многомерная модель данных 5
1.1. Представление данных в многомерной модели 5
1.2. Основные свойства многомерной модели 6
1.3. Основные понятия многомерной модели 6
1.4. Организация данных в многомерных СУБД 7
1.5. Специализированные операции в многомерной модели 8
2. Многомерные базы данных 9
2.1. Основные преимущества многомерных СУБД 9
2.2. Области применения многомерных моделей данных 10
2.3. Способы хранения данных в многомерных БД 11
2.4. Оправданность использования многомерных СУБД 15
Заключение 16
Список использованных источников 18

Прикрепленные файлы: 1 файл

реферат по бд.docx

— 46.13 Кб (Скачать документ)

Многомерная база данных предназначена для определенных типов запросов:

  1. Запросы вида slice-and-dice осуществляют выбор, сокращающий куб.
  2. Запросы вида drill-down и roll-up – взаимообратные операции, которые используют иерархию измерений и параметры для агрегирования. Обобщение до высших значений соответствует исключению размерности.
  3. Запросы вида drill-across комбинируют кубы, которые имеют одно или несколько общих измерений. С точки зрения реляционной алгебры такая операция выполняет слияние (join).
  4. Запросы вида ranking возвращает только те ячейки, которые появляются в верхней или нижней части упорядоченного определенным образом списка.
  5. Поворот (rotating) куба дает пользователям возможность увидеть данные, сгруппированные по другим измерениям.

2.3. Способы хранения данных в многомерных БД

Многомерные базы данных реализуют в трех основных формах:

  1. Системы многомерной оперативной аналитической обработки (MOLAP – Multidimensional OLAP) хранят данные в специализированных многомерных структурах.
  2. Реляционные системы OLAP (ROLAP – Relational OLAP) для хранения данных используют реляционные базы данных, а также применяют специализированные индексные структуры, такие как битовые карты, чтобы добиться высокой скорости выполнения запросов.
  3. Гибридные системы (HOLAP – Hybrid OLAP) – детальные данные остаются на месте (в реляционной БД), а агрегаты хранятся в многомерной БД

Каждый из этих способов имеет свои преимущества и недостатки и должен применяться в зависимости от условий – объема данных, мощности реляционной СУБД и т. д.

Способ хранения MOLAP обеспечивает высокую скорость выполнения OLAP-операций. Но многомерная база в этом случае чаще всего будет избыточной. Гиперкуб, построенный на ее основе, будет сильно зависеть от числа измерений. При увеличении количества измерений объем куба будет экспоненциально расти. Иногда это может привести к «взрывному росту» объема данных, в результате парализующему запросы пользователей.

Использование многомерных БД в системах оперативной аналитической обработки имеет следующие достоинства:

  • высокая производительностьпоиск и выборка данных осуществляется значительно быстрее, чем при многомерном концептуальном взгляде на реляционную базу данных – среднее время ответа на нерегламентированный запрос при использовании многомерной СУБД обычно на один-два порядка меньше, чем в случае реляционной СУБД с нормализованной схемой данных;
  • структура и интерфейсы наилучшим образом соответствуют структуре аналитических запросов. Этот способ более родственен ментальной модели человека, т.к. аналитик привык оперировать плоскими таблицами. Производя сечение куба двумерной плоскостью в том или ином направлении, легко получить взаимозависимость любой пары величин относительно выбранной меры.
  • многомерные СУБД легко справляются с задачами включения в информационную модель разнообразных встроенных функций, тогда как объективно существующие ограничения языка SQL делают выполнение этих задач на основе реляционных СУБД достаточно сложным, а иногда и невозможным.

MOLAP могут  работать только со своими  собственными многомерными БД  и основываются на патентованных  технологиях для многомерных  СУБД, поэтому являются наиболее  дорогими. Эти системы обеспечивают  полный цикл OLAP-обработки и либо  включают в себя, помимо серверного  компонента, собственный интегрированный  клиентский интерфейс, либо используют  для связи с пользователем  внешние программы работы с  электронными таблицами. Для обслуживания  таких систем требуется специальный  штат сотрудников, занимающихся  установкой, сопровождением системы, формированием представлений данных  для конечных пользователей.

Еще к недостаткам MOLAP-моделей можно отнести:

  • не позволяют работать с большими БД;
  • по сравнению с реляционными, очень неэффективно используют внешнюю память. Поэтому при проектировании многомерной БД часто приходится жертвовать либо быстродействием (а это одно из первых достоинств и главная причина выбора именно многомерной СУБД), либо внешней памятью (хотя, как отмечалось, максимальный размер многомерных БД ограничен);
  • отсутствуют единые стандарты на интерфейс, языки описания и манипулирования данными;
  • не поддерживают репликацию данных, часто используемую в качестве механизма загрузки.

ROLAP-система обеспечивает многомерный анализ данных, хранящихся в реляционной БД, и может работать с любой стандартной реляционной СУБД. Для физической реализации многомерной модели данных используется реляционный сервер БД. Многомерная обработка данных выполняется либо на сервере реляционной БД, либо на сервере промежуточного уровня, либо на стороне клиента.

Непосредственное использование реляционных БД в качестве исходных данных в системах аналитической оперативной обработки имеет следующие достоинства:

  • При использовании ROLAP размер хранилища не является таким критичным параметром, как в случае MOLAP;
  • при оперативной аналитической обработке содержимого ХД инструменты ROLAP позволяют производить анализ непосредственно над хранилищем (потому что в подавляющем большинстве случаев корпоративные ХД реализуются средствами реляционных СУБД);
  • в случае переменной размерности задачи, когда изменения в структуру измерений приходится вносить достаточно часто, ROLAP системы с динамическим представлением размерности являются оптимальным решением, т.к. в них такие модификации не требуют физической реорганизации БД, как в случае MOLAP;
  • системы ROLAP могут функционировать на гораздо менее мощных клиентских станциях, чем системы MOLAP, поскольку основная вычислительная нагрузка в них ложится на сервер, где выполняются сложные аналитические SQL-запросы, формируемые системой;
  • реляционные СУБД обеспечивают значительно более высокий уровень защиты данных и хорошие возможности разграничения прав доступа.

К недостаткам ROLAP-систем можно отнести:

  • ограниченные возможности с точки зрения расчета значений функционального типа;
  • меньшая производительность. Для обеспечения сравнимой с MOLAP производительности реляционные системы требуют тщательной проработки схемы БД и специальной настройки индексов. Но в результате этих операций производительность хорошо настроенных реляционных систем при использовании схемы «звезда» вполне сравнима с производительностью систем на основе многомерных БД.

Гибридные системы HOLAP разработаны с целью совмещения достоинств и минимизации недостатков, присущих MOLAP и ROLAP. В отличие от MOLAP, которая работает лучше, когда данные более плотные, серверы ROLAP лучше в тех случаях, когда данные довольно разрежены. Серверы HOLAP применяют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP – для плотных областей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к соответствующим фрагментам данных, комбинируют результаты, а затем предоставляют результат пользователю. Материализация выборочных представлений в HOLAP, выборочное построение индексов, а также планирование запросов и ресурсов аналогично тому, как это реализовано в серверах MOLAP и ROLAP.

В случае использования гибридной архитектуры исходные данные остаются в реляционной БД, а агрегаты размещаются в многомерной БД. Построение OLAP-куба выполняется по запросу OLAP-средства на основе реляционных и многомерных данных. Такой подход позволяет избежать взрывного роста данных. При этом можно достичь оптимального времени исполнения клиентских запросов.

2.4. Оправданность использования многомерных СУБД

Использование многомерных СУБД оправдано только при следующих условиях:

  • объем исходных данных для анализа не слишком велик (не более нескольких Гбайт), т.е. уровень агрегации данных достаточно высок;
  • набор информационных измерений стабилен (поскольку любое изменение в их структуре почти всегда требует полной перестройки гиперкуба);
  • время ответа системы на нерегламентированные запросы является наиболее критичным параметром;
  • требуется широкое использование сложных встроенных функций для выполнения кроссмерных вычислений над ячейками гиперкуба, в том числе возможность написания пользовательских функций.

 

Заключение

В заключение необходимо сказать, что было бы не совсем правильно противопоставлять или говорить о какой-либо серьезной взаимной конкуренции реляционного и многомерного подходов. В настоящее время, многомерные СУБД всё чаще используются не только как самостоятельный программный продукт, но и как аналитические средства в хранилищах данных или традиционных оперативных системах, реализуемых средствами реляционных СУБД. Такое решение позволяет наиболее полно реализовать и использовать достоинства каждого из подходов: компактное хранение детализированных данных и поддержка очень больших баз данных, обеспечиваемые реляционными СУБД, простота настройки и хорошее время отклика, при работе с агрегированными данными, обеспечиваемые многомерными СУБД.

Технология многомерных баз данных также применяется к новым типам данных, которые современные технологии зачастую не в состоянии адекватно анализировать.

Наконец, технология многомерных баз данных все больше будет применяться там, где результаты анализа напрямую передаются в другие системы, тем самым, исключая участие человека в этом процессе.

 

Список использованных источников

  1. Крёнке Д. Теория и практика построения баз данных. – СПб.: Питер, 2004. – 800 с.
  2. Мишенин А.И. Теория экономических информационных систем. – М.: «Финансы и статистика», 2002. – 240 с.
  3. Смирнова Г.Н. Сорокин А.А. Тельнов Ю.Ф. Проектирование экономических информационных систем. – М.: «Финансы и статистика», 2002. – 512 с.
  4. Хомоненко А.Д., Цыганков В.М. Мальцев М.Г. Базы данных. – СПб: КОРОНА принт, 2004. – 736 с.
  5. Швецов В.И., Визгунов А.Н., Мееров И.Б. Базы данных: Учебное пособие. – Нижний Новгород: Изд-во ННГУ, 2004. – 217 с.

 

 


Информация о работе Многомерные базы данных