Распределенные информационные системы

Автор работы: Пользователь скрыл имя, 02 Ноября 2015 в 11:19, реферат

Краткое описание

В данной работе рассмотрены основные сведения о распределенной информационной системе: описаны предпосылки ее развития, средства работы с данными, введено понятие распределенной базы данных, а также ее типов и основных принципов. В третьей главе представлены примеры распределенных информационных систем.
Целью исследования является изучение теоретических основ о распределенных информационных системах, а также формирование знаний о принципах ее работы.

Содержание

ВВЕДЕНИЕ
1.ПОНЯТИЕ РАСПРЕДЕЛЕННЫХ ИС
1.1. Предпосылки создания распределенных ИС
1.2. Понятие распределенных информационных систем
1.3. Средства работы с распределенными данными
2. РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ
2.1. Основные принципы
2.2 Типы распределенных БД
2.3. Назначение и принцип работы распределенной БД
3. ПРИМЕРЫ РАСПРЕДЕЛЕННЫХ СИСТЕМ
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА

Прикрепленные файлы: 1 файл

Реферат.docx

— 37.91 Кб (Скачать документ)

4.Независимость от расположения. Пользователи не должны знать, где именно данные хранятся  физически и должны поступать  так, как если бы все данные  хранились на их собственном  локальном узле.

5.Независимость от фрагментации. Система поддерживает независимость  от фрагментации, если данная  переменная-отношение может быть  разделена на части или фрагменты  при организации её физического  хранения. В этом случае данные  могут храниться в том месте, где они чаще всего используются, что позволяет достичь локализации  большинства операций и уменьшения  сетевого трафика.

6.Независимость от репликации. Система поддерживает репликацию  данных, если данная хранимая  переменная-отношение — или в  общем случае данный фрагмент  данной хранимой переменной-отношения  — может быть представлена  несколькими отдельными копиями  или репликами, которые хранятся  на нескольких отдельных узлах.

7.Обработка распределённых  запросов. Суть в том, что для  запроса может потребоваться  обращение к нескольким узлам. В такой системе может быть  много возможных способов пересылки  данных, позволяющих выполнить рассматриваемый  запрос.

8.Управление распределёнными  транзакциями. Существует 2 главных  аспекта управления транзакциями: управление восстановлением и  управление параллельностью обработки. Что касается управления восстановлением, то чтобы обеспечить атомарность  транзакции в распределённой  среде, система должна гарантировать, что все множество относящихся  к данной транзакции агентов (агент  — процесс, который выполняется  для данной транзакции на отдельном  узле) или зафиксировало свои  результаты, или выполнило откат. Что касается управления параллельностью, то оно в большинстве распределённых  систем базируется на механизме  блокирования, точно так, как и  в нераспределённых системах.

9.Аппаратная независимость. Желательно иметь возможность  запускать одну и ту же СУБД  на различных аппаратных платформах  и, более того, добиться, чтобы различные  машины участвовали в работе  распределённой системы как равноправные  партнёры.

10.Независимость от операционной  системы. Возможность функционирования  СУБД под различными операционными  системами.

11.Независимость от сети. Возможность поддерживать много  принципиально различных узлов, отличающихся оборудованием и  операционными системами, а также  ряд типов различных коммуникационных  сетей.

12.Независимость от типа  СУБД. Необходимо, чтобы экземпляры  СУБД на различных узлах все  вместе поддерживали один и  тот же интерфейс, и совсем  необязательно, чтобы это были  копии одной и той же версии  СУБД [6].

Основная задача систем управления распределенными базами данных состоит в обеспечении средства интеграции локальных баз данных, располагающихся в некоторых узлах вычислительной сети, с тем, чтобы пользователь, работающий в любом узле сети, имел доступ ко всем этим базам данных как к единой базе данных.

2.2. Типы распределенных  БД

Возможны однородные и неоднородные распределенные базы данных. В однородном случае каждая локальная база данных управляется одной и той же СУБД. В неоднородной системе локальные базы данных могут относиться даже к разным моделям данных.

Помимо вышеназванных типов распределенных баз данных можно выделить следующие:

1) Распределённые Базы  Данных

2) Мультибазы данных с  глобальной схемой. Система Мультибаз  данных - это распределённая система, которая служит внешним интерфейсом  для доступа ко множеству локальных  СУБД или структурируется, как  глобальный уровень над локальными  СУБД.

3) Федеративные базы данных. В отличие от мультибаз не  располагают глобальной схемой, к которой обращаются все приложения. Вместо этого поддерживается  локальная схема импорта-экспорта  данных. На каждом узле поддерживается  частичная глобальная схема, описывающая  информацию тех удалённых источников, данные с которых необходимы  для функционирования.

4) Мультибазы с общим  языком доступа - распределённые  среды управления с технологией "клиент-сервер"

5) Интероперабельные системы - это системы, в которых сами  приложения, выполняемые в среде  той или иной СУБД, ответственны  за интерфейсы между различными  средами приложения, независимо  от того, являются они однородными  или неоднородными. Системы ориентированы  главным образом на обмен данными. Дальнейшее развитие этих систем  является объектно-ориентированные  БД [7].

2.3. Назначение и принцип  работы распределенной БД

Когда у предприятия есть удаленные филиалы, возникает необходимость в синхронизации данных между ними и главным офисом. Естественно, что в основной базе предприятия должны отображаться любые изменения касательно филиалов. Такую синхронизацию можно осуществлять при помощи механизмов распределенной базы данных.

В главном офисе создаются начальные образы базы (для каждого филиала - свой образ) и передаются в филиалы, где их загружают. При этом задаются настройки обмена, по которым будет происходить синхронизация между каждой из периферийных (подчиненных) баз и главной базой.

Структура предприятия может быть такова, что у филиалов, подчиненных главному офису, могут быть свои удаленные подразделения. Тогда для них производят процедуру аналогичную той, что была совершена при настройке филиалов, подчиненных напрямую главной базе [8].

Таким образом, можно подытожить, что в распределенной базе формируются древообразные связи. Например, на предприятии главному офису подчинено два филиала, причем у первого филиала есть два удаленных подразделения, а у второго - три подразделения. Получается, что основной базе подчинено две периферийных базы. Первой периферийной базе, в свою очередь, подчинено еще две базы, а второй периферийной - три. Связи в такой распределенной базе представлены на рис. 2.1.

Рис.2.1. Принцип работы БД

Узел 1 является корневым для всей распределенной базы и главным узлом для подчиненных ему второму и третьему. Второй узел является главным узлом для подчиненных ему четвертому и пятому. Третий узел будет главным для подчиненных ему шестому, седьмому и восьмому.

Любой узел распределенной базы данных (УРБД) "видит" только узлы, напрямую связанные с ним. С такими узлами он и осуществляет обмен данными.

Внесение изменений в данные информационной базы возможно в любом узле УРБД, причем изменения данных передаются между любыми связанными узлами. На схеме направления, по которым передаются изменения данных, обозначены зелеными стрелочками (по ним из любого узла УРБД за определенное количество шагов можно попасть в любой другой узел, отсюда следует, что при внесении изменений в данные любого узла эти изменения постепенно перенесутся во все остальные).

Внесение изменений в конфигурацию информационной базы возможно только в одном (корневом) узле УРБД, причем изменения конфигурации передаются от главного узла к подчиненным. На схеме направления, по которым передаются изменения конфигурации, обозначены красными стрелочками [9].

Теперь рассмотрим, каким образом осуществляется обмен данными между узлами УРБД. При внесении изменений в данные информационной базы программа запоминает, что было изменено и каким образом. Для любого узла раз в определенный промежуток времени запускается обработка (вручную либо автоматически), которая формирует специальные сообщения, в каких в формате XML отображена информация о том, были ли изменения (если были, то какие), и отправляет их в определенные каталоги по локальной сети либо по FTP, или же на определенные адреса электронной почты. Также обработка проверяет, появились ли в этом каталоге либо электронном ящике аналогичные сообщения от других узлов, связанных напрямую с этим узлом, адресованные ему. Если появились, то загрузит сообщения, а следовательно и изменения в данных. Инфраструктура сообщений поддерживает нумерацию сообщений, и позволяет получать подтверждения от узла-получателя о приеме сообщений. Такое подтверждение содержится в каждом сообщении, приходящем от узла-получателя в виде номера последнего принятого сообщения.

Если узел-приемник еще не успел загрузить сообщение из каталога обмена , узел-источник не будет выкладывать, а тем более формировать файл сообщений в каталог обмена по этому узлу. Подразумевается, что после успешной загрузки, файл удаляется из каталога обмена. Это позволяет не осуществлять лишние операции при обмене и не загружать канал лишний раз.

При изменении конфигурации базы информация об изменениях распространяется в сообщениях обмена вместе с изменениями данных.

Обмен данными между базами производится следующим образом:

1)В базе-источнике система  определяет список изменённых  объектов за время, прошедшее  с предыдущего сеанса выгрузки  данных.

2)По данному списку  система формирует XML-пакет, который  передается в базу-приемник.

Для того чтобы сформировать пакет система обращается к измененным объектам базы данных. При обращении система блокирует данные объекты.

3) XML-пакет передается  в базу-приемник.

В базе-приемнике XML-пакет разворачивается и изменения, содержащиеся в нем, вносятся в базу.

Все изменения записываются в рамках одной транзакции, при этом все измененные объекты блокируются.

3. ПРИМЕРЫ РАСПРЕДЕЛЕННЫХ  СИСТЕМ

Сегодня практически все крупнейшие производители систем управления базами данных предлагают решения в области управления распределенными ресурсами. Однако все эти решения поддерживают ограниченные функции построения неоднородных распределенных систем.

Среди многочисленных прототипов и научно-исследовательских систем следует упомянуть систему SDD-1, созданную в конце 70-х -- начале 80-х годов в научно-исследовательском отделении фирмы ComputerCorporationofAmerica; систему R*, которая является распределенной версией системы System R и создана в начале 80-х годов фирмой IBM; а также систему Distributed INGRES, которая является распределенной версией системы INGRES и создана также в начале 80-х годов в Калифорнийском университете в Беркли.

Что касается коммерческих продуктов, то в настоящее время в большинстве реляционных систем предусмотрены разные виды поддержки использования распределенных баз данных с разной степенью функциональности. Среди таких систем наиболее известны система INGRES/STAR отделения IngresDivision фирмы The ASK GroupInc., система ORACLE фирмы OracleCorporation, а также модуль распределенной работы системы DB2 фирмы IBM.

Сегодня многие фирмы - разработчики СУБД заявляют о том, что они поддерживают работу с распределенными БД, однако при ближайшем рассмотрении в большинстве случаев эти заявления оказываются несколько преувеличенными. Специалисты в области СУБД считают, что только несколько пакетов СУБД позволяют в некоторой степени реализовать распределенную базу данных.

В работе [3] дано следующее определение распределенной БД: "Распределенная БД - это множество физических баз данных, которые выглядят для пользователя как одна логическая БД". К сожалению, на сегодняшний день ни одна СУБД полностью не реализует это определение. Наиболее близко к его реализации подошли следующие СУБД: 

- InformixOn-Line фирмы InformixSoftware;

- Ingres Intelligent Database фирмы Ingres Corp;

- Oracle (version 7) фирмы Oracle Corp;

- Sybase System 10 фирмы Sybase Inc. 

 Хотя ни одна из этих 4 СУБД полностью не реализует все функции распределенной СУБД, однако каждая из них реализует или в скором времени будет реализовывать поддержку работы с распределенной БД.

Наиболее полно функции распределенной СУБД реализованы в СУБД Ingres и Oracle. Коротко рассмотрим возможности этих пакетов.

СУБД Ingres работает на множестве UNIX-платформ, на платформах DEC VMS, Hewlett-Packard MPE, DOS, MicrosoftWindows 3.1, OS/2, Macintosh. Она также работает со многими сетевыми протоколами, включая OpenSystemInterconnectionTransportClass 4. Ingres имеет средства для доступа к данным СУБД DB2, Rdb, Allbase. Основные функции распределенной СУБД обеспечиваются дополнительной компонентой Ingres/Star. Она поддерживает оптимизацию распределенных запросов, позволяет читать и обновлять в рамках одной транзакции данные разных узлов, обеспечивает возможность удалять записи одновременно в нескольких узлах.

СУБД Informix-Online разработана для среды UNIX, но может также работать под Novell. Informix-Online имеет оптимизатор запросов и реализует те же функции работы с распределенной БД, что и Ingres, однако у Informix более жесткие требования к ресурсам компьютера, в частности ему требуется больше оперативной памяти.

СУБД System 10 фирмы Sybase в настоящее время находится в состоянии разработки. Она должна работать на UNIX-платформах, на платформах OS/2, Window NT, NetWare. System 10 будет работать с несколькими сетевыми протоколами и поддерживать связь с СУБД DB2, Oracle 7, Informix-Online, Rdb. System 10 будет иметь оптимизатор распределенных запросов, она позволит читать и обновлять данные нескольких узлов. Функции работы с распределенной БД будут реализованы с помощью дополнительной компоненты ReplicationServer.

В 7 версии СУБД Oracle реализовано множество функций для работы с распределенной БД. Среди них следует выделить оптимизатор распределенных запросов и средство чтения и обновления данных нескольких узлов в рамках одной транзакции. Oracle v 7 работает на более чем 80 вычислительных платформах, поддерживает большинство существующих коммерческих сетевых протоколов и может обмениваться данными с СУБД DB2, SQL/DS, TandemComputers, NonStop SQL, Rdb, HP TurboImage. Разрабатываются шлюзы еще к 18 СУБД.

В Oracle словарь данных хранится также, как остальные данные, поэтому его таблицы могут быть распределены по узлам сети. Все операции с распределенной БД "прозрачны" для пользователей и разработчиков. В области обновления распределенной БД Oracle обогнал всех своих конкурентов. Пользователи Oracle могут с помощью компоненты SQL*Net "прозрачно" работать с данными (не обязательно данными Oracle), размещающимися на различных типах компьютеров и в различных узлах сети. Высокопроизводительное средство "прозрачного" обновления распределенной БД реализовано на основе оригинально выполненного двухфазного протокола фиксации изменений.

Информация о работе Распределенные информационные системы