Автор работы: Пользователь скрыл имя, 02 Апреля 2013 в 09:17, дипломная работа
Ключевую роль в управлении компанией в целом и ее отдельными подразделениями играет информация. Однако, данные, которые доступны менеджерам и аналитикам непосредственно из корпоративных информационных систем, не унифицированы, разрозненны и в общем случае не подготовлены для анализа. Системы Business Intelligence - это как раз тот класс информационных систем, который позволяет превратить сырые данные в полезную для бизнеса информацию и знания, используемые в управлении, на основе которых можно принимать решения.
ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ И ТЕРМИНОВ 4
ВВЕДЕНИЕ 5
ЦЕЛИ И ЗАДАЧИ РАБОТЫ 7
ГЛАВА 1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕХНОЛОГИЙ БИЗНЕС ИНТЕЛЛЕКТА 8
1.1. Системы бизнес интеллекта 8
1.2. Внутренние интерфейсы Microsoft SQL Server 2005 10
1.3. Средства трансформации данных 11
1.4. Средства анализа данных 13
1.5. Средства визуализации данных 14
Выводы 14
ГЛАВА 2. ТЕХНОЛОГИИ ИНТЕРАКТИВНЫХ ИНФОРМАЦИОННЫХ ПАНЕЛЕЙ 16
2.1. Microsoft Reporting Services 16
2.2. Crystal Reports - технология генерации отчетности 22
2.3. Crystal Reports for Microsoft Visual Studio .NET 29
Выводы 32
ГЛАВА 3. МОДЕЛЬ СИСТЕМЫ ДЛЯ РАБОТЫ С ПЕРСОНАЛОМ ВУЗА 33
3.1. Контингент сотрудников и студентов в информационной картине факультета 33
Выводы 38
ГЛАВА 4. РЕАЛИЗАЦИЯ КОМПОНЕНТОВ СИСТЕМЫ БИЗНЕС ИНТЕЛЛЕКТА 40
4.1. Требования к системе Бизнес Интеллекта. Общая схема системы 40
4.2. Первичные данные системы Бизнес Интеллекта 41
4.3. Реализация модуля очистки, загрузки и обновления данных 44
4.4. Формирование многомерного хранилища данных 52
4.5. Модуль формирования отчетности 60
4.6. Модуль доступа к выходным документам 69
Выводы 69
ЗАКЛЮЧЕНИЕ 70
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 71
ПРИЛОЖЕНИЕ 1. «Структура хранилища данных» 72
ПРИЛОЖЕНИЕ 2. «Приложение работы с данными «Профсоюзный комитет» 76
ПРИЛОЖЕНИЕ 3. «Измерения проекта» 78
ПРИЛОЖЕНИЕ 4. «Структура кубов системы» 81
ПРИЛОЖЕНИЕ 5. «WEB-приложение» 87
ПРИЛОЖЕНИЕ 6. «Примеры выходных документов» 89
Рис. 1.2. Microsoft DSS - OLAP-сервер промежуточного звена, упрощающий пользователям навигацию по данным и повышающий производительность запросов к информации хранилища данных
В сочетании с широким выбором инструментов и приложений, поддерживающих через интерфейс Microsoft OLE DB for OLAP решение прикладных задач на базе OLAP, Microsoft DSS поможет расширить круг организаций, имеющих доступ к высокоразвитым инструментам анализа, и снизить затраты на построение хранилищ данных [1].
Одно из главных требований к
аналитическим системам и системам
поддержки принятия решений –
наглядность представления
Суть OLAP - превращение огромных массивов данных, не поддающихся осмыслению, в стройную и ясную информацию, предоставляющую пользователю четкую картину бизнеса.
Поэтому диаграммы и графики являются неотъемлемой частью OLAP-интерфейсов, а в некоторых случаях – главным способом визуализации данных.
В отличие от всех прочих информационных систем, диаграммы в OLAP не статичны, а интерактивны. Пользователь, манипулируя измерениями, меняет представление данных в диаграммах, получая десятки их разновидностей в процессе исследования информации.
Вторая особенность диаграмм в OLAP - многомерность.
Системы визуализации OLAP-данных, предназначенные для OLAP-анализа в Интернет, локальной сети, на персональном компьютере, работают с данными, предварительно сохраненными в многомерный локальный куб, и показывают эти данные в виде динамической таблицы и синхронной с ней диаграммы [21].
Отображение многомерного гиперкуба в трехмерном пространстве
Слово «гиперкуб» означает, что у этого куба может быть не 3, а 5, или 10 измерений. Представить и изобразить такой куб в рамках 3-х мерного пространства, ограниченного высотой, шириной и глубиной, невозможно.
Основной метод показа содержимого гиперкуба – показ нескольких последовательностей (series) на одном графике. Каждая последовательность закрашивается отдельным цветом. Группа последовательностей представляет собой значение одного 4-го измерения.
Например, для показа объемов продаж в разрезе времени и городов применяется следующий метод: по вертикали отображается сумма, по горизонтали время, а «в глубину» - города. Реально на плоскости диаграммы рисуется разными цветами: столько диаграмм, сколько есть городов. Соответствие цвета и города показывается в специальной таблице - легенде.
Итак, диаграмма может отобразить одновременно не более 2-х измерений и одного факта.
В случае если нужно показать несколько фактов, их показывают «в глубину», и для измерений остается только одна ось. Таким образом, если отображается более одного факта, то в диаграмме остается не более одного измерения [18].
Синхронность с таблицей
Как правило, диаграмма работает синхронно с OLAP-таблицей. Поворот таблицы приводит к повороту диаграммы - изменению расположения измерений по осям, фильтрация таблицы - к фильтрации диаграммы. Это придает OLAP-интерфейсу особую динамичность и «живость».
Иногда наоборот удобно пользоваться собственными инструментами преобразования диаграммы, не меняя таблицы. Например, быстрое выключение элементов измерения позволяет исключить из графика лишнее и провести экспресс-анализ зависимостей, при этом в таблице остаются доступными все данные.
Важно заметить, что типичное хранилище данных, как правило, отличается от обычной реляционной базы данных, так как обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Структура и данные обычных баз данных подвержены постоянным изменениям в процессе работы пользователей, а в хранилище данные обычно обновляются согласно расписанию (например, еженедельно). Обычные базы данных чаще всего являются источником данных, попадающих в хранилище.
Суть OLAP - превращение огромных массивов данных, не поддающихся осмыслению, в стройную и ясную информацию, предоставляющую пользователю четкую картину бизнеса. Поэтому диаграммы и графики являются неотъемлемой частью OLAP-интерфейсов, а в некоторых случаях – главным способом визуализации данных. В отличие от всех прочих информационных систем, диаграммы в OLAP не статичны, а интерактивны. Пользователь, манипулируя измерениями, меняет представление данных в диаграммах, получая десятки их разновидностей в процессе исследования информации. Вторая особенность диаграмм в OLAP - многомерность.
Системы визуализации OLAP-данных, предназначенные для OLAP-анализа в Интернет, локальной сети, на персональном компьютере, работают с данными, предварительно сохраненными в многомерный локальный куб, и показывают эти данные в виде динамической таблицы и синхронной с ней диаграммы.
Следует отметить, что OLAP-функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах. Конечной целью использования OLAP является анализ данных и представление результатов этого анализа в виде, удобном для восприятия и принятия решений. Основная идея OLAP заключается в построении многомерных кубов, которые будут доступны для пользовательских запросов. Исходные данные для построения OLAP-кубов обычно хранятся в хранилищах данных, концепция построения которых рассмотрена выше.
Таким образом, с учетом той структуры, которая присуща хранилищам данных, данные из оперативных баз данных с помощью DTS переносятся с параллельным преобразованием их в нужный формат в новую базу данных MS SQL Server 2005, которая и будет выполнять роль хранилища данных. При этом в этой базе обязательно должна храниться одна таблица фактов и несколько связанных с ней таблиц измерений.
Поскольку процесс создания хранилищ данных является итеративным по своей природе, он требует регулярного перепроектирования в течение всего жизненного цикла приложения.
Следует добавить, что связанные серверы (Linked servers) – это надмножество удаленных серверов. Удаленным серверам позволяется запускать хранимые процедуры на распределенных SQL-сервер машинах. Поддержка удаленных серверов производится только при условии обратной совместимости. Новые приложения, которые должны выполнять хранимые процедуры, вместо удаленных копий SQL-сервера, должны в данном случае использовать администрирование связанных серверов.
Analysis Services, входящие в состав Microsoft Visual Studio 2005 .Net Framework, представляют собой дальнейшее развитие серверных средств Microsoft SQL Server OLAP Extensions. Помимо уже имеющихся средств построения хранилищ данных и OLAP, Analysis Services в Microsoft Visual Studio 2005 .Net включают в себя средства Data Mining, новые средства управления доступом к данным и безопасностью, новые клиентские утилиты для построения и администрирования многомерных хранилищ и анализа данных, а также предоставляют новые возможности для администрирования многомерных хранилищ, создания распределенных хранилищ данных, определения метаданных (например, размерностей).
Современные приложения предоставляют множество способов доступа к интересующей пользователя информации. Для работы с данными разрабатываются специализированные программы. Обычные офисные средства, такие, как Microsoft Office, содержат интегрированные возможности для извлечения данных. В конечном счете, всегда можно попросить администратора извлечь из базы данных ту информацию, которая в данный момент необходима пользователю.
Тем не менее, наиболее распространенным и привычным способом работы с разнообразной информацией остается традиционная отчетная форма. С одной стороны, многие пользователи, особенно старшего поколения, все еще не находят в себе сил отказаться от стандартной бумажной формы представления отчета. С другой стороны, отчет - это, прежде всего, средство консолидации информации, зачастую различной специфики.
Требование предоставить отчетную функциональность часто фигурирует при разработке современных программных продуктов. В конечном счете, все это привело к тому, что рынок оказался буквально наводнен как компонентами для надстройки приложений средствами поддержки отчетов, такими, как инструментарий Databeacon, так и довольно мощными продуктами, поддерживающими цикл управления отчетами, где в числе лидеров следует назвать широко известные продукты Business Objects.
Подобные средства есть и в составе Microsoft Visual Studio .NET (VS.NET). Одно из них, называемое Crystal Reports for Microsoft Visual Studio .NET (CRVS), - это разработка Business Objects и поставляется по схеме лицензирования. Другое средство, Microsoft Reporting Services (MSRS), представляет собой полноценную платформу, базирующуюся на СУБД Microsoft SQL Server.
Основу множества программных систем составляет ядро, предназначенное для хранения данных. Использование в его качестве промышленной СУБД обеспечивает будущей системе надежный фундамент, неотъемлемую часть успешной разработки. Этот подход - построение продукта вокруг СУБД - и лег в основу разработки Microsoft Reporting Services (MSRS).
Любой из серверных продуктов, выпускаемых самой Microsoft, нуждается в отчетной функциональности, которую ранее было принято брать из первых оказавшихся под рукой средств. Мы помним отчеты в формате HTML, выгрузку данных в Excel и Word. В подобных условиях не может быть и речи не только о единой службе - поставщике любых типов отчетов, но и о консолидации содержащихся в них данных.
Осознание этой проблемы привело к тому, что в январе 2004 г. состоялся выпуск платформы для управления отчетами MSRS. В середине 2004 г. платформа получила первый пакет обновлений. В настоящий момент MSRS интегрируется с такими продуктами, как Microsoft CRM 1.2, Exchange Server 2003 и Operations Manager 2005 [4].
Главная задача MSRS - обеспечить комплексный подход к управлению отчетами и поддержку всего жизненного цикла отчетов (рис. 2.1), включающего создание отчетов, управление ими и доставку отчетов.
Рис. 2.1. Архитектура платформы Microsoft Reporting Services.
Как видно из рис. 2.1, в ядре MSRS находятся следующие службы:
Создание отчета, как и в случае CRVS, начинается с подготовки шаблона размещения данных на странице отчета. Для подготовки шаблона используется «Дизайнер отчетов» (Report Designer). Данный инструмент тесно интегрирован с VS.NET и инсталлируется при установке компонентов MSRS. Результатом его работы становится файл шаблона отчета с расширением .rdl, содержащий описание структуры будущего отчета на XML-ориентированном языке Report Definition Language.
Кроме размещения данных, в шаблоне отчета описывается связь с источниками данных, такими, как SQL Server 7.0 и 2000, SQL Server 2000 Analysis Services, Oracle, а также любыми источниками OLE DB и ODBC.
«Дизайнер отчетов» позволяет создать будущий шаблон за три шага:
Особенно удобна функция предварительного просмотра, позволяющая видеть будущий отчет и исправлять допущенные в процессе создания недочеты. Следует также отметить, что шаблон отчета может принимать информацию, на основании которой формируется содержимое отчета. Это свойство позволяет реализовать параметризованные отчеты.
После создания шаблона для формирования итогового отчета следует использовать «Менеджер отчетов» (Report Manager). Согласно представленной ранее схеме службы MSRS, данный компонент взаимодействует с сервером отчетов, выполняющим всю работу по извлечению данных и формированию результатов. «Менеджер отчетов» имеет Web-ориентированный интерфейс, позволяющий выполнять следующие операции:
«Менеджер отчетов» умеет представлять данные своего интерфейса в HTML-формате, а также конвертировать в файлы PDF, XLS, XML, CSV и популярные графические форматы.
Как же быть с традиционными Windows-приложениями? В настоящий момент Microsoft предлагает решение, основанное на внедрении в Windows-приложения управляющего элемента ActiveX для просмотра Web; доступ к данным организован посредством получения HTML от того же «Менеджера отчетов». Пример реализации такого приложения включен в поставку MSRS.
Из достоинств MSRS отметим, что продукт поддерживает процесс получения отчетов пользователями системы. MSRS успешно используется как в специализированных проектах, нацеленных на предоставление отчетной функциональности, так и там, где пользователь, владеющий VS.NET, хочет иметь возможность самостоятельно конструировать отчеты.
У продукта, разумеется, есть и недостатки. Например, тесная интеграция с SQL Server, выступающим в качестве хранилища отчетов, не позволяет применять MSRS там, где данная СУБД отсутствует либо ее использование не планируется. Другой существенный минус - недоступность редактора шаблонов отчетов в отсутствие VS.NET. Это не дает возможности пользователям будущей системы создавать и редактировать шаблоны отчетов. Для решения этой проблемы можно разработать свой редактор, формирующий XML-описание шаблона отчета. Некоторые из производителей, например, Cizer Software, уже воспользовались этим.