Информационные процессы хранения информации – базы данных, банки данных, хранилища данных, витрины данных

Автор работы: Пользователь скрыл имя, 20 Января 2014 в 11:42, реферат

Краткое описание

Наряду с большими корпоративными хранилищами данных широкое применение находят также витрины данных (Data Mart). Под витриной данных понимается небольшое специализированное хранилище для некоторой узкой предметной области, ориентированное на хранение данных, связанных одной бизнес-тематикой. Проект по созданию витрины данных требует меньших вложений и выполняется в очень короткие сроки. Таких витрин данных может быть несколько, скажем витрина данных по доходам для бухгалтерии компании и витрина данных по клиентам для маркетингового отдела компании.

Содержание

1.Хранилища данных (банки, витрины)..…………………………………...3
2.Принципы построения……………………………………………………..4
3.Технологии управления информацией…………………………………...6
4.Понятие баз данных………………………………………………………..7
5.Анализ предметной области……………………………………………..9
6.Определение логической структуры базы данных……………………..9
7.Создание базы данных……………………………………………………9
8.Программная реализация базы данных…………………………………..15
9.Заключение…………………………………………………………………16
10.Список использованной литературы……………………………………18

Прикрепленные файлы: 1 файл

Реферат по ИТ.doc

— 175.50 Кб (Скачать документ)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКИЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ  БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО

ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ  НЕФТЕГАЗОВЫЙ УНИВЕРСИТЕТ

ИНСТИТУТ ГЕОЛОГИИ И НЕФТЕГАЗОДОБЫЧИ

 

Кафедра «Автоматизации и вычислительной техники»

 

 

 

 

 

 

 

 

 

 

 

Реферат на тему «Информационные процессы хранения информации – базы данных, банки данных, хранилища данных, витрины данных»

По дисциплине «Информационные технологии»

 

 

 

 

 

 

 

 

 

 

 

Студент гр.: АТПз-08-1

Кравцов А.С.

Руководитель:

Уваров В.В.

 

Тюмень 2013

СОДЕРЖАНИЕ

1.Хранилища данных (банки, витрины)..…………………………………...3

2.Принципы построения……………………………………………………..4

3.Технологии  управления информацией…………………………………...6

4.Понятие баз данных………………………………………………………..7

5.Анализ предметной области……………………………………………..9

6.Определение  логической структуры базы данных……………………..9

7.Создание базы данных……………………………………………………9

8.Программная  реализация базы данных…………………………………..15

9.Заключение…………………………………………………………………16

10.Список использованной литературы……………………………………18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.ХРАНИЛИЩА ДАННЫХ (БАНКИ, ВИТРИНЫ)

Хранилища данных – это процесс сбора, отсеивания и предварительной обработки данных с целью представления результирующей информации пользователям для статистического анализа и аналитических отчетов. Ральф Кинболл (автор концепции хранилищ данных) описывал хранилища данных как «место, где люди могут получить доступ к своим данным». Он же сформулировал основные требования к хранилищам данных:

-поддержка высокой скорости данных из хранилища;

-поддержка внутренней  непротиворечивости данных;

-возможность получения  и сравнения данных;

-наличие удобных утилит  просмотра данных хранилища;

-полнота и достоверность  хранимых данных;

-поддержка качественного  процесса пополнения данных.

Всем перечисленным  требованиям удовлетворять зачастую не удается, поэтому для реализации хранилищ данных используют несколько продуктов. Одни из которых представляют средствахранения данных, другие – средства их извлечения и просмотра, в-третьих – средства пополнения хранилищ данных. Типичное хранилище данных как правило отличается от реляционной базыданных:

1)Обычная база данных предназначена для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений;

2)Обычная база данных подвержена постоянным изменениям в процессе работы пользователей, а хранилища данных относительно стабильно;

-данные в  нем обновляются согласно расписанию (например, ежечасно, ежедневно, ежемесячно),

-в идеале, процесс пополнения данными за определенный период времени без изменения прежней информации находящейся уже в хранилище.

3)Обычная база данных чаще всего является источником данных попадающих в хранилище, кроме того хранилище может пополняться за счет внешних источников (например, сжатия данных).

 

Хранилище данных представляет собой банк данных определенной структуры, содержащий информацию о  производственном процессе компании в  историческом контексте. Главное назначение хранилища - обеспечивать быстрое выполнение произвольных аналитических запросов.

Наряду с  большими корпоративными хранилищами  данных широкое применение находят  также витрины данных (Data Mart). Под  витриной данных понимается небольшое  специализированное хранилище для  некоторой узкой предметной области, ориентированное на хранение данных, связанных одной бизнес-тематикой. Проект по созданию витрины данных требует меньших вложений и выполняется в очень короткие сроки. Таких витрин данных может быть несколько, скажем витрина данных по доходам для бухгалтерии компании и витрина данных по клиентам для маркетингового отдела компании.

2.ПРИНЦИПЫ  ПОСТРОЕНИЯ

2.1.Основополагающие  концепции

Информация, которая  загружается в хранилище, должна интегрироваться в целостную  структуру, отвечающую целям анализа данных. При этом минимизируются несоответствия между данными из различных оперативных систем, в хранилище именуются и выражаются единым образом. Данные интегрированы на множестве уровней: на уровне ключа, атрибута, на описательном, структурном уровне и так далее. Общие данные и общая обработка данных консолидированы и являются единообразным для всех данных, которые подобны или схожи в хранилище данных. При этом информация структурируется по разным уровням детализации:

-высокая степень  суммаризации;

-низкая степень суммаризации;

-текущая детальная  информация.

Хранилища можно рассматривать как набор моментальных снимков состояния данных: можно восстановить картинку на любой момент времени. Атрибут времени всегда явно присутствует в структурах данных хранилища.

Попав однажды в хранилище, данные уже никогда не изменяются, а только пополняются новыми данными из оперативных систем, где данные постоянно меняются. Новые данные по мере поступления обобщаются с уже накопленной информацией в хранилище данных.

 

 

 

2.2.Основные компоненты хранилища данных

Использование технологии хранилищ данных предполагает наличие в системе следующих компонентов:

-оперативных  источников данных;

-средств переноса  и трансформации данных;

-метаданных  – включают каталог хранилища и правила преобразования данных при загрузке их из оперативных баз данных;

-реляционного хранилища;

-OLAP-хранилища;

-средств доступа  и анализа данных.

Назначение  перечисленных компонентов таково. Оперативные данные собираются из различных  источников. Поступившие оперативные данные очищаются, интегрируются и складываются в реляционные хранилище. Они уже доступны для анализа при помощи средств построения отчетов. Затем данные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа, который реализуется применением средств доступа и анализа данных. При этом они могут быть загружены в специальную базу данныхOLAP или оставаться в реляционном хранилище.

Важнейшим элементом хранилища являются метаданные, т.е. данные о структуре, размещении, трансформации данных, которые используются любыми процессами хранилища. Метаданные могут быть востребованы для различных целей, например: извлечения и загрузки данных; обслуживании хранилища и запросов. Метаданные для различных процессов могут иметь различную структуру, т.е. для одного и того же элемента данных может существовать несколько вариантов метаданных.

2.3.Вывод

Итак, хранилища данных являются структурированными. Они содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений. Элементарные данные, присутствующие в хранилище, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.

Эти характеристики являются общими для всех хранилищ данных. Но, несмотря на то что хранилища обладают общими свойствами, разные типы хранилищ имеют свои индивидуальные особенности.

3.ТЕХНОЛОГИИ  УПРАВЛЕНИЯ ИНФОРМАЦИЕЙ

3.1.СУБД  для хранилища данных

Для работы с хранилищем данных используются СУБД, к которым предъявляются специальные требования. Поскольку в ходе обсуждения проблем хранилищ данных эти требования либо уже обсуждались, либо присутствие их в перечне и без обсуждения интуитивно понятно, просто перечислим их:

-высокая производительность  загрузки данных;

-возможность  обработки данных на уровне загрузки;

-наличие средств  управления качеством данных;

-высокая производительность  запросов;

-широкая масштабируемость  по размеру и количеству пользователей;

-возможность  организации сети хранилищ данных;

-наличие средств  администрации хранилищ данных;

-поддержка интегрированного  многомерного анализа;

-расширенный  набор функциональных средств  запросов.

3.2.OLNP-технология

OLNP – это  технология комплексного многомерного анализа данных, это ключевой компонент организации хранилищ данных. В 1993г. эта технология была описана Эдгером Коддом.

3.3.OLAP-технология

Для упрощения  анализа была предложена и разработаны  концепция хранилища данных. Предполагается что такое хранилище содержит сведения, поступающие от разных источников, а так же интегрированные данные, получаемые в результате анализа первичных данных. Естественно, для поддержки предложенной концепции потребовались специальные средства управления процессом хранения и обработки информации, к которым относятся инструментальные средства OLAP-технологии.

OLAP – это  способ представления данных в простом и понятном для конечного пользователя виде. Назначение систем класса OLAP – предоставить пользователям гибкий, интуитивно понятный и простой доступ к данным. Наличие такого доступа позволяет отказаться от использования предопределенных отчетов, делает пользователей самодостаточными, независящими от администраторов баз данных и программистов. В основе концепции OLAP лежит принцип многомерного представления данных. Данные представляются в виде многомерного куб, причем пользователь может быстро свернуть или развернуть данные по любому измерению. Хранилища данных не измеряются, а дополняют традиционные реляционные базы данных с первичной информацией.

Для построения систем OLAP используются специализированные многомерные базы данных, либо надстройки над обычными реляционными базами данных. До последнего времени OLAP-технология ассоциировалась с большими проектами по хранению массивов данных и сложными приложениями для их анализа. Сложный и дорогой OLAP-инструментарий был доступен только очень крупным компаниям.

И все же в  последнее время ситуация на рынке  резко изменилась. Произошло это  благодаря тому, что было найдено  компромиссное решение: укомплектовать полноценным OLAP-сервером хорошо зарекомендовавшие себя недорогие программные продукты. К таким продуктам относятся, например, MS SQL-сервер баз данных, начиная с версии 7 и позднее, который во всем мире активно используется для построения хранилищ данных. Компания Microsoft предпринимает ряд серьезных мер, чтобы обеспечить наилучшую поддержку хранилищ данных и построения информационных систем. Вследствие указанного изменения ситуации современные OLAP-системы анализа данных стали действительно доступны малому и среднему бизнесу.

4.ПОНЯТИЕ  БАЗ ДАННЫХ

Теория баз данных — сравнительно молодая область знаний Возраст ее составляет немногим более 30 лет. Однако изменился ритм времени, оно уже не бежит, а летит, и мы вынуждены подчиняться ему во всем. И действительно, современный мир информационных технологий трудно представить себе без использования баз данных. Практически все системы в той или иной степени связаны с функциями долговременного хранения и обработки информации. Фактически информация становится фактором, определяющим эффективность любой сферы деятельности. Увеличились информационные потоки и повысились требования к скорости обработки данных, и теперь уже большинство операций не может быть выполнено вручную, они требуют применения наиболее перспективных компьютерных технологий. Любые административные решения требуют четкой и точной оценки текущей ситуации и возможных перспектив ее изменения. И если раньше в оценке ситуации участвовало несколько десятков факторов, которые могли быть вычислены вручную, то теперь таких факторов сотни и сотни тысяч, и ситуация меняется не в течение года, а через несколько минут, а обоснованность принимаемых решений требуется большая, потому что и реакция на неправильные решения более серьезная, более быстрая и более мощная, чем раньше. И, конечно, обойтись без информационной модели производства, хранимой в базе данных, в этом случае невозможно.

Эффективное развитие государства немыслимо без систем управления. Современные системы  управления базируются на комплексных  системах обработки информации, на современных информационных технологиях.

Современные системы  компьютерного управления обеспечивают:

1)Выполнение  точного и полного анализа данных.

2)Получение информации во времени без задержек.

3)Определение  тенденций изменения важных показателей.

Приложение Microsoft Access является мощной и высокопроизводительной 32-разрядной системой управления реляционной  базой данных (СУБД).

База данных – это совокупность структурированных и взаимосвязанных данных и методов, обеспечивающих добавление выборку и отображение данных.

Реляционная база данных. Практически все СУБД позволяют добавлять новые данные в таблицы. С этой точки зрения СУБД не отличаются от программ электронных таблиц (Excel) ,которые могут эмулировать некоторые функции баз данных. Существует три принципиальных отличия между СУБД и программами электронных таблиц:

- СУБД разрабатываются  с целью обеспечения эффективной  обработки больших объёмов информации, намного больших, чем те, с которыми справляются электронные таблицы.

- СУБД может легко связывать две таблицы так, что для пользователя они будут представляться одной таблицей. Реализовать такую возможность в электронных таблицах практически невозможно.

Информация о работе Информационные процессы хранения информации – базы данных, банки данных, хранилища данных, витрины данных