Фактографические информационные системы

Автор работы: Пользователь скрыл имя, 29 Октября 2014 в 13:35, реферат

Краткое описание

Фактографические ИС – это системы, в которых объектом сохранения и обработки является фактическая информация – факты либо их совокупность. Фактом в данном случае называют конкретное значение атрибута некоторого объекта реального мира (дата рождения, цвет глаз, уровень ВВП и.т.п.). Фактические сведения хранятся в виде записей в некотором заранее обусловленном формате. Поэтому информация, с которой работает фактографическая ИС, всегда имеет четкую структуру, удобна для обработки и позволяет давать однозначные ответы на поставленные вопросы. Основными компонентами фактографических систем являются Базы Данных и системы управления Базами Данных (СУБД). Фактографическая ИС может хранить большое количество фактов, относящихся к разным атрибутам, поэтому между фактами могут быть установлены разнообразные отношения, что позволяет адресовать к таким системам довольно сложные запросы.

Прикрепленные файлы: 1 файл

5fan_ru_Фактографические информационные системы.doc

— 194.00 Кб (Скачать документ)

 

 

Перспективные направления развития фактографических ИС

 

Выделим три больших направления относительно развития современных фактографических ИС:

    • Web-технологии
      • Технологии World Wide Web как платформа для работы с БД;
      • Технологии БД для работы с World Wide Web;
    • Хранилища данных
    • Базы знаний

 

 

 

 

 

 

Web-технологии

 

Основные понятия:

Интернет – это набор взаимосвязанных компьютерных сетей, распределенных по всему миру.

Сервисы Интернет –  электронная почта, средства проведения конференций, средства удаленного доступа, средства посылки и получения файлов, WWW.

World Wide Web – это гипермедиа система, предоставляющая простые средства типа «укажи и щелкни», используемые для просмотра информации в сети Интернет с помощью механизма гиперссылок.

Intranet [extranet] – это Web-сайт или группа Web-сайтов, принадлежащих одной организации и доступных только ее членам [и санкционированным внешним пользователям].

 

Принципы интеграции технологий БД в среду Web

  1. Технология подключения не должна зависеть от данных и разработчика  ПО СУБД
  2. Возможность взаимодействия с БД не зависимо от типа используемого Web-браузера и Web-сервера.
  3. Возможность взаимодействия с БД с использованием «тонкого» клиента.
  4. Возможность защищенного доступа к ценным корпоративным данным.
  5. Высокий уровень производительности программного и аппаратного обеспечения
  6. Минимальный уровень администрирования.

 

Достоинства применения Web-технологий: преимущество использования функций СУБД,  независимость от платформы, прозрачный сетевой доступ, графический интерфейс пользователя.

Недостатки применения Web-технологий: высокая стоимость, недостаточная надежность, слабая защищенность данных.

 

Новейшие области применения технологий БД для управления информацией в среде WWW:

  • Моделирование и запросы в WWW. Задача формулировки запросов для поиска определенных страниц Web с анализом не только содержания страниц, но и структуры связей между ними. Web-сайты в таком случае рассматриваются в виде ориентированного графа, в котором узлами являются страницы, а ребрами – гиперссылки между ними. Для обработки информации по такой модели данных в настоящее время разрабатываются специальные ЯМД (языки запросов). Указанная технология может быть полезна также при анализе целостности сайта (проблемы моделирования).
  • Выборка и интеграция информации. Некоторые Web-сайты могут рассматриваться как контейнеры структурированных данных (множеств кортежей, множеств объектов и т.д.). Например, сайт Internet Movie Database (http://www.imdb.com/) может рассматриваться как внешний интерфейс базы данных о кинофильмах. В связи с ростом числа таких сайтов становятся актуальными две следующие задачи. Первая задача состоит в том, чтобы фактически осуществлять выборку данных, представленных в структурированном виде (например, множество кортежей) из HTML-страниц, их содержащих. Если мы рассматриваем сайты такого рода как автономные неоднородные базы данных, то возникает вторая задача – формулировка запросов, которые требуют интеграции данных, полученных из разнородных источников.
  • Разработка и реструктуризация Web-сайтов. Еще один аспект применения концепций и технологий баз данных – разработка и реструктуризация Web-сайтов, а также управление ими. Создатель Web-сайта обычно решает следующие задачи:
    1. Выбор тех данных, которые будут представлены на сайте и обеспечение доступа к ним. Источником этих данных могут быть как накопленная внутренняя информация (хранимая в базах данных или в структурированных файлах), либо информация с других существующих Web-сайтов.
    2. Проектирование структуры сайта, то есть, определение данных, содержащихся на каждой странице, и связей между страницами.
    3. Проектирование графического представления страниц.

В существующих инструментальных средствах управления Web-сайтами эти задачи, по большей части, взаимозависимы. При отсутствии каких-либо инструментальных средств создания сайта, разработчик вручную пишет содержимое HTML-файлов или пишет программы для их продуцирования. Одновременно он должен сосредоточить свое внимание на содержании страницы, ее связях с другими страницами, а также на ее графическом представлении. В результате, весьма утомительным становится решение нескольких других важных задач, таких как автоматическое обновление сайта, реструктуризация сайта или спецификация ограничений целостности, налагаемых на структуру сайта. Перспективным направлением представляется использование каких-либо методов моделирования структуры Web-сайта и языков для реструктуризации данных таким образом, чтобы они соответствовали желаемой структуре. Первые две задачи в этом случае решаются отдельно от третьей с использованием методов декларативного описания структуры сайта, а затем, по готовой модели происходит генерация HTML-кода (например, по разработанным шаблонам).

 

Хранилища данных

 

Как уже отмечалось, основной недостаток БД состоит в том, что с их помощью не всегда удается получить достаточное информационное обеспечение для принятия решений (так называемый «информационно-аналитический голод»). В базах данных, как правило, хранится текущая, оперативная информация. Между тем, для выработки решений очень часто требуется иметь доступ не только к последним данным, но и к ранее накопленным (историческим). Для этих целей была разработана концепция ХД, как одного из направлений развития традиционных БД.

Хранилище данных – это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления. В ХД набор данных разделен на два компонента: оперативная БД хранит текущую информацию, квазипостоянная БД содержит исторические данные, например, в оперативной БД могут содержаться данные о продажах за текущий год, а в квазипостоянной БД хранятся систематизированные годовые отчеты и балансы за все время существования предприятия. Подсистема оперативного анализа данных позволяет эффективно и быстро анализировать текущую информацию. Подсистема принятия решений пользуется обобщенной и исторической информацией, применяет методы логического вывода. Для общения с пользователем служит универсальный интерфейс.

Достоинства ХД: потенциально высокая отдача от инвестиций, повышение эффективности труда лиц, ответственных за принятие решений, повышение конкурентоспособности организации.

Проблемы ХД: высокие требования к ресурсам, сложности сопровождения и интеграции, проблемы качества данных, владение данными (опасность подкупа сотрудников).

 

Базы знаний

 

Рассматриваются в теме 10.


Информация о работе Фактографические информационные системы