Автор работы: Пользователь скрыл имя, 13 Декабря 2013 в 23:09, контрольная работа
По данным Delphi Consulting Group, в настоящее время только в США ежедневно создается более 1 млрд страниц документов, а в архивах хранится уже более 1,3 трлн различных документов. В то же время, по данным журнала ASAP, в мире ежегодно появляется около 6 млрд новых документов, а среднестатистический служащий тратит каждый год до 150 часов на поиск утерянной информации. Значительную часть своего рабочего времени специалисты предприятий тратят как на поиск необходимой им информации, так и на создание и отправку документов. Существуют оценки, что секретарь-референт тратит до 75% своего времени на работу с документами, у руководителей на работу с документами уходит до 45% рабочего времени, а у рядовых сотрудников предприятия — до 30% времени.
Особенности хранения документов
EDMS-системы работают, преимущественно,
на распределенных
Любому документу в EDMS-системе присущ определенный набор атрибутов (например, его название, автор документа, время его создания и др.). Набор атрибутов может меняться от одного типа документа к другому (в пределах одного типа документов он сохраняется неизменным). В EDMS-системах атрибуты документа хранятся в реляционной базе данных. Для каждого типа документов с помощью визуальных средств создается шаблон карточки, где в понятном графическом виде представлены наименования атрибутов документа. При введении документа в EDMS-систему берется необходимый шаблон и заполняется карточка (заносятся значения атрибутов). После заполнения карточка оказывается связанной с самим документом.
В большинстве случаев серверная часть EDMS-системы состоит из следующих логических компонентов (которые могут располагаться как на одном, так и на нескольких серверах):
Под хранилищем документов обычно понимается хранилище содержимого документов. Хранилище атрибутов и хранилище документов часто объединяют под общим названием «архив документов». Для хранения атрибутов в большинстве EDMS-систем используются СУБД Oracle, Sybase, MS SQL Server и Informix, обеспечивающие поиск документов по атрибутам.
Для хранения непосредственно содержимого документов в большинстве EDMS-систем применяются файл-серверы MS Windows NT, Novell NetWare, UNIX и др. В этом случае могут быть реализованы и гетерогенные комбинации сетевых сред. Например, база данных с атрибутами документов может работать под управлением ОС UNIX в сети TCP/IP, а сами документы могут храниться под ОС Novell NetWare в сети IPX/SPX. Следует отметить, что большим преимуществом EDMS-систем является хранение документов в исходном формате (и автоматическое распознавание EDMS-системами множества форматов файлов).
В последнее время все большую популярность приобретает хранение документов вместе с атрибутами в базе данных. Такой подход имеет свои преимущества и недостатки. Преимуществом является значительное повышение безопасности доступа к документам, а основным недостатком — низкая эффективность работы с документами при большом объеме хранимой информации. При данном подходе также требуется использование мощных серверов с большими объемами оперативной памяти и жестких дисков. Кроме того, в случае сбоя базы данных восстановить хранившиеся в ней документы будет очень непросто. Необходимо также строго привязываться к конкретной СУБД.
Сервис полнотекстовой
индексации обычно является опциональным.
Полнотекстовая индексация предназначена
для индексации содержимого документов,
чтобы, при необходимости, пользователь
мог найти документы с
Модули EDMS-систем, отвечающие
за документооборот, принято называть
модулями маршрутизации документов.
В общем случае используется свободная
и жесткая маршрутизация
В EDMS-системах реализованы надежные средства разграничения полномочий и контроля за доступом к документам. В большинстве случаев с их помощью определяются следующие виды доступа (набор задаваемых полномочий зависит от конкретной EDMS-системы):
При одновременной работе
с документом сразу нескольких пользователей
(особенно, когда его необходимо
согласовывать в различных
В состав большинства EDMS-систем входят утилиты для просмотра документов (так называемые viewers), понимающие многие десятки форматов файлов. С их помощью очень удобно работать, в частности, с графическими файлами (например, с файлами чертежей в САПР). Помимо базового комплекта утилит просмотра (входящего в каждую EDMS-систему), у третьих фирм можно приобрести дополнительные утилиты, хорошо интегрируемые с EDMS-системами.
При организации групповой работы над документами обычно весьма полезна возможность их аннотирования. Так как в некоторых случаях пользователи лишены прав на внесение каких-либо изменений в документ в процессе его согласования, то они могут воспользоваться возможностью его аннотирования. В большинстве EDMS-систем аннотирование реализуется за счет включения в карточку документа атрибута для аннотации и передачи пользователям прав на редактирование такого поля карточки. Но такое решение не всегда приемлемо (особенно при аннотировании графического документа). В связи с этим в некоторых EDMS-системах реализована так называемая функция «красного карандаша», с помощью которой можно графически указать недостатки на самом изображении. Программные средства, в которых реализована функция «красного карандаша», широко предлагаются третьими фирмами.
Клиентами большинства EDMS-систем могут быть ПК с ОС MS Windows 95, Windows NT. В некоторых EDMS-системах допускается также использование платформ UNIX и Macintosh. Кроме того, все современные EDMS-системы позволяют работать с документами через стандартные Web-браузеры. Так как Web-браузеры могут быть размещены на разнообразных клиентских платформах, то это облегчает решение проблемы обеспечения работы EDMS-систем в гетерогенных сетевых средах. При использовании Интернет-технологий у EDMS-систем появляется еще один серверный компонент, отвечающий за доступ к документам через Web-браузер.
Одним из особых сегментов современного рынка систем управления документооборотом (СУД) являются так называемые системы управления выводом документов (output management systems — OMS), основным предназначением которых является генерация выходных документов. Ряд OMS-систем отвечает только за распределение и доставку выходных документов (в электронном виде — в форматах HTML, XML и PDF). Очень часто OMS-системы интегрированы с программными пакетами сканирования документов и изображений. Полезной возможностью некоторых OMS-систем является и взаимодействие с унаследованными системами.
В некоторых OMS-системах
дополнительно реализована
Информационно – поисковые технологии для электронного делопроизводства.
В системах должны быть предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование.
Индексирование документов означает:
· реквизитную индексацию;
· ручное управление структурами хранения документов;
· настройку состава полей, типа и длины контрольных карточек документа в архиве;
· автоматическую полнотекстовую индексацию документов;
· автоматическое распознавание формата файла электронного документа;
· индексацию текста документа сразу при его вводе;
· морфологический анализ индексируемых текстов для приведения помещаемых в индекс слов к канонической форме (нормализация текста в индексе);
· наличие стоп – словарей при полнотекстовой индексации и обеспечение их настройки;
· выделение из текста сложных (составных) терминов и понятий;
· поддержку и настройку словарей и тезауруса;
· технологию реквизитной разметки документов;
· настройку набора реквизитов;
· возможность различных режимов реквизитной разметки документов (ручной, автоматический, полуавтоматический);
· интеграцию с произвольными программами создания, просмотра и изменения электронных документов.
Хранение документов включает в себя возможность:
· работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;
· управление внешними носителями;
· хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;
· хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.
Поиск предусматривает:
· наличие стандартного языка запросов к БД;
· реквизитный поиск документов;
· полнотекстовый поиск, точность поиска;
· поиск по именам документов и аннотациям;
· формирование сложных запросов с использованием логических операций;
· контекстный поиск и меру близости слов при поиске;
· адекватность результата поиска запросу;
· морфологический анализ при построении запроса;
· возможность работы с системой удаленных пользователей.
Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.
Запрос строится путем заполнения шаблона ключевыми словами, содержание которых пользователь может задавать произвольно. Поиск документов по запросу осуществляется на двух уровнях: сначала происходит поиск в справочнике данных, а по ссылкам ищется (при задании пользователем соответствующих атрибутов) сам документ. Как правило, хранение документов осуществляется автономно из – за больших объемов архива и необходимости использования оптических накопителей информации. Такая архитектура, кроме всего, позволяет минимизировать время, затрачиваемое на физический доступ к документам в режиме множественных запросов, а также обеспечивает доступ данных из неоднородных (гетерогенных) сетей.
Информация о работе Автоматизация документооборота в Ростелеком