Автор работы: Пользователь скрыл имя, 29 Августа 2013 в 12:44, курсовая работа
Лингвистическое обеспечение включает в себя лингвистические средства и средства манипулирования с данными и информационными массивами. Лингвистические средства — это совокупность информационно-поисковых языков (ИПЯ), используемых в информационно-поисковой системе (ИПС), правил перевода информации с естественного языка на ИПЯ и критерия выдачи информации, обеспечивающих представление смыслового содержания документов информационных массивов в виде, удобном для машинной обработки и обеспечивающем автоматизированный поиск информации. Информационно-поисковые языки являются основным элементом ЛО, поскольку от них зависит эффективность поиска. Они предназначены для выражения основного содержания документов и информационных запросов с целью последующего хранения и поиска информации в ИПС. Информационно-поисковые языки по сути считаются главной характеристикой ИПС, поскольку от их качества (терминологической наполненности, терминологической однозначности лексических единиц, наличия логической связи между элементами, справочного аппарата, удобства пользования и т. д.) зависит эффективность поиска, его полнота и точность.
Введение ……..………………………………………………………….
Глава 1. Лингвистическое обеспечение АБИС.
Теоретический аспект. ………………………………………….………
Понятие, состав и задачи лингвистического обеспечения………………
Современные тенденции в развитии
лингвистического обеспечения АБИС. …………………………………
Глава 2. Средства лингвистического обеспечения АБИС ……………….……
ИПЯ ….……………………………………………………………………..
Дескрипторный язык.
Тезаурус - назначение, структура и использование …………….….…
Классификационные языки ……………………………………………...
Язык алфавитно-предметной классификации …………………...………
Средства лексического обеспечения
ГУ «Витебская областная библиотека им. В.И. Ленина» ……………………..
Заключение ……………………..………………………………………….
Список сокращений …………………………………………………………..
Библиография …………………………………………………………..
Основные функции лингвистического обеспечения АБИС связаны с обеспечением индексирования документов и запросов, а также эффективного поиска в электронном каталоге. Лингвистическое обеспечение корпоративной АБИС в отличие от локальной АБИС носит более универсальный или комплексный характер (например, может включать несколько классификационных языков или единую систему предметных рубрик) и требует соблюдения дополнительных условий реализации лингвистической совместимости.
Лингвистическое обеспечение АБИС понимается как применяемая в ее технологиях совокупность информационных языков, словарных баз данных, лингвистических процессоров и средств ведения и использования словарей. Оно предназначено обеспечить индексирование документов и запросов, эффективный поиск в документальных базах данных по тематическим запросам, лингвистическую совместимость электронного каталога библиотеки с электронными каталогами других библиотек и информационных центров.
Планируя развитие лингвистического обеспечения, необходимо исходить из потребностей пользователей, которые могут быть многообразны. Лингвистическое обеспечение в АБИС должно реализовывать тематический поиск отраслевого и предметного типа. Поиск поддерживается различными классификационными системами, словарями, тезаурусами, соответствующими языками индексирования и информационно-поисковыми языками.
В АБИС предпочтительно
параллельное использование нескольких
классификационных систем, что расширяет
возможности поиска, совместимости
и обмена. Так, Универсальная десятичная
классификация (УДК) по сравнению с
Десятичной классификацией Дьюи (ДКД)
является более гибкой системой, обладающей
богатым набором средств
Библиотечная
практика показывает, что пользователь
чаще заинтересован в использовании
информационных языков вербального
типа, чем информационных языков классификационного
типа. Классификационные языки
В качестве
языков индексирования вербального
типа могут выступать языки
ГПНТБ
России продолжает
Современный
уровень автоматизации требует
наличия в АБИС словарных баз
данных, а также средств их автоматизированного
ведения и использования при
поиске. Оптимальным вариантом
лингвистического обеспечения АБИС
Словарные
средства АБИС обычно требуют многолетнего
рутинного ведения, поэтому прогресс
в развитии лингвистического обеспечения
не столь очевиден, как например
в развитии аппаратного или программного
обеспечения. При этом очень часто
именно изменение или усложнение
последних компонент вызывает продвижение
вперед первой. Можно выделить следующие
современные тенденции в
Комплексное
использование элементов
Следует
избегать смешения понятий ключевых
терминов/слов и применения при индексировании
одновременно и тех, и других элементов.
Это приводит к усложнению правил
нормирования лексики и правил индексирования,
что затрудняет работу индексаторов.
Использование
Применение в технологии индексирования одного или нескольких классификационных языков, обеспечивающих поиск по широкотематическим запросам, и хотя бы одного вербального языка, обеспечивающего поиск по узкотематическим запросам. В числе классификационных языков один должен быть универсальным, а другие могут носить отраслевой или локальный характер (например классификация стандартов, патентов, архивная классификация).
Среди вербальных
языков наблюдается тенденция к
предпочтительному
Преимущества
тезауруса по сравнению со списком
ключевых слов/терминов очевидны. В
списках ключевых слов/терминов не
отражены смысловые связи между
терминами, при этом алфавитный порядок
расположения терминов усугубляет эту
разобщенность: родственные понятия
удалены друг от друга. Использование
тезауруса в информационно-
Ведение и поддержка в актуальном состоянии баз данных классификационных систем, тезаурусов, предметных рубрик, применяемых при индексировании и поиске. Ведение авторитетных файлов и их использование при каталогизации и поиске документов.
Организация
поиска в классификационных базах
данных по ключевым словам с последующим
выходом на поиск по классификационному
индексу в электронном
Увеличение
количества и усложнение лингвистических
процессоров в составе
Лингвистическое
обеспечение электронной
Интеллектуальная
обработка требует значительных
временных затрат, что несовместимо
с необходимостью оперативного анализа
текстовых документов. Поэтому в
рассматриваемой сфере
Глава 2. Средства лингвистического обеспечения АБИС
Любая ИПК включает следующие элементы: информационный массив; ИПЯ, на которой переводится входная информация и запросы; правила этого перевода (индексирование); критерии выдачи, то есть правила сравнения перевода запроса на ИПЯ с результатами перевода на ИПЯ входной информации, определяющие отбор информации, подлежащей выдаче на запрос.
Понятие ЛО шире понятия информационно-поискового языка, поскольку включает их в себя. Лингвистическое обеспечение автоматизированных систем включает ИПЯ, методики индексирования документов и запросов на них, инструкции и методики их ведения и использования,а также средства поддержания ИПЯ в автоматизированной системе.
Средством свертывания информации и смысловой обработки документов является информационно-поисковый язык (ИПЯ) - формализованный искусственный язык предназначенный для индексирования документов, информационных запросов и описания фактов с целью но следующего их хранения и поиска.
Искусственный язык, специально разработанный для автоматизированного поиска, лишен недостатков естественного языка (многозначность, избыточность) и лучше приспособлен для информационного поиска, увеличивая полноту и точность выдачи информации. При создании ИПЯ учитываются требования, которые отвечают его задаче — полноте и точности поиска: однозначность — каждая запись на ИПЯ должна иметь только один смысл, то есть искусственный ИПЯ должен устранять такие недостатки, с точки зрения поиска естественного языка, как полисемия и омонимия; явное выражение полезных для поиска семантических (смысловых) отношений между словами (логических отношений и психологических ассоциаций) ИПЯ; возможность корректировки и дополнения ИПЯ; удобство пользования, ИПЯ должен обладать компактностью записей, способствующих его запоминанию; способность точно идентифицировать предмет, отличить его особенности и описать его с необходимой степенью детализации и глубины. [Журнал библ-ка 2006 ИПЯ]
ИПЯ и дополняющие их методики систематизации документов, инструкций по ведению каталогов и т.п. составляют лингвистическое обеспечение традиционных ИПС. В автоматизированных ИПС используются специально разработанные ИПЯ (рубрикаторы, словари ключевых слов, тезаурусы и т.д.). Информационными массивами являются электронные каталоги и базы данных на машиночитаемых носителях; организация и использование информационных массивов определяются соответствующими стандартами и обеспечиваются программными и техническими средствами. Эффективность информационного поиска в автоматизированных ИПС в значительной степени зависит от ее лингвистического обеспечения: ИПЯ и средств их ведения и поддержки.
Задачи ИПЯ: