Автор работы: Пользователь скрыл имя, 30 Апреля 2013 в 23:28, дипломная работа
Целью данной бакалаврской работы является рассмотрение практического поиска и обмена информации в сети Интернет.
Для этого необходимо решить следующие задачи:
- анализ возможностей сети Интернет, технология поиска и обмена информации в нем;
- рассмотреть приемы эффективного поиска и обмена информацией.
Предметом исследования в работе являются сеть Интернет и ее возможностей, служб, методов мониторинга и подходов оценки релевантности найденных документов.
Введение……………………………………………………………
3
1 Возможности Интернет стратегии поиска и обмена информацией……………………………………………………………..
7
1.1 Анализ и классификация методов мониторинга при поиске информации..........................................................................................
7
1.2 Передача информации в Интерне…………………………..
10
1.3 Поисковые системы, понятие поисковые индексов и каталогов………………………………………………………………...
17
2 Методы информационного эффективного поиска и обмена информацией…………………………………………………………….
34
2.1 Поиск и оценка найденной информации…………………...
34
2.2 Проблемы поиска теоретической научной информации в Интернет………………………………………………………………….
38
2.3 Интеллектуальные системы и перспективы поиска информации……………………………………………………………...
43
Заключение………………………………………………………...
53
Глоссарий………………………………………………………….
57
Список использованных источников…………
Содержание
Введение………………………………………………………… |
3 |
1 Возможности Интернет
стратегии поиска и обмена
информацией………………………………………………… |
7 |
1.1 Анализ и классификация
методов мониторинга при |
7 |
1.2 Передача информации в Интерне………………………….. |
10 |
1.3 Поисковые системы,
понятие поисковые индексов и
каталогов……………………………………………………… |
17 |
2 Методы информационного
эффективного поиска и обмена
информацией………………………………………………… |
34 |
2.1 Поиск и оценка найденной информации…………………... |
34 |
2.2 Проблемы поиска
теоретической научной |
38 |
2.3 Интеллектуальные системы
и перспективы поиска |
43 |
Заключение…………………………………………………… |
53 |
Глоссарий……………………………………………………… |
57 |
Список использованных источников…………………………… |
60 |
Приложения…………………………………………………… |
63 |
Введение
Интернет – это крупнейшая мировая компьютерная сеть. Она объединяет тысячи меньших региональных сетей по всему миру.
Ни для кого уже не секрет, что в настоящее время Интернет становится одной из ведущих информационных систем. С каждым днём в сети появляются новые ресурсы, которые включают в себя множество различной информации. Обилие литературы и программных средств позволяют в достаточно короткое время приобрести знания, которые позволяют создавать страницы и наполнять их информацией.
С каждым годом объемы
Интернета увеличиваются в
Интенсивное развитие информационных технологий привело к их широкому использованию в различных отраслях промышленности и образования. Современные тенденции в области развития информационных систем показывают, что все большее значение приобретают результаты интеллектуальной деятельности экспертов или аналитических работников, собранные, формализованные и интегрированные в общую информационную среду, обеспечивающую совместное использование этих знаний всеми специалистами в рамках поставленных перед ними задач. Увеличение объема WEB-ресурсов и роли Интернета в информационном обеспечении потребностей общества выдвигает на первый план задачи интеллектуализации поиска и хранения информации. Используемые подходы в современных информационных поисковых системах уже не могут удовлетворять пользователей в получении оперативной пертинентной информации. Возросшие объемы информации приводят к ее значительному «зашумлению». При этом все большее применение находят системы и модули, основанные на принципах искусственного интеллекта. Такие системы обеспечивают повышении эффективности поиска и релевантности найденных WEB-ресурсов (документов). Перспективным является так же использование мультиагентных метапоисковых систем, которые значительно повышают (увеличивают) охват обрабатываемых ресурсов (Интернет- пространства).
Так для повышения релевантности информационного поиска также достаточно активно используется внедрение концепции Semantic Web.
Однако пока большинство создаваемых сайтов и порталов пока не используют технологии семантического Web’а.
В зависимости от способа представления, вида и характера информации разнятся и методы доступа к ней.
По принципу организации и использования средства поиска можно разделить на каталоги (справочники, директории) и поисковые машины.
Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т.д.), где каждая тема разветвляется на несколько подуровней.
Особенность этих средств поиска информации состоит в том, что создание структуры, базы данных и их постоянное обновление осуществляется «вручную», коллективом редакторов и программистов, и сам процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего от ссылки к ссылке.
Наиболее популярным и используемым
способом поиска в Интернете является
использование поисковых
В Интернете ценится
Одной из основных задач Интернет является так же возможность оперативного обмена информацией.
Сама по себе сеть Интернет не определяет, какая именно информация и с какой целью будет передаваться по сети. Существует ряд сетевых служб, которые используют TCP/IP и Интернет. Компьютеры, предоставляющие такие услуги, называются серверами. Наиболее распространенной и популярной службой является WWW (World Wide Web)
WWW использует Интернет для
Информация, доступная по WWW, чрезвычайно разнообразна, эта служба напоминает огромную неупорядоченную библиотеку, куда каждый принес то, что он хотел показать другим.
Другая популярная служба – электронная почта, которая является аналогом обычной почты, т.е. предназначена для пересылки сообщений от одного почтового адреса к другому.
Служба телеконференций (Usenet) представляет собой нечто вроде всемирной доски объявлений, разделенной на группы по интересам, куда каждый может поместить свое сообщение и получить ответ. Телеконференция – это оффлайновый чат – сеть, по которой распространяются сообщения.
FTP-ресурсы – это архивы (каталоги) файлов (в первую очередь источники программного обеспечения и музыки).
Службы WWW, электронная почта, Usenet и
FTP-ресуры – понятия организационно-
Целью данной бакалаврской работы является рассмотрение практического поиска и обмена информации в сети Интернет.
Для этого необходимо решить следующие задачи:
- анализ возможностей сети Интернет, технология поиска и обмена информации в нем;
- рассмотреть приемы эффективного поиска и обмена информацией.
Предметом исследования в работе являются сеть Интернет и ее возможностей, служб, методов мониторинга и подходов оценки релевантности найденных документов.
1 Возможности Интернет стратегии поиска и обмена информацией
1.1 Анализ и классификация методов мониторинга при поиске информации
Значительно увеличивающиеся с каждым годом объемы Интернета уменьшают вероятность найти необходимую информацию, возрастает объем так называемого «шума». Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально является создание удобных, ориентированных на пользователя средств поиска информации.
Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска.
Первой задачей при решении проблемы повышения эффективности доступа к информационным ресурсам, является задача мониторинга информационных ресурсов призванная обеспечить поиск, сбор и агрегирование информации из нескольких заранее определенных источников, накопление и обработку знаний специалистами при решении ими различного рода аналитических задач. В настоящее время мониторинг и некоторые аспекты системного анализа информации в сети Интернет выполняются с использованием систем информационного поиска.
Мониторинг информации определенной направленности, является частью любого средства информационного поиска Интернета. Ограничения на выборку искомых документов, при мониторинге проблемно-ориентированной информации могут быть разнообразны: по тематике документов, по территориальному признаку, по языковому признаку и т.д.
Среди существующих подходов к мониторингу
проблемно-ориентированной
Другим важным этапом, при формировании знаний является системный анализ отобранной из сети Интернет информации.
Системный анализ – совокупность методов и средств исследования сложных, многоуровневых и многокомпонентных систем, объектов, процессов, опирающихся на комплексный подход, учет взаимосвязей и взаимодействий между элементами системы. Системный анализ информационных ресурсов включает процессы индексирования, классификации и кластеризации.
Индексирование – процесс выражения главного предмета или темы текста какого-либо документа в терминах информационно-поискового языка (знаковая система, предназначенная для описания основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска).
Существуют различные типы систем индексирования [8].
К первому типу относят системы свободного индексирования. При этом способе из индексируемого документа выписываются в поисковый образ документа слова или словосочетания, которые, отражают содержание индексируемого документа. Кроме этого, элементами поискового образа могут быть слова, отсутствующие в этих элементах, но отражающие более точно смысл его текста с точки зрения средства поиска. Выписанные элементы упорядочиваются в алфавитном порядке. Такой упорядоченный набор слов (словосочетаний) представляет собой поисковый образ при этом типе индексирования.
При втором типе, который условно называют методом полусвободного индексирования, из документа выписывают слова и словосочетания вначале так же, как и при свободном индексировании. Однако выписанные элементы сравнивают затем с фиксированным словарем, не найденные в нем – устраняют, а оставшиеся, упорядоченные в алфавитном порядке, представляют собой поисковый образ.
Третий тип индексирования
основан на статистическом подходе.
Выбор слов (выражений) исходного
текста, подлежащих включению в поисковый
образ, производится на основе статистического
анализа текста, при котором его
слова рассматриваются как
К четвертому типу относят системы индексирования, контролируемые заданным словарем (тезаурусом). Каждое слово текста сравнивается с точностью до основы со словарем, совпавшие слова записываются в поисковый образ.
Информация о работе Методы информационного эффективного поиска и обмена информацией