Информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 27 Июля 2013 в 05:24, реферат

Краткое описание

Цель работы – описать и дать характеристику информационно-поисковым системам.
Данная цель решается с помощью раскрытия следующих основных задач:
1) описать принципы работы поисковых машин;
2) дать характеристику глобальным поисковым системам;
3) описать стратегию и методику профессионального поиска информации.

Содержание

Введение
1. Сущность поисковых машин
2. Глобальные поисковые системы
2.1. Поисковая система Google
2.2. Поисковая система AlltheWeb
2.3. Поисковая система Alta Vista
3. Информационно-поисковая система по законодательству - Garant
4. Стратегия и методика профессионального информационного поиска
Заключение
Список использованной литературы

Прикрепленные файлы: 1 файл

Реферат Информационно-поисковые системы ФРАГМЕНТЫ.docx

— 49.52 Кб (Скачать документ)

Содержание

 

Введение 

1. Сущность поисковых машин 

2. Глобальные поисковые системы

2.1. Поисковая система Google

2.2. Поисковая система AlltheWeb

2.3. Поисковая система Alta Vista

3. Информационно-поисковая система  по законодательству - Garant

4. Стратегия и методика профессионального информационного поиска

Заключение 

Список использованной литературы

 

Введение

 

Данная работа посвящена описанию поисковых систем, которые осуществляют поиск информации.

В информационно-поисковой системе  должен храниться весь необходимый  информационный массив, из которого по требованиям пользователей выдается нужная информация. Поиск информации по требованию пользователя осуществляется либо автоматически, либо вручную (как  в библиотеках, когда с запросом к работнику справочного фонда  обращается читатель, а работник пользуется системой каталогов).

Во втором случае используются ЭВМ, снабженные специальными программными средствами, анализирующими процессы запросов, поиска и выдачи нужных документов. Таким образом, информационно-поисковые  системы (ИПС) реализуют вопросно-ответное отношение, что сближает задачи, стоящие перед создателями таких систем, с теми задачами, которые решают создатели человеко-машинных систем.

Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю. Однако если для рядового члена сетевого сообщества знание методов  эффективного информационного поиска является желательным, но далеко не обязательным качеством, то для работников высокоинтеллектуальной сферы умение быстро ориентироваться  в ресурсах Интернет и находить требуемые  источники сегодня относится  уже к числу базовых квалификационных навыков.

Цель работы – описать и дать характеристику информационно-поисковым  системам.

Данная цель решается с помощью  раскрытия следующих основных задач:

1) описать принципы работы поисковых  машин;

2) дать характеристику глобальным  поисковым системам;

3) описать стратегию и методику  профессионального поиска информации.

 

1. Сущность поисковых машин

 

Задача поисковых машин - обеспечивать детальное разыскание информации в  электронной вселенной, что может  быть достигнуто только за счет учета (индексирования) всего содержания максимально возможного числа web-страниц. В отличие от справочников, все  они функционируют в автоматизированном режиме и имеют одинаковый принцип  действия. Поисковые системы состоят  из двух базовых компонентов. Первый компонент представляет собой программу-робот, задача которого путешествовать с сервера на сервер, находить там новые или изменившиеся документы и скачивать их на главный компьютер системы. При этом робот, просматривая содержимое документа, находит новые ссылки, как на другие документы данного сервера, так и на внешние сайты. Программа самостоятельно направляется по указанным ссылкам, находит новые документы и ссылки в них, после чего процесс повторяется вновь, напоминая хорошо известный в библиографии “метод снежного кома”.

Выявленные документы обрабатываются (индексируются) вторым компонентом  поисковой системы. При этом, как  правило, учитывается все содержание страницы, включая текст, иллюстрации, аудио и видео файлы и пр. Индексации подвергаются все слова  в документе, что как раз и  дает возможность использовать поисковые  системы для детального поиска по самой узкой тематике. Образуемые гигантские индексные файлы, хранящие информацию о том какое слово, сколько раз, в каком документе и на каком сервере употребляется и составляют базу данных, к которой происходит обращение пользователей, вводящих в строку запроса сочетания ключевых слов.

Выдача результатов осуществляется с помощью специального модуля, который  производит интеллектуальное ранжирование результатов. При этом берется в  расчет местоположение термина в  документе (название, заголовок, основной текст), частота его повторения, процентное соотношение искомого термина к  остальному тексту страницы, а также  число и авторитетность внешних  ссылок на данную страницу с других сайтов. ........................

 

Заключение

 

Причина сложностей, возникающих при информационном поиске в Интернет определяется двумя главными факторами. Во-первых, число источников в Сети чрезвычайно велико. В конце 2001 года самые приблизительные подсчеты указывали ориентировочную цифру в 7,5 миллиардов документов, расположенных на серверах по всему миру. Во-вторых, массив информации в Сети не только колоссален по объему, но еще и крайне динамичен. За те полминуты, что вы потратили на чтение первых строк этого раздела в виртуальной вселенной появилось порядка сотни новых или измененных документов, десятки были перемещены на новые адреса, а единицы навсегда прекратили свое существование.

В отличии от стабильного и контролируемого фонда документов в библиотеке, в Сети мы имеем дело с гигантским и непрерывно меняющимся информационным массивом, поиск данных в котором является весьма и весьма сложным процессом.

Навыками информационных разысканий в той или иной степени обладают большинство пользователей глобальных компьютерных сетей. И дилетанты и профессионалы зачастую пользуются одними и теми же инструментами. Однако результаты разысканий и затраченное на них время различаются в очень значительной степени.

Поисковые системы (search engines) распространены в гораздо большем количестве, нежели электронные справочники и число их, составляющее сегодня нескольких десятков, продолжает неуклонно увеличиваться. Профессиональная работа с ними требует специальных навыков, поскольку простой ввод искомого термина в поисковую строку скорее всего приведет к получению списка из сотен тысяч документов, содержащих данное понятие, что практически равносильно нулевому результату.

Список использованной литературы

 

1. Генкин А. Планета Web-денег, "Альпина Паблишер", 2003 г., 510 с.

2. Денисов А. И др. Интернет: Самоучитель.  – СПб.: Питер, 2005.

3. Джерк Н. Разработка приложений для электронной коммерции., "ПИТЕР", 2007 г., 512 стр.

4. Ковалев А., Курдюмов И. и др. Управление проектом по созданию интернет-сайта, "Альпина Паблишер", 2005г., 337с.

5. Козье д. Электронная коммерция: Пер. с англ. -М.:Издательско-торговый дом "Русская редакция". 2009.-288с

6. Рейнхоулд А., Левин Дж.Р., Левин-Ян М. – Internet для «Чайников»: краткий справочник – Киев: Диалектика, 2006.

7. Соломенчук В. Интернет: краткий курс – СПб.: Питер, 2004.

 

 

Оглавление

Введение 3

1. Как работают механизмы поиска 4

2. Понятие информационно-поисковой  системы 7

3. Поисковая система Google 13

3.1. История создания и принципы  работы Google 13

3.2. Основные отличительные черты  Google: 16

3.3. Классификация роботов Google: 19

4. Поисковая система Yandex (Яндекс) 21

4.1. История создания и принципы  работы Yandex (Яндекс) 21

4.2. Особенности Яндекс 27

Заключение 30

Список литературы 32

 

Введение

Пополнение информационных ресурсов Интернета происходит высокими темпами, и найти необходимую информацию становиться всё труднее. Различные  печатные справочники устаревают ещё  до выхода в свет. Единственным надёжным способом поиска информации является использование различных поисковых  систем, которые постоянно отслеживают  изменение информации в сети.

За время существования Интернета  предпринимались различные попытки  организации поисковых средств. Многие из этих попыток оказались  неудачными, другие же привели к  созданию удобных средств поиска информации. Мы рассмотрим поиск информации во Всемирной паутине с помощью  нескольких наиболее распространённых систем поиска. Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий. Отметим, что поисковые системы часто называют поисковыми машинами или машинами поиска.

Многие поисковые системы позволяют  искать информацию не только в Web-страницах, но и в группах новостей и хранилищах файлов. Таким образом, в результате поиска вы можете найти сообщение  в группе новостей или какой-то файл. Поэтому чаще применяют вместо термина  страница более общий термин - документ. Под документом подразумеваются Web-страница, сообщение или файл, содержащие различную информацию.

 

1. Как работают механизмы поиска

Процесс поиска довольно прост: задавая  ключевые слова, характерные для  искомой информации, мы найдём нужный нам документ. Вне зависимости  от того, какой поисковой системой вы пользуетесь, примерный алгоритм поиска информации следующий:

1) Вы переходите на начальную страницу поисковой системы или на любую страницу, на которой находятся поля для ввода запроса и кнопка для начала поиска. В последнем случае после нажатия кнопки вы автоматически перейдёте на страницу поисковой системы. Принципиальных отличий между собственно поисковой системой и страницей с полями для ввода запроса, который передаётся поисковой системе, нет. Главное - перейти на страницу, на которой вы можете ввести ваш запрос.

2) Если система позволяет последовательные уточнения области поиска, то вы переходите в разделы, которые определяют границы поиска информации (например, поиск только в области науки или поиск среди европейских узлов Интернета). В таких системах запрос в главном разделе осуществляет поиск среди всех узлов Интернета. Если же вы, например, перейдёте в раздел «Новости», то поиск по запросу будет выполняться только среди узлов, посвящённых новостям. В том случае, если вы перейдёте в раздел погода, то вы будете искать только среди новостей о погоде. Таким образом, вы сначала определяете границы, в которых следует вести поиск, и только после этого отправляется запрос на поиск информации. Если выбранная вами система поиска не позволяет уточнить запрос, то это действие пропускается.

3) Вводится запрос на поиск в соответствии с правилами, принятыми в выбранной системе поиска. В простейшем случае это одно или несколько слов, например «Анекдоты», но возможны и сложные запросы с логическими операциями «И», «ИЛИ», «НЕТ».

4) Если система поиска позволяет, то уточняются некоторые параметры запроса с помощью дополнительных полей, списков, флажков и переключателей, которые могут находиться на странице рядом с полем запроса. В большинстве случаев уточнение параметров не требуется. Уточнение параметров и составление сложных запросов чем-то похоже на программирование и пользуется большей популярностью у программистов, чем у широкого круга людей, не знакомых с программированием.

5) Нажимается кнопка для начала поиска, и после некоторой паузы вы автоматически попадаете на страницу со списком документов, удовлетворяющих вашему запросу. Длительность паузы зависит от сложности запроса, скорости работы поисковой системы и качества вашей связи с данной системой.

6) Если ссылок много и они не помещаются на одной странице, то после прочтения первой страницы с результатами поиска вы можете перейти к следующей, и так далее. Таким образом, вы просматриваете все найденные ссылки на документы.

7) После нахождения нужной ссылки вы щёлкаете на ней мышью и переходите на страницу, которую вы разыскивали. Если вы захотите посмотреть другие найденные страницы, то можно вернуться назад, к странице со ссылками на найденные документы, и перейти по другой ссылке.

Во многих поисковых системах поле запроса остаётся на странице во время  просмотра результатов, и вы можете быстро уточнить запрос и организовать новый поиск. В большинстве систем список включает в себя кроме ссылок несколько строк каждого из найденных  документов, чтобы было легче выбрать  нужный.

В некоторых системах списки ссылок отсортированы таким образом, что  в начале списка вы получите ссылки на документы, наиболее удовлетворяющие  вашему запросу. Например, если в документе  много раз встречаются слова  запроса и несколько слов, включённых в запрос, расположены в документе рядом, то такой документ более полно удовлетворяет запросу. Так как большинство систем осуществляет интеллектуальный поиск в Интернете, то степень соответствия запросу, определённая поисковой системой, не всегда будет совпадать с вашими представлениями.

Таким образом, первая задача, которою  должна решить информационно-поисковая  система - это приписывание списка ключевых слов документу или информационному  ресурсу. Именно эта процедура и  называется индексированием. Часто, однако, индексированием называют составление  файла инвертированного списка, в  котором каждому термину индексирования ставится в соответствие список документов, в которых он встречается.

Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в  Интернете. Она обращается к своей  базе данных, где в компактном виде собраны данные об информации в Интернете. Возможно, что реальное состояние  Интернета несколько отличается оттого, что храниться в базе данных. Поисковые системы постоянно  пополняют и обновляют свои базы данных, чтобы минимизировать такое  несовпадение. Существует два способа  пополнения информации в базы данных поисковых машин:

1. Разработчик Web-страницы самостоятельно добавляет ссылку на неё в поисковую систему. Большинство систем позволяют это сделать совершенно бесплатно.

2. Специальная программа, называемая роботом, находит ссылку на новую страницу во Всемирной паутине. Роботы запускаются поисковой системой, что бы проверить, существуют ли ранее найденные документы и не появились ли новые.

 

2. Понятие информационно-поисковой  системы

Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного  языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска. В число составных частей конкретной информационно - поисковой системы, кроме информационно-поискового языка, правил перевода и критерия соответствия, входят также средства ее технической реализации, массив текстов (документов), в котором осуществляется информационный поиск, и люди, непосредственно участвующие в этом поиске.

Информация о работе Информационно-поисковые системы