Информационно-поисковые системы

Автор работы: Пользователь скрыл имя, 27 Июля 2013 в 05:24, реферат

Краткое описание

Цель работы – описать и дать характеристику информационно-поисковым системам.
Данная цель решается с помощью раскрытия следующих основных задач:
1) описать принципы работы поисковых машин;
2) дать характеристику глобальным поисковым системам;
3) описать стратегию и методику профессионального поиска информации.

Содержание

Введение
1. Сущность поисковых машин
2. Глобальные поисковые системы
2.1. Поисковая система Google
2.2. Поисковая система AlltheWeb
2.3. Поисковая система Alta Vista
3. Информационно-поисковая система по законодательству - Garant
4. Стратегия и методика профессионального информационного поиска
Заключение
Список использованной литературы

Прикрепленные файлы: 1 файл

Реферат Информационно-поисковые системы ФРАГМЕНТЫ.docx

— 49.52 Кб (Скачать документ)

 

4.2. Особенности Яндекс

Имя поискового робота: Yandex/1.03.00х, где х - тип паука, в зависимости от типа индексации (первичная, полная).

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении.

У поисковой системы Яндекс достаточно быстрый поисковый робот. Но это означает лишь то, что страница будет быстро поставлена в очередь на полную индексацию. После того, как страница проходит полную индексацию, она может пропасть из поисковых результатов, если поисковый робот сочтет ее за спам, либо из-за каких-нибудь технических проблем. Т.е. если ваша станица после первичной индексации вышла на первые места по тому или иному запросу, то после полной индексации, возможно, она будет совсем на других позициях, вывод: положение страницы нужно отслеживать в течение нескольких дней, пока не пройдет полная индексация.

Страница в поисковой системе  Яндекс после полной индексации заняла хорошую позицию. Но после одной из проверок ее место в списке результатов ниже, чем обычно. А на следующий день опять все по-прежнему. Список результатов может меняться в зависимости от загруженности серверов. Т.к. база данных имеет кластерную структуру и разнесена на несколько серверов

Не нужно делать очень маленькие  или очень большие документы. поисковая система Яндекс любит документы средних размеров, насыщенные текстом (статьи и т.п.). Следует умеренно повторять ключевые слова. Ключевые слова можно писать в ALT описании, но вес слов в этом тэге ниже.

В поисковой системе Яндекс хорошо индексируются страницы созданные скриптами cgi, php. Это касается гостевых книг, форумов и т.п. Для индексации остальных (кроме главной) страниц сайта требуется примерно 2 недели.

Если сайт на русском языке, а  домен не в зоне .ru, то поисковая система Яндекс все равно проиндексирует.

Мета тэги keywords и description: ключевые слова в них особенно не помогают достигать хороших позиций. В мета тэгах нужно писать лишь те слова, которые встретятся в тексте страницы.

Однако мета тег description, используется для выдачи описания страницы в результатах поиска. Это нужно учитывать при его составлении, т.к. это будет один из критериев, по которым пользователь решает приходить к вам, или нет.

Мета тэги, такие как revisit-after, content в поисковой системе Яндекс не поддерживаются.

Яндекс учитывает ключевые слова в Title, заголовки (h1-h6), содержание страницы, ALT.

В формулу вычисления релевантности  включен Взвешенный Индекс Цитирования, аналог PageRank в Google. Обычный Индекс Цитирования используется только при сортировке сайтов в каталоге Яндекс. Влияние на положение в результатах поиска оказывает ВИЦ.

В Яндекс разработана технология определения спама, но пока она является кране не эффективной. Часто встречаются спамерские страницы. Но команда разработчиков работает над этим. Крайне не рекомендую использовать спамерские методы.

Таким образом, Яндекс - одна из крупнейших по числу проиндексированных русскоязычных документов поисковых систем Интернет. Яндекс обладает достаточной функциональностью для прямого поиска по аналогии или от противного решений большинства задач, включая сбор информации по конкретным объектам и подготовки аналитических отчетов с использованием открытой информации русского сегмента Интернет. Поисковая машина Яндекс обеспечивает бесплатный доступ к не более 5% открытых материалов русского сегмента Интернет. Яндекс можно рассматривать как достаточный инструмент для поиска баз данных, подходящих для решения конкретной задачи, и реализации иных непрямых стратегий поиска (Невидимый Интернет). Сервисы Яндекс (см. далее) значительно расширяют возможности поисковой системы. Грамотное использование сервисов Яндекс, включая поисковую систему, заметно и быстро повышает Вашу осведомленность по любым вопросам. По опыту автора в ряде случаев обработки русскоязычной информации, во-первых, служб Яндекс достаточно для подготовки аналитических отчетов, во-вторых, качественное выполнение сложных проектов без использования Яндекс невозможно.

 

Заключение

Данная работа посвящена описанию поисковых систем Google и Yandex, которые осуществляют поиск информации по «Всемирной паутине». В информационно-поисковой системе должен храниться весь необходимый информационный массив, из которого по требованиям пользователей выдается нужная информация. Поиск информации по требованию пользователя осуществляется либо автоматически, либо вручную (как в библиотеках, когда с запросом к работнику справочного фонда обращается читатель, а работник пользуется системой каталогов). Во втором случае используются ЭВМ, снабженные специальными программными средствами, анализирующими процессы запросов, поиска и выдачи нужных документов.

Таким образом, информационно-поисковые  системы реализуют вопросно-ответное отношение, что сближает задачи, стоящие  перед создателями таких систем, с теми задачами, которые решают создатели человеко-машинных систем. Поиск информации является одной  из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в сети Internet любому пользователю. Однако если для рядового пользователя  сетевого сообщества знание методов эффективного информационного поиска является желательным, но далеко не обязательным качеством, то для работников высокоинтеллектуальной сферы умение быстро ориентироваться в ресурсах Интернет и находить требуемые источники сегодня относится уже к числу базовых квалификационных навыков.

Цель работы – описать и дать характеристику двум информационно-поисковым  системам: Google и Yandex. Данная цель решается с помощью раскрытия следующих основных задач:

1) описать принципы работы поисковых  машин;

2) дать характеристику глобальным  поисковым системам;

3) описать стратегию и методику  профессионального поиска информации.

Задача поисковых машин - обеспечивать детальное разыскание информации в  электронной вселенной, что может  быть достигнуто только за счет учета (индексирования) всего содержания максимально возможного числа web-страниц.

Считается, что идеальная поисковая  система должна отвечать следующим  требованиям:

1. Простота в использовании.

2. Чётко организованный и обновляемый  индекс.

3. Быстрый поиск в базе данных  и быстрое реагирование.

4. Надёжность и точность результатов  поиска.

 

Список литературы

1. http://se.nnov.ru/google/yandex-vs-google-2/ - блог о сравнении поисковых систем.

2. http://articles.softportal.com/article-220.html - обзор основных поисковых систем Интернета

3. http://earnon.ru/google.php - описание поисковой системы Google

4. http://earnon.ru/yandex.php - описание поисковой системы Yandex

5. http://re-port.ru/articles/74607 - обзор и исследование поисковых систем.

6. http://simbiont-club.webzone.ru/search.htm - обзор поисковых систем.

.


Информация о работе Информационно-поисковые системы