Автор работы: Пользователь скрыл имя, 02 Июня 2013 в 14:40, курсовая работа
Целью данной работы является изучение организации хранения и поиска информации в сети Internet, для чего будут последовательно рассмотрены следующие задачи: изучить поисковые системы и правила поиска информации; а также указать некоторые виды современных поисковых систем сети Internet.
Введение 3
1. Классификация информационных ресурсов 5
1.1. Понятие информационных ресурсов сети Internet 5
1.2. Классификация информационных ресурсов 7
2. Поисковые системы сети Internet 10
2.1. Поисковая система Рамблер 11
2.2. Поисковая система Яндекс 14
2.3. Поисковая система Гугл 16
Выводы и предложения 18
Список используемой литературы 20
Приложения 21
Значение ограничения контекста можно изменять конструкцией '(число, запрос)', где число - любое положительное число, запрос - любой корректный с точки зрения поисковой машины запрос, состоящий более чем из одного слова (очевидно, ограничение расстояния между словами в случае однословного запроса не имеет смысла). Таким образом, по запросу '(2, красная армия)' найдутся только те документы, в которых между словами 'красная' и 'армия' хотя бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства разница в порядковых номерах слов меньше 2, т.е. равна 1).
Ненайденные слова.
Если запрос состоит
из нескольких слов, и при этом некоторые
из них вообще не удалось найти
в Интернете, то выдаются результаты
поиска по частичному запросу, из которого
отсутствующие в Интернете
Сейчас основным лидером в поисковом Рунете является Яндекс. Его ежедневная посещаемость – более 15 миллионов человек. В Яндексе представлено более 10 миллионов сайтов и более 5 миллиардов страниц.(Приложение 2)
Все началось в 1997 году, когда Yandex был основан. Он постоянно улучшает и совершенствует поисковые алгоритмы. Это позволяет Яндексу не отставать от текущих критериев поиска и соперничать с таким монстром как Гугл. Поисковый робот Яндекса работает очень быстро, можно даже сказать, что это самый быстрый поисковый робот в русском Интернете (Рунете).
Yandex работает на кластерной системе вычислительных сетей. Каждый кластер ответственен за собственный сегмент информации.
Существуют два вида обновлений поискового робота:
Что особенного в работе Yandex?
Яндекс может сузить запросы до максимально точного за счет учета морфологии русского языка. Он использует поисковые формулы и специально разработанный алгоритм оценки релевантности страниц.
Если вы хотите проиндексировать ваш сайт в Yandex, вам нужно подать заявку в http://webmaster.yandex.ru/ . Также есть форум для пользователей этой поисковой машины - http://forum.yandex.ru.
Новые сайты индексируются дольше, если это происходит без влияния внешних факторов, а именно ссылки с других ресурсов. Как правило, это занимает несколько месяцев. Но если есть ссылки с других сайтов это может занять несколько дней. По своему опыту скажу, Google работает гораздо быстрее. Нашим поисковикам еще очень далеко до этого.
Яндекс каталог это один из важных факторов для поисковика. Нахождение сайта в каталоге показывает, что он заслуживает особого внимания и легче определяется тематика сайта. Чтобы попасть в Yandex каталог бесплатно, ваш ресурс должен быть очень популярен и не приносить никакой прибыли.
Яндекс учитывает морфологию русского языка (мощная система определения словоформ), имеет возможность сузить запрос до максимально точного при помощи специальных поисковых формул, имеет качественно разработанный алгоритм оценки релевантности документов (точность отношения текста документа к поисковому запросу), обладает высокой скоростью реакции на запросы и практическим отсутствием перегрузок серверов.
Основные показатели системы Яндекс:
Прежде всего стоит отметить, что это поисковая система мирового уровня. Исходя из множества различных факторов, по которым мы можем судить о приоритетности этой поисковой системы над другими, данная система не просто является лидером мирового поиска, она ещё на голову обошла своих конкурентов, получив право диктовать условия сферы поиска информации своим конкурентам.
Поражает стремительность развития этой поисковой системы, которая входит в одноимённую компанию, стоимость которой превышает 30 миллиардов долларов. С 1998 года началось активное развитие этой поисковой системы, которое продолжается до сегодняшнего дня.
Сегодня эта поисковая система имеет самую большую базу проиндексированных документов и наивысшую скорость индексации новых сайтов и переиндексации тех сайтов, которые уже есть в индексе. Google обладает уникальными инструментами ранжирования информации при запросе, а также эффективными алгоритмами оценки информационного содержания.
Google - поисковая система
Мира, имеет большое количество
локальных служб, вся
Основные отличительные черты:
Следует отметить, что
есть возможность управлять поведени
Однако метатег Description
иногда участвует в наполнении сниппетов
сайтов (или описаний в результатах
поиска у найденных сайтов), но если
этот метатег соответствует
Присутстувет возможность управления гибкой индексацией содержимого страницы (для этого служит тег метатег Robots), а также переходом по ссылкам на странице. Например, можно запретить передачу поискового веса ссылки (её значимости) при помощи параметра rel=”nofollow”, который присваивается тегу <a>.
Релевантность выдачи в этой поисковой системе также иногда определяется названием домена или документа, при этом количество слешей в адресе сайта не учитывается.
Как правило, для Рунета можно увеличить релевантность поисковых запросов, набранных латинскими символами.
Если ваш сайт есть в каталоге DMOZ, то Google будет выводить сниппет, составленный для вашего сайта в этом каталоге, конечно, если этот сниппет (описание) будет релевантен поисковому запросу.
Действует принцип внутренней ссылочной силы. Внутренними страницами можно продвинуть по некоторым поисковым запросам главную или другие страницы сайта.
Для того чтобы избежать возможных разногласий или вы просто не хотите видеть описание, составленное одним из редакторов, выводилось в сниппете для вашего сайта, то просто запретите это при помощи метатега.
<META NAME="Googlebot" CONTENT="NOODP">
Также присутствуют «хронические» для любой поисковой системы проблемы с индексацией динамических страниц, содержащих большое количество параметров и документов на фреймовой основе.
Разработчики советуют проверить наличие у сервера http-параметра If-Modified-Since, чтобы избежать дополнительных нагрузок на сервер со стороны этой поисковой системы.[8]
В результате выполненной курсовой работы можно сделать следующие выводы:
Сети Интернет присущи подлинно глобальные масштабы -- она объединяет компьютерные сети абсолютного большинства стран мира. Любой желающий подключиться к Интернету может стать его подписчиком, если у него имеются компьютер, модем, телефонная линия и сравнительно небольшая сумма денег. Сложилось так, что среди всех компьютерных сетей именно Интернет постоянно и успешно прогрессирует в своем развитии не только "вширь" (за счет постоянно растущего числа пользователей), но и "вглубь" (путем увеличения количества оказываемых услуг и объемов циркулирующей по сети информации).
В сети Интернет хранится очень большой объем учебной информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио- и видео-файлов и многого другого. Путешествуя по Интернет, можно найти любую информацию, иначе говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее всего их можно найти где-то на необозримых просторах Интернет.
Подводя итоги проделанной работе, подчеркиваю, что Интернет-технологии в использовании информационных ресурсов идут вперед семимильными шагами, и это значительно облегчает поиск и сбор информации по необходимой теме. В то же время есть некоторые недостатки, которые со временем, надеюсь, будут исправлены. К таким недостаткам относится некоторая засоренность сети бесполезной информацией, которая чаще всего мешает при поиске той или иной информации, отсутствие единой систематизирующей информацию и доступ к ней программы также является значительным препятствием. Исходя из вышесказанного, попытаемся заглянуть в будущее Интернет, которое уже близко, но, в то же время, зависит от вчерашнего дня сети.
Приложение 1. Интерфейс главной страницы сайта Рамблер.
Приложение 2. Интерфейс главной страницы сайта Яндекс.
Приложение 3. Интерфейс главной страницы сайта Гугл.