Информационные ресурсы сети Internet

Автор работы: Пользователь скрыл имя, 02 Июня 2013 в 14:40, курсовая работа

Краткое описание

Целью данной работы является изучение организации хранения и поиска информации в сети Internet, для чего будут последовательно рассмотрены следующие задачи: изучить поисковые системы и правила поиска информации; а также указать некоторые виды современных поисковых систем сети Internet.

Содержание

Введение 3
1. Классификация информационных ресурсов 5
1.1. Понятие информационных ресурсов сети Internet 5
1.2. Классификация информационных ресурсов 7
2. Поисковые системы сети Internet 10
2.1. Поисковая система Рамблер 11
2.2. Поисковая система Яндекс 14
2.3. Поисковая система Гугл 16
Выводы и предложения 18
Список используемой литературы 20
Приложения 21

Прикрепленные файлы: 1 файл

курсовая работа по информатике.doc

— 450.50 Кб (Скачать документ)

Значение ограничения  контекста можно изменять конструкцией '(число, запрос)', где число - любое положительное число, запрос - любой корректный с точки зрения поисковой машины запрос, состоящий более чем из одного слова (очевидно, ограничение расстояния между словами в случае однословного запроса не имеет смысла). Таким образом, по запросу '(2, красная армия)' найдутся только те документы, в которых между словами 'красная' и 'армия' хотя бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства разница в порядковых номерах слов меньше 2, т.е. равна 1).

 

Ненайденные слова.

Если запрос состоит  из нескольких слов, и при этом некоторые  из них вообще не удалось найти  в Интернете, то выдаются результаты поиска по частичному запросу, из которого отсутствующие в Интернете слова  исключены. При этом на странице результатов поиска выдается соответствующая диагностика.[7]

    1. Поисковая система Яндекс

 

Сейчас основным лидером  в поисковом Рунете является Яндекс. Его ежедневная посещаемость – более 15 миллионов человек. В Яндексе  представлено более 10 миллионов сайтов и более 5 миллиардов страниц.(Приложение 2)

Все началось в 1997 году, когда Yandex был основан. Он постоянно улучшает и совершенствует поисковые алгоритмы. Это позволяет Яндексу не отставать  от текущих критериев поиска и соперничать с таким монстром как Гугл. Поисковый робот Яндекса работает очень быстро, можно даже сказать, что это самый быстрый поисковый робот в русском Интернете (Рунете).

Yandex работает на кластерной  системе вычислительных сетей.  Каждый кластер ответственен за собственный сегмент информации.

Существуют два вида обновлений поискового робота:

  1. Обновляется поисковая база. Это бывает несколько раз в месяц. Появляются обновленные страницы веб-сайтов.
  2. Обновляется программная часть поисковой системы. Изменяются алгоритмы ранжирования страниц.

 

Что особенного в работе Yandex?

Яндекс может сузить запросы до максимально точного  за счет учета морфологии русского языка. Он использует поисковые формулы  и специально разработанный алгоритм оценки релевантности страниц.

Если вы хотите проиндексировать ваш сайт в Yandex, вам нужно подать заявку в http://webmaster.yandex.ru/ . Также есть форум для пользователей этой поисковой машины - http://forum.yandex.ru.

Новые сайты индексируются дольше, если это происходит без влияния внешних факторов, а именно ссылки с других ресурсов. Как правило, это занимает несколько месяцев. Но если есть ссылки с других сайтов это может занять несколько дней. По своему опыту скажу, Google работает гораздо быстрее. Нашим поисковикам еще очень далеко до этого.

Яндекс каталог это  один из важных факторов для поисковика. Нахождение сайта в каталоге показывает, что он заслуживает особого внимания и легче определяется тематика сайта. Чтобы попасть в Yandex каталог бесплатно, ваш ресурс должен быть очень популярен и не приносить никакой прибыли.

Яндекс учитывает морфологию русского языка (мощная система определения словоформ), имеет возможность сузить запрос до максимально точного при помощи специальных поисковых формул, имеет качественно разработанный алгоритм оценки релевантности документов (точность отношения текста документа к поисковому запросу), обладает высокой скоростью реакции на запросы и практическим отсутствием перегрузок серверов.

 

Основные показатели системы Яндекс:

    1. ВИЦ - взвешенный индекс цитирования. Этот параметр известен только Yandex. Предположительно количество внешних ссылок;
    2. ТИЦ - тематический индекс цитирования сайта. Этот параметр общедоступен и показывает усредненное число ссылающихся сайтов, тематически близких к вашему;
    3. Количество страниц проиндексированных системой;
    4. Наличие веб-сайта под фильтрами;
    5. Частота обновления страниц.[6]
    1. Поисковая система Гугл

 

Прежде всего стоит  отметить, что это поисковая система мирового уровня. Исходя из множества различных факторов, по которым мы можем судить о приоритетности этой поисковой системы над другими, данная система не просто является лидером мирового поиска, она ещё на голову обошла своих конкурентов, получив право диктовать условия сферы поиска информации своим конкурентам.

Поражает стремительность  развития этой поисковой системы, которая  входит в одноимённую компанию, стоимость  которой превышает 30 миллиардов долларов. С 1998 года началось активное развитие этой поисковой системы, которое продолжается до сегодняшнего дня.

Сегодня эта поисковая  система имеет самую большую  базу проиндексированных документов и  наивысшую скорость индексации новых  сайтов и переиндексации тех сайтов, которые уже есть в индексе. Google обладает уникальными инструментами ранжирования информации при запросе, а также эффективными алгоритмами оценки информационного содержания.

Google - поисковая система  Мира, имеет большое количество  локальных служб, вся деятельность  которых основывается на обслуживании каких-либо конкретных стран и языковых территорий.(Приложение 3)

Основные отличительные  черты:

  1. Очень важная черта: Google не отворачивается от творцов сайта или веб-мастеров, предлагая оным хорошо продуманный интерфейс, благодаря которому они могут эффективно взаимодействовать с этой поисковой системой, имея в своём составе помимо справочной информации различные инструменты для оценки позиционирования сайтов в этой поисковой системе, причём, совершенно бесплатно;
  2. Поисковая система не умеет читать текст на изображениях, поэтому нужно тщательно прописывать параметры alt в тегах изображения (Один из факторов работы робота-сканера изображений Googlebot-Image);
  3. Поисковая система также умеет индексировать текст внутри документов Shockwave Flash. Помимо этого индексируются документы: PDF, RTF, DOC, XLS (документы Excel), PPT (презентации PowerPoint);
  4. Роботы поисковой системы ходят только по ссылкам в параметрах HREF и SRC.

Следует отметить, что  есть возможность управлять поведением поисковой системы через метатеги страницы, однако не все из них поддерживаются. Например, фактически нет смысла использовать метатег keywords, т. к. релевантное соотношение ключевых слов в любом случае формируется исходя из ключевой плотности контента страницы.

Однако метатег Description иногда участвует в наполнении сниппетов  сайтов (или описаний в результатах  поиска у найденных сайтов), но если этот метатег соответствует содержимому  самой страницы и поисковому запросу.

Присутстувет возможность  управления гибкой индексацией содержимого страницы (для этого служит тег метатег Robots), а также переходом по ссылкам на странице. Например, можно запретить передачу поискового веса ссылки (её значимости) при помощи параметра rel=”nofollow”, который присваивается тегу <a>.

Релевантность выдачи в  этой поисковой системе также  иногда определяется названием домена или документа,  при этом количество слешей в адресе сайта не учитывается.

Как правило, для Рунета можно увеличить релевантность  поисковых запросов, набранных латинскими символами.

Если ваш сайт есть в каталоге DMOZ, то Google будет выводить сниппет, составленный для вашего сайта  в этом каталоге, конечно, если этот сниппет (описание)  будет релевантен поисковому запросу.

Действует принцип внутренней ссылочной силы. Внутренними страницами можно продвинуть по некоторым поисковым запросам главную или другие страницы сайта.

Для того чтобы избежать возможных разногласий или вы просто не хотите видеть описание, составленное одним из редакторов, выводилось в сниппете для вашего сайта, то просто запретите это при помощи метатега.

<META NAME="Googlebot" CONTENT="NOODP">

Также присутствуют «хронические»  для любой поисковой системы  проблемы с индексацией динамических страниц, содержащих большое количество параметров и документов на фреймовой основе.

Разработчики советуют проверить наличие у сервера http-параметра If-Modified-Since, чтобы избежать дополнительных нагрузок на сервер со стороны этой поисковой системы.[8]

Выводы и предложения

 

В результате выполненной  курсовой работы можно сделать следующие выводы:

  1. Информационный ресурс в сети интернет – это массив данных, составленный и отсортированный по некому признаку, роду информации, который имеет строгую структуру. Благодаря Информационным Ресурсам Интернет получил заслуженную популярность в последние годы. Доступ к ресурсам имеет каждый, кто подключил свой компьютер к всемирной паутине.
  2. Важную, возможно даже определяющую роль при пользовании Интернетом играет возможность поиска в нем нужной пользователю информации. Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».
  3. Сейчас основным лидером в поисковом Рунете является Яндекс. Его ежедневная посещаемость – более 15 миллионов человек. В Яндексе представлено более 10 миллионов сайтов и более 5 миллиардов страниц.
  4. Google - поисковая система Мира, имеет большое количество локальных служб, вся деятельность которых основывается на обслуживании каких-либо конкретных стран и языковых территорий.

Сети Интернет присущи  подлинно глобальные масштабы -- она объединяет компьютерные сети абсолютного большинства стран мира. Любой желающий подключиться к Интернету может стать его подписчиком, если у него имеются компьютер, модем, телефонная линия и сравнительно небольшая сумма денег. Сложилось так, что среди всех компьютерных сетей именно Интернет постоянно и успешно прогрессирует в своем развитии не только "вширь" (за счет постоянно растущего числа пользователей), но и "вглубь" (путем увеличения количества оказываемых услуг и объемов циркулирующей по сети информации).

В сети Интернет хранится очень большой объем учебной информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио- и видео-файлов и многого другого. Путешествуя по Интернет, можно найти любую информацию, иначе говоря, если какие-либо данные вводились когда-либо в компьютер, то вероятнее всего их можно найти где-то на необозримых просторах Интернет.

Подводя итоги проделанной работе, подчеркиваю, что Интернет-технологии в использовании информационных ресурсов идут вперед семимильными шагами, и это значительно облегчает поиск и сбор информации по необходимой теме. В то же время есть некоторые недостатки, которые со временем, надеюсь, будут исправлены. К таким недостаткам относится некоторая засоренность сети бесполезной информацией, которая чаще всего мешает при поиске той или иной информации, отсутствие единой систематизирующей информацию и доступ к ней программы также является значительным препятствием. Исходя из вышесказанного, попытаемся заглянуть в будущее Интернет, которое уже близко, но, в то же время, зависит от вчерашнего дня сети.

список используемой литературы

    1. Фигурнов В.Э. IBM PC для пользователя. Издание 6-е, переработанное и дополненное — М.: Инфра-М, 1995. —432 с.: ил.
    2. Информатика: Учебное пособие для студентов педагогических вузов/ А.В. Могилёв, Н.И. Пак, Е.К. Хеннер; Под ред. Е.К. Хеннера. – 3-е изд., «Академия», 2004. – 848с.
    3. Информатика: учебник. Курносов А.П., Кулев С.А., Улезько А.В., Камалян А.К., Чернигин А.С., Ломакин С.В.: под ред. А.П. Курносова Воронеж, ВГАУ, 2005 — 238 с.
    4. Информатика: процессы, системы, ресурсы./А.Я. Фриланд. – М. БИНОМ. Лаборатория занятий, 2003. – 232с., илл.
    5. Информатика /под ред. Проф. Н.В. Макаровой. —М.: Финансы и статистика, 1997. — 768 с.: ил.
    6. http://www.yandex.ru/
    7. http://www.rambler.ru/
    8. http://www.google.ru/

Приложения

Приложение 1. Интерфейс главной страницы сайта Рамблер.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение 2. Интерфейс главной страницы сайта Яндекс.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение 3. Интерфейс главной страницы сайта Гугл.

 


Информация о работе Информационные ресурсы сети Internet