Сравнительные характеристики поисковых систем

Автор работы: Пользователь скрыл имя, 13 Декабря 2012 в 21:52, курсовая работа

Краткое описание

Цель нашей курсовой работы – дать характеристику глобальным поис-ковым системам.
В ходе раскрытия данной цели ставлю перед собой следующие задачи:
- описать механизмы поиска и провести сравнительный обзор поиско-вых систем
- для подробного описания выбора поисковой системы необходимо бу-дет описать понятия охвата и глубины, скорости обхода и актуальности ссы-лок, качества и скорости поиска. Все эти показатели и составляют характери-стику поисковых систем и по ним можно сравнить все системы.

Содержание

ВВЕДЕНИЕ 3
ГЛАВА 1. ПОИСКОВЫЕ СИСТЕМЫ 6
1.1. Механизмы поиска 8
1.2. Сравнительный обзор поисковых систем. Структура запроса 11
ГЛАВА 2. ВЫБОР ПОИСКОВОЙ СИСТЕМЫ 20
2.1. Охват и глубина 20
2.2. Скорость обхода и актуальность ссылок 20
2.3. Качество поиска (субъективный показатель) 21
2.4. Скорость поиска 22
2.5. Поисковые возможности (работа с языком документа, язык запросов) 22
2.6. Дополнительные удобства 22
ГЛАВА 3. ВЫБОР ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ СОЗДАНИЯ САЙТА….. ……………………………………………………………………….24
3.1. Html-коды (вручную)…………………………………………………….24
3.2. Web Creator 5 pro…………………………………………………………25
3.3. Web Studio 5.0…………………………………………………………….26
3.4. Namo Webeditor ………………………………………………………….26
ГЛАВА 4. ЭТАПЫ ОФОРМЛЕНИЯ САЙТА В Namo Webeditor ………….27
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 31

Прикрепленные файлы: 1 файл

курсовая работа.doc

— 455.00 Кб (Скачать документ)

List. На главной странице в верхней ее части расположены ссылки на наиболее популярные проекты. Ниже, под логотипом каталога, поисковая форма. В правой колонке и нижней части страницы — блоки самых актуальных новостей. Список ссылок на основные категории каталога занимает центральную часть. Цифры рядом с названием категории показывают количество сайтов, содержащихся в ней. Записанные мелким шрифтом заголовки отсылают при нажатии на подкатегории раздела.

Щелкнув по любому из названий, вы попадете в соответствующую рубрику и под логотипом List.ru увидите полный путь до нее, начиная с главной страницы. Каждый промежуточный уровень структуры доступен по отдельной ссылке. Поиск в каталоге реализован таким образом, что в результате запроса могут быть найдены как отдельные сайты, так и рубрики.

Допускается использованием языка запросов Яаndех. Расположенная рядом с поисковой формой ссылка «Структура каталога» открывает в отдельном окне полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в любую выбранную подкатегорию. Более детальное тематическое деление текущей рубрики представлено списком ссылок.

Помеченные символом «@» приведут в подкатегории, структурно входящие в другие разделы, но содержащие близкую по содержанию информацию. Если Вы хорошо представляете, в какой рубрике содержатся нужные ресурсы, лучше перейти в нужную подкатегорию, воспользовавшись любым из предоставляемых средств навигации по каталогу. В противном случае можно искать их в полном списке.

Каталог организован  таким образом, что все сайты, содержащиеся на нижних уровнях структуры, представлены и в рубриках. Показываемый ниже список ресурсов упорядочен в алфавитном порядке, но, выбрав соответствующую сортировку («По времени добавления» или «По переходам»), можно просмотреть их по порядку добавления в каталог (начиная с самых «свежих») или в зависимости от популярности среди посетителей каталога. Ссылка с названия сайта открывает в отдельном окне его зарегистрированную в данной рубрике страницу. Пометки RUS и ENG означают наличие на сайте страниц, соответственно на русском и английском языках.

 

         ГЛАВА 2. ВЫБОР ПОИСКОВОЙ СИСТЕМЫ

При поиске в Интернет важны две составляющие - полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом - релевантность, то есть соответствие ответа вопросу.

2.1. Охват и глубина

Под охватом имеется в виду объем базы поисковой системы, который измеряется тремя показателями – общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается – существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.

Как проверить: Некоторые системы пишут на своем сайте статистику робота. Но можно проверить и самому – надо задать несколько поисковых запросов, состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе – различного трактования пробела), и при этом смотреть на статистику результатов, выдаваемую системой – обычно в начале списка указано, сколько всего было найдено документов. Помимо того, что слова должны быть из разных областей, хорошо еще взять слова разных весов – редкие, «средние» и «тяжелые» (частотные), и сравнить количество найденного. Тяжелые слова, в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой системы.

Глубину хождения робота проверить сложнее - для этого  надо взять какие-то сайты, например, с разветвленной структурой архивов, и проверить, проиндексированы ли документы, на которые можно попасть только, например, за 6 переходов по ссылкам.

2.2. Скорость обхода  и актуальность ссылок

Скорость обхода Сети показывает, насколько быстро происходит индексация свежедобавленного ресурса и насколько быстро обновляется информация в базе. Важным показателем качества поисковой системы (ее робота) является не только захват новых территорий: но и отслеживание состояния уже охваченных. Сервера исчезают и появляются, страницы на них обновляются. Ссылки, которые выдает поисковая система в списке найденного, должны, во-первых, существовать, и, во-вторых, их содержание должно соответствовать запросу.

Как проверить: Объективную информацию можно получить, проанализировав логи серверов – робот поисковой системы представляется обычно именем своей системы (или похожим образом), так что можно увидеть, как часто он бывает на сервере, сколько страниц просматривает и т.д. К сожалению, обычно для изучения бывает доступен лог только своего сайта, поэтому остается экспериментальный способ.

Для определения скорости обхода надо создать где-нибудь страничку  текста, добавить ее в поисковые  системы и посмотреть, как быстро она начнет находиться. Или изменить уже имеющуюся страничку. Для  определения актуальности ссылок – проверить документы хотя бы на первой странице списка найденного по нескольким запросам. Сообщение Not Found свидетельствует о том, что документ более не существует.

2.3. Качество поиска (субъективный  показатель)

Каждая поисковая система имеет свои алгоритм сортировки результатов поиска. Чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность.

Как проверить: Только путем эксперимента. Рекомендуется для сравнения делать запросы разной длины. Можно также использовать язык запросов, при этом те, кому неохота читать описание, могут воспользоваться развернутой страницей запроса («расширенный поиск» в Апорте и Яндексе, «детальный запрос» в Рэмблере – варианты перевода на русский язык «advanced search»).

Кроме релевантности, существуют важные пользовательские характеристики.

2.4. Скорость поиска

Если поисковая система  отвечает медленно, работать с ней  неэффективно. Стоит добавить, что видимая пользователю скорость зависит не только от самой поисковой системы, но и от Интернет-каналов.

Как проверить: Путем эксперимента – надо поискать запросы разной длины, разной «тяжести» слов и в разное время суток (загрузка серверов существенно неравномерна по суткам, пик – около трех-четырех часов дня).

2.5. Поисковые возможности (работа с языком документа, язык запросов)

Еще один пункт сравнения - что именно и как поисковая  система вносит в индекс. Полнотекстовая поисковая система индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой системой (заголовки, ссылки, подписи к картинкам и т.д.).  
Язык запросов в виде стандартных логических операторов (И, ИЛИ, НЕ) есть практически у всех систем. Некоторые умеют искать словосочетания или слова на заданном расстоянии - это часто важно для получения разумного результата. Дополнительной возможностью является поиск в зонах документа – заголовках, ссылках, ключевых словах (META KEYWORDS) и т.д. Дополнительная возможность языка запросов - естественно-языковый запрос, который не требует знания операторов.

Как проверить: Обычно эта информация публикуется на сервере поисковой системы (в Help'е). Тем не менее, рекомендуется проверить на реальных запросах, поскольку иногда желаемое выдается за действительное.

2.6. Дополнительные удобства

Это - дополнительные возможности, которые предоставляет пользователям поисковая система. Сюда входит всевозможные варианты поиска (специализированные страницы, поиск похожих документов, ограничение области поиска), и список найденных серверов, и поиск по датам и серверам, и удобный интерфейс поисковой системы, и возможность его персонализации.

Как проверить: Информация может быть частично опубликована на сервере поисковой системы, но лучше всего попробовать самому поработать с этими возможностями.

Понятно, что указанный  анализ займет некоторое время. Кроме  этого, поисковые системы, как и  весь Интернет, не стоят на месте. Однако, учитывая, что поиск информации – одна из важных составляющих компьютерных технологий, этому стоит уделить достаточное внимание – по крайней мере, не меньшее, чем умению работать в локальной сети.

На Yandex.ru был проведен опрос: зачем нужен Интернет и чего в нем не хватает (http://www.yandex.ru/polling/9.html). В порядке убывания данные опроса распределились следующим образом: Интернет используют как справочник (23,76%), инструмент исследования (15,.45%), развлечение (14,15%), и только на четвертом месте - источник новостей (12,32%). Оптимистично прозвучало, что 10% пользователей всегда, а 73% часто удается найти нужную информацию. А не хватает в Интернете: информации, хорошего поиска и порядка (в том числе: упорядоченности, структуры, структурности, структурированности, структуризации, а также системы, систематизации, системности, систематичности и систематизированности).

 

ГЛАВА 3. ВЫБОР ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

ДЛЯ СОЗДАНИЯ САЙТА

Проведем  небольшой обзор по программам для  создания сайтов. 
3.1. Html-коды (вручную)

TML (HyperText Markup Language) переводится  как язык маркировки гипертекстов. Это язык на котором создаются  сайты и чтобы начать его  освоение нам понадобится любой браузер и текстовой редактор, можно использовать блокнот, но я использую EmEditor и Вам его рекомендую, он различает синтаксис HTML и если Вы где-нибудь случайно допустите ошибку, опечатку, то изменение цвета текста позволит обнаружить ее быстро. Текстовой редактор нужен для создания и редактирования веб страницы, а браузер – для отслеживания результатов.

Вы когда-нибудь сталкивались с понятием тэг? Тэг – это специальное  указание того как нужно отображать элемент (текст, картинка и т.д.) на странице сайта. Можно представить его как команду браузеру содержащую название и параметры.

< ТЭГ > Текст, на  который должен воздействовать  тэг < /ТЭГ >. Большинство тэгов — парные, то есть на каждую открывающую метку вида <тэг> есть закрывающая метка вида с тем же именем, но с добавлением слэша "/". Может в теории что-то и непонятно, но посмотрев примеры, вы поймете как все просто.

Все файлы HTML всегда будут  начинаться с тэга < html >. Он говорит  браузеру, что он имеет дело с файлом HTML. Страница HTML представляет с собой текстовой файл с расширением.html. И любой документ заканчивается тэгом < /html >. Между ними должна быть еще одна обязательная пара тэгов: < head > — < /head >. Head от слово Header означает заголовок, то есть здесь будет находится заголовок веб страницы. Итак, Ваша web страница к этому времени должна выглядеть следующим образом:

< html >

< head >

< /head >

< /html >

Сохранив такой текст  в формате html Вы получите пустую страницу. Теперь приступим к его наполнению. Видимая для пользователей часть  сайта называется телом сайта, тело обозначается тэгами < body > и < /body >. То есть сюда нужно выложить любой  элемент, который должны видеть посетители сайта. Это может быть текст, изображения, видео и т.д. Теперь нужно добавить название Вашей страничке, название добавляется между тэгами < title > и < /title >, которое нужно поместить в заголовке страницы. Давайте проанализируем все полученные знания и попробуем создать свою первую веб страницу.

3.2. Web Creator 5 pro

Профессиональный, полнофункциональный  конструктор с помощью которого вы быстро создадите свой сайт.

Web Creator 5 pro - хороший выбор  как для начинающих, так и для продвинутых пользователей

Достоинства программы Web Creator 5 pro:

  • многофункциональный графический интерфейс похожий на Word
  • навароченный  визуальный HTML  - редактор
  • большое количество встроенных шаблонов сайтов
  • наличие двух режимов редактирования кода ручного и визуального
  • просмотр готовых вебстраниц  в браузере
  • возможность вставлять на сайт скопированные в буфер элементы,или просто перетаскивать мышью
  • возможность импортировать java скрипты
  • встроенный FTP-загрузчик
  • наличие сетки для выравнивания элементов сайта
  • возможность одновременной работы с несколькими сайтами
  • возможность создавть сайты любой тематики
  • поддержка множества языков мира

3.3. Web Studio 5.0

Простая программа для  создания сайта.

Достоинства программы:

  • быстрое создание создание сайта
  • навороченный визуальный редактор
  • большое количество готовых шаблонов сайтов несколько сотен
  • возможность быстрого создания порталов из тысяч страниц
  • Встроенный FTP-загрузчик
  • огромное количество встренных графических элементов,галерей,кнопок и т.д.

Для работы с программой Web Studio 5.0 вам не потребуется знание языков на которых пишутся сайты  HTML,pnp,css.Если у вас нет времени или желания на  изучение этих языков,вам нужно быстро создать свой сайт - отличный выбор программа  Web Studio 5.0

3.4. Namo Webeditor

Мощный, профессиональный конструктор  сайтов. Поддерживает работу в двух режимах визуальное и ручное кодирование. Для работы в Namo Webeditor вам совсем не потребуется знаний HTML или других языков программирования, программа генерирует код сама. Этот конструктор имеет мощнейший навороченный визуальный редактор, интерфейс похожий на Word, поэтому работать в этой программе не сложнее чем в текстовом редакторе. В  Namo Webeditor встроено огромное количество различных готовых шаблонов страниц, графических элементов, программируемых анимационных роликов (javascript), изображений, форм и т.д. В Namo Webeditor вы сможете создавать практически любые сайты поэтому эта программа отличный выбор как для опытного так и для начинающего вебдизайнера.

Достоинства программы Namo Webeditor :

  • Мощный навороченный визуальный редактор
  • поддержка двух режимов работы визуальный и ручное кодирование
  • возможность просмотра вебстраниц одновременно в нескольких браузерах
  • большое количество готовых шаблонов страниц,форм
  • большое количество встроенных графических элементов
  • встроенные анимационные программируемые ролики (java -скрипты)
  • поддержка публикации сайта в сети благодаря встроенному FTP - загрузчику
  • возможность импорта - экспорта всех компонентов сайта
  • поддержка Unicode благодаря которой при публикации на вашем сайте не появятся различные нераспознанные символы
  • возможность создания своих графических элементов в поставляемом в комплекте с программой  графическом редакторе
  • большое количество различных стилей, дизайнов страниц

 Namo Webeditor  я использую для создания собственного сайта по причине его удобности и потому, что на занятиях по предмету мы пользовались именно этой программой.

Информация о работе Сравнительные характеристики поисковых систем