Автор работы: Пользователь скрыл имя, 13 Декабря 2012 в 21:52, курсовая работа
Цель нашей курсовой работы – дать характеристику глобальным поис-ковым системам.
В ходе раскрытия данной цели ставлю перед собой следующие задачи:
- описать механизмы поиска и провести сравнительный обзор поиско-вых систем
- для подробного описания выбора поисковой системы необходимо бу-дет описать понятия охвата и глубины, скорости обхода и актуальности ссы-лок, качества и скорости поиска. Все эти показатели и составляют характери-стику поисковых систем и по ним можно сравнить все системы.
ВВЕДЕНИЕ 3
ГЛАВА 1. ПОИСКОВЫЕ СИСТЕМЫ 6
1.1. Механизмы поиска 8
1.2. Сравнительный обзор поисковых систем. Структура запроса 11
ГЛАВА 2. ВЫБОР ПОИСКОВОЙ СИСТЕМЫ 20
2.1. Охват и глубина 20
2.2. Скорость обхода и актуальность ссылок 20
2.3. Качество поиска (субъективный показатель) 21
2.4. Скорость поиска 22
2.5. Поисковые возможности (работа с языком документа, язык запросов) 22
2.6. Дополнительные удобства 22
ГЛАВА 3. ВЫБОР ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ СОЗДАНИЯ САЙТА….. ……………………………………………………………………….24
3.1. Html-коды (вручную)…………………………………………………….24
3.2. Web Creator 5 pro…………………………………………………………25
3.3. Web Studio 5.0…………………………………………………………….26
3.4. Namo Webeditor ………………………………………………………….26
ГЛАВА 4. ЭТАПЫ ОФОРМЛЕНИЯ САЙТА В Namo Webeditor ………….27
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 31
List. На главной странице в верхней ее части расположены ссылки на наиболее популярные проекты. Ниже, под логотипом каталога, поисковая форма. В правой колонке и нижней части страницы — блоки самых актуальных новостей. Список ссылок на основные категории каталога занимает центральную часть. Цифры рядом с названием категории показывают количество сайтов, содержащихся в ней. Записанные мелким шрифтом заголовки отсылают при нажатии на подкатегории раздела.
Щелкнув по любому из названий, вы попадете в соответствующую рубрику и под логотипом List.ru увидите полный путь до нее, начиная с главной страницы. Каждый промежуточный уровень структуры доступен по отдельной ссылке. Поиск в каталоге реализован таким образом, что в результате запроса могут быть найдены как отдельные сайты, так и рубрики.
Допускается использованием языка запросов Яаndех. Расположенная рядом с поисковой формой ссылка «Структура каталога» открывает в отдельном окне полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в любую выбранную подкатегорию. Более детальное тематическое деление текущей рубрики представлено списком ссылок.
Помеченные символом «@» приведут в подкатегории, структурно входящие в другие разделы, но содержащие близкую по содержанию информацию. Если Вы хорошо представляете, в какой рубрике содержатся нужные ресурсы, лучше перейти в нужную подкатегорию, воспользовавшись любым из предоставляемых средств навигации по каталогу. В противном случае можно искать их в полном списке.
Каталог организован таким образом, что все сайты, содержащиеся на нижних уровнях структуры, представлены и в рубриках. Показываемый ниже список ресурсов упорядочен в алфавитном порядке, но, выбрав соответствующую сортировку («По времени добавления» или «По переходам»), можно просмотреть их по порядку добавления в каталог (начиная с самых «свежих») или в зависимости от популярности среди посетителей каталога. Ссылка с названия сайта открывает в отдельном окне его зарегистрированную в данной рубрике страницу. Пометки RUS и ENG означают наличие на сайте страниц, соответственно на русском и английском языках.
При поиске в Интернет важны две составляющие - полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом - релевантность, то есть соответствие ответа вопросу.
Под охватом имеется в виду объем базы поисковой системы, который измеряется тремя показателями – общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Под глубиной понимается – существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.
Как проверить: Некоторые системы пишут на своем сайте статистику робота. Но можно проверить и самому – надо задать несколько поисковых запросов, состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе – различного трактования пробела), и при этом смотреть на статистику результатов, выдаваемую системой – обычно в начале списка указано, сколько всего было найдено документов. Помимо того, что слова должны быть из разных областей, хорошо еще взять слова разных весов – редкие, «средние» и «тяжелые» (частотные), и сравнить количество найденного. Тяжелые слова, в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой системы.
Глубину хождения робота проверить сложнее - для этого надо взять какие-то сайты, например, с разветвленной структурой архивов, и проверить, проиндексированы ли документы, на которые можно попасть только, например, за 6 переходов по ссылкам.
Скорость обхода Сети показывает, насколько быстро происходит индексация свежедобавленного ресурса и насколько быстро обновляется информация в базе. Важным показателем качества поисковой системы (ее робота) является не только захват новых территорий: но и отслеживание состояния уже охваченных. Сервера исчезают и появляются, страницы на них обновляются. Ссылки, которые выдает поисковая система в списке найденного, должны, во-первых, существовать, и, во-вторых, их содержание должно соответствовать запросу.
Как проверить: Объективную информацию можно получить, проанализировав логи серверов – робот поисковой системы представляется обычно именем своей системы (или похожим образом), так что можно увидеть, как часто он бывает на сервере, сколько страниц просматривает и т.д. К сожалению, обычно для изучения бывает доступен лог только своего сайта, поэтому остается экспериментальный способ.
Для определения скорости обхода надо создать где-нибудь страничку текста, добавить ее в поисковые системы и посмотреть, как быстро она начнет находиться. Или изменить уже имеющуюся страничку. Для определения актуальности ссылок – проверить документы хотя бы на первой странице списка найденного по нескольким запросам. Сообщение Not Found свидетельствует о том, что документ более не существует.
Каждая поисковая система имеет свои алгоритм сортировки результатов поиска. Чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность.
Как проверить: Только путем эксперимента. Рекомендуется для сравнения делать запросы разной длины. Можно также использовать язык запросов, при этом те, кому неохота читать описание, могут воспользоваться развернутой страницей запроса («расширенный поиск» в Апорте и Яндексе, «детальный запрос» в Рэмблере – варианты перевода на русский язык «advanced search»).
Кроме релевантности, существуют важные пользовательские характеристики.
Если поисковая система отвечает медленно, работать с ней неэффективно. Стоит добавить, что видимая пользователю скорость зависит не только от самой поисковой системы, но и от Интернет-каналов.
Как проверить: Путем эксперимента – надо поискать запросы разной длины, разной «тяжести» слов и в разное время суток (загрузка серверов существенно неравномерна по суткам, пик – около трех-четырех часов дня).
Еще один пункт сравнения
- что именно и как поисковая
система вносит в индекс. Полнотекстовая поисковая
система индексирует все слова видимого
пользователю текста. Наличие морфологии
дает возможность находить искомые слова
во всех склонениях или спряжениях. Кроме
этого, в языке HTML существуют тэги, которые
также могут обрабатываться поисковой
системой (заголовки, ссылки, подписи к
картинкам и т.д.).
Язык запросов в виде стандартных логических
операторов (И, ИЛИ, НЕ) есть практически
у всех систем. Некоторые умеют искать
словосочетания или слова на заданном
расстоянии - это часто важно для получения
разумного результата. Дополнительной
возможностью является поиск в зонах документа
– заголовках, ссылках, ключевых словах
(META KEYWORDS) и т.д. Дополнительная возможность
языка запросов - естественно-языковый
запрос, который не требует знания операторов.
Как проверить: Обычно эта информация публикуется на сервере поисковой системы (в Help'е). Тем не менее, рекомендуется проверить на реальных запросах, поскольку иногда желаемое выдается за действительное.
Это - дополнительные возможности,
которые предоставляет пользова
Как проверить: Информация может быть частично опубликована на сервере поисковой системы, но лучше всего попробовать самому поработать с этими возможностями.
Понятно, что указанный анализ займет некоторое время. Кроме этого, поисковые системы, как и весь Интернет, не стоят на месте. Однако, учитывая, что поиск информации – одна из важных составляющих компьютерных технологий, этому стоит уделить достаточное внимание – по крайней мере, не меньшее, чем умению работать в локальной сети.
На Yandex.ru был проведен опрос: зачем нужен Интернет
и чего в нем не хватает (http://www.yandex.ru/polling/
TML (HyperText Markup Language) переводится
как язык маркировки
Вы когда-нибудь сталкивались с понятием тэг? Тэг – это специальное указание того как нужно отображать элемент (текст, картинка и т.д.) на странице сайта. Можно представить его как команду браузеру содержащую название и параметры.
< ТЭГ > Текст, на который должен воздействовать тэг < /ТЭГ >. Большинство тэгов — парные, то есть на каждую открывающую метку вида <тэг> есть закрывающая метка вида с тем же именем, но с добавлением слэша "/". Может в теории что-то и непонятно, но посмотрев примеры, вы поймете как все просто.
Все файлы HTML всегда будут начинаться с тэга < html >. Он говорит браузеру, что он имеет дело с файлом HTML. Страница HTML представляет с собой текстовой файл с расширением.html. И любой документ заканчивается тэгом < /html >. Между ними должна быть еще одна обязательная пара тэгов: < head > — < /head >. Head от слово Header означает заголовок, то есть здесь будет находится заголовок веб страницы. Итак, Ваша web страница к этому времени должна выглядеть следующим образом:
< html >
< head >
< /head >
< /html >
Сохранив такой текст
в формате html Вы получите пустую страницу.
Теперь приступим к его наполнению.
Видимая для пользователей
3.2. Web Creator 5 pro
Профессиональный, полнофункциональный конструктор с помощью которого вы быстро создадите свой сайт.
Web Creator 5 pro - хороший выбор как для начинающих, так и для продвинутых пользователей
Достоинства программы Web Creator 5 pro:
3.3. Web Studio 5.0
Простая программа для создания сайта.
Достоинства программы:
Для работы с программой Web Studio 5.0 вам не потребуется знание языков на которых пишутся сайты HTML,pnp,css.Если у вас нет времени или желания на изучение этих языков,вам нужно быстро создать свой сайт - отличный выбор программа Web Studio 5.0
3.4. Namo Webeditor
Мощный, профессиональный конструктор сайтов. Поддерживает работу в двух режимах визуальное и ручное кодирование. Для работы в Namo Webeditor вам совсем не потребуется знаний HTML или других языков программирования, программа генерирует код сама. Этот конструктор имеет мощнейший навороченный визуальный редактор, интерфейс похожий на Word, поэтому работать в этой программе не сложнее чем в текстовом редакторе. В Namo Webeditor встроено огромное количество различных готовых шаблонов страниц, графических элементов, программируемых анимационных роликов (javascript), изображений, форм и т.д. В Namo Webeditor вы сможете создавать практически любые сайты поэтому эта программа отличный выбор как для опытного так и для начинающего вебдизайнера.
Достоинства программы Namo Webeditor :
Namo Webeditor я использую для создания собственного сайта по причине его удобности и потому, что на занятиях по предмету мы пользовались именно этой программой.
Информация о работе Сравнительные характеристики поисковых систем