Автор работы: Пользователь скрыл имя, 21 Мая 2013 в 00:54, курсовая работа
Цель данного проекта – помочь качественно находить и подбирать информацию.
Для достижения поставленной цели необходимо реализовать следующие задачи:
рассмотреть основные поисковые системы;
— проанализировать основные языки запросов;
— структурировать простые, базовые и сложные возможности операторов;
— выявить принципиальные различия, достоинства и недостатки;
— разработать алгоритм поиска информации в интернете;
4. Ссылки и поиск с ограничениями
Еще в середине 2007 года Яндекс отменил операторы link и anchor. Google сохранил возможность искать бэклинки и ссылки, анкоры которых содержат определенные слова.Обе поисковые системы предлагают пользователю использовать специальный язык запросов для того, чтобы осуществить поиск на определенном сайте; поиск конкретного типа документа; поиск слов запроса в тайтле страницы. У Яндекса есть функция поиска документа только на определенном пользователем языке. У Google есть несколько операторов, которыми не располагает российский поисковик: просмотр закешированной страницы и поиск слов запроса в тексте урла.
Действия |
Яндекс |
|
Поиск определенного типа файла |
ключевые слова mime="pdf" |
keyword filetype:pdf |
Поиск по сайту |
google url="www.seonews.ru/*" |
finance site:www.google.com |
Поиск всех слов запроса в тайтле |
title[ключевое слово] |
allintitle:keyword |
Поиск первого слова запроса в тайтле, остальных - в документе |
- |
intitle:keyword content |
Поиск документов на определенном языке |
keyword << lang="en" |
- |
Поиск закешированной версии страницы |
- |
cache:www.seonews.ru |
Поиск всех слов запроса в тексте урла |
- |
allinurl:keyword content |
Поиск первого слова запроса в тексте урла, остальных - необязательно |
- |
inurl:keyword content |
5 Время
Действия |
Яндекс |
|
Точное время в своем городе |
точное время |
time |
скока время |
- | |
Время в каком-либо городе |
время париж |
time paris |
Разница во времени |
разница во времени париж москва |
- |
Открытки |
святой валентин |
- |
Цвет на цветовом спектре |
цвет детской неожиданности |
- |
Помимо перечисленных достоинст
Недостатки «Яндекса»
1. Словоформы
Независимо от того, в какой форме
вы употребили слово в запросе, поиск
учитывает все его формы по
правилам русского языка.
Недостаток. Неприменимо к большинству
стоп-слов: я, мы, ты, вы, он, она, оно, они,
это, тот, наш, свой, себя, быть, мочь, весь,
который, один, такой… Т. е. «мальчик пошла» сработает,
а «мальчик которая» —
нет. Чтобы искать все формы стоп-слова,
нужно поставить «+» перед ним: «мальчик +которая».
2. Точная словоформа
Перед словом поставить '!'.
Недостаток. Не работает в Яндекс.Блогах,
но обещают скоро сделать.
3. Исключение слова
'~' и '~~' перед словом. Первый оператор
следит, чтобы слова не было
в пределах предложения,
Недостаток. Яндекс предлагает использовать
'-'. Этот оператор исключает слова только
из всего документа, нелогично выглядит
в паре с '~', значительно (больше чем '~~')
влияет на ранжирование результатов и
исключает не все стоп-слова.
4. Решение проблемы омонимии
Слово употребить в начальной форме
и поставить перед ним '!!'. Например,
'!!дело рыбака'.
Особенности. 1. Хитрый механизм при
исключении форм слова. Например, по запросу
'лужков ~~ !!лужков'
Яндекс все-таки найдет слово «Лужков»,
но при этом обязательно на странице будет
присутствовать и другая форма слова «лужок».
2. Если одна из форм нужного слова одновременно
является формой другого, приходится действовать
исключением. Например, поискав 'женить', вы найдете
также множество «Женю», «Женя» и «Жени».
Запрос '!!женить', понятно,
не поможет от них избавиться. Поэтому
исключать Евгения придется буквально:
все формы слова «женить», кроме всех форм
слова «женя» — 'женить ~~ !!женя'.
Недостаток. Увы, небольшой беспорядок
в словаре Яндекса. Например, слово «режим»
Яндекс почему-то считает формой слова
«резать»: '!!резать монитор'.
И если наличие «режим» еще как-то можно
оправдать безграмотностью создателей
страниц, которые иногда именно так и пишут,
то наличие «режимы» как формы слова «резать» —
целиком на совести Яндекса.
Примечания. 1. Если слово употреблено
не в начальной форме и тем более не образует
производных, то '!!' будет примерно равно
'!'. Пример: '!!выдавала' и '!выдавала'.
5. Имя собственное
Если первая буква слова в
запросе прописная (а остальные
строчные), то и найдены будут
результаты с прописной буквы.
Недостаток. Большей частью, систематизации
не поддаются: иногда Яндекс игнорирует
запрос на прописную букву, иногда теряет
подходящие под запрос сайты, иногда, наоборот,
находит сайты, которых нет со строчной.
Кроме того, Яндекс дополнительно выдает
документы, найденные по ссылке, при этом
регистр букв игнорирует.
6. Поиск слов в одном предложении
'&' между словами.
Недостаток. Яндекс уверяет,
что «несколько набранных в запросе
слов, разделенных пробелами, означают,
что все они должны входить в одно предложение».
На практике же так не происходит
7. Устойчивые словосочетания
Словосочетание в кавычках. Пример:
'"красная шапочка"'.
Особенность. Яндекс предполагает,
что слова в кавычках нужны вам именно
в таком порядке и именно в такой словоформе.
Поэтому «красными шапочками» вы таким
запросом не найдете.
Недостаток. А вот при исключении
словосочетания в кавычках Яндекс забывает
про точность словоформы. Поэтому запросом
'красная шапочка ~ "красную
шапочек"' вы найдете близко
стоящие слова «красная» и «шапочка»,
кроме всех форм «красных шапочек».
8. Поиск цифр
В этом плане у «Яндекса» очень
много недостатки. Яндекс «склеивает»
числа. Т.е. если Вы задаете запрос: «3 000 000», а он ищет «3000000».
Общее правило такое: Яндекс склеивает
три цифры с цифрами, стоящими перед ними.
Например, вместо «8 302 404 75» он будет искать
«8302404 75». Шансов найти описания веб-ошибок,
скажем так, немного: '403 404 301 && ошибки'.
«Яндекс»
пытается смягчить этот недостаток «заплаткой»
под названием «или все-таки номер телефона»?
Решение. Используйте ближайшие заменители: скобки, '&' или дефисы между цифрами, не забывая каждый раз ругать программистов Яндекса и вспоминать, что раньше, вроде, он искал цифры нормально.
Разработчики «Яндекса» извещены об упомянутых недостатков. К сожалению, не спешат изменять ситуацию. «Яндекс» можно понять: доля пользователей, использующих язык запросов, составляет менее 1%.
Преимущества и недостатки поисковой системы «Google»
Поисковая система Google по-прежнему остается самой популярной поисковой системой сети Интернет. За все время нахождения Google на рынке пока ещё ни одной из конкурирующих поисковых систем не удалось сместить американскую поисковую систему с лидирующих позиций. Однако же, как и у других Интернет-ресурсов у Google имеются как существенные преимущества, так и недостатки.
Основным преимуществом поисковой системы
Google является простота её использования.
Разработчики этой поисковой системы
– студенты стэндфордского университета
Ларри Пейдж и Сергей Брин стремились
создать поисковую систему, которая была
бы доступна каждому пользователю сети
Интернет без использования каких-либо
специальных знаний. Им это удалось. Поисковая
система является простым и удобным Интернет-ресурсом.
При внесении ключевых слов, она не требует
использования кавычек, заглавных букв
и так далее, что значительным образом
облегчает процесс поиска информации.
Кроме того, среди плюсов Google можно назвать
её обширную базу данных. На настоящий
момент там насчитывается более 3 миллиардов
вэб-страниц, благодаря чему эта база данных
этой поисковой системы входит в список
самых крупных.
Кроме
того, среди основных преимуществ этой
поисковой систем можно назвать высокую
скорость работы. Перед специалистами
компании Google стояла задача сделать работу
поисковой системы быстрой и эффективной,
и им это удалось. Сделав запрос, пользователи
практически мгновенно получают результаты
поиска. Это стало возможным благодаря
тому, что разработчики значительно «облегчили»
страницы с результатами поиска. Там содержится
минимальное количество графики, рекламных
объявлений, кроме того, значительно сокращен
текст с описанием сайтов.
Плюс
ко всему поисковая система Google выдает
достаточно точную информацию. Результаты
поиска в большинстве случаев соответствуют
совершаемым запросам. При этом ссылки
к сайтам, которые более всего соответствуют
указанным ключевым словам, находятся
в верхней части страницы. Также отметим,
что Google является практически единственной
поисковой системой, в которой учитывается
не только количество страниц в результатах
поиска, но и их качество. Особые специалисты
этой компании регулярно производят «чистку»
результатов поиска своей поисковой системы,
благодаря чему достигается достаточно
высокое качество предлагаемой информации.
Кроме
того, одним из неоспоримых
Вместо
привычной надписи «errоr 404», пользователи
могут ознакомиться в с Интернет -страницами,
правда в том виде, в каком они были размещены
в поисковой системе. Кроме того, повторяющиеся
ссылки, ведущие к одному и тому же сайту
отображаются в Google в правой части страницы
с результатами поиска. Подобная функция
значительно сокращает время поиска информации,
поскольку в этом случае пользователи
не обращаются по нескольку раз на один
и тот же сайт.
И,
наконец, пользователям предлагается
функция «Мне повезёт», благодаря которой,
не дожидаясь результатов поиска они сразу
же попадают на сайт, находящийся в списке
на первом месте.
Однако же у Google имеется и ряд недостатков. Так, например, нередко там встречаются ссылки на сайты с уже устаревшей информацией. Кроме того, также случается, что ссылки, которые находятся в результатах поиска, ведут на сайт, находящийся в стадии разработки. Из-за подобных сайтов пользователи тратят свое время впустую, в связи с чем снижается продуктивность работы поисковой системы. Кроме того, при совершении запросов пользователям необходимо проявлять внимательность. Так, например, результаты поиска, содержащие слово «фильм» будут значительно отличаться от результатов поиска, содержащих слово «фильмы». Вместе с тем, результаты поиска будут содержать и сайты, в которых находятся слова «фильм», «фильмов» и так далее.
Главный недостаток Google – поисковая машина не учитывает
русскоязычной морфологии. Кроме того,
отсутствие возможности указать конкретную
грамматическую форму слова, либо ударение
также значительно усложняет процесс
поиска информации. .
Однако
же, несмотря на эти немногочисленные
недостатки, поисковая система Google считается
самой быстрой и эффективной, что позволяет
ей завоевывать доверие всё большего количества
пользователей сети Интернет, что обеспечивает
ей звание самой популярной поисковой
системы. Кроме того, специалисты компании
Google занимаются постоянным усовершенствованием
возможностей своей поисковой системы,
что дает превосходные результаты.
5. ОБЩАЯ СТРАТЕГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ
Сегодня имена поисковых сервисов «Яндекс»,
«Google» известны каждому российскому пользователю
интернета. В интернете можно найти все,
но для этого нужно уметь правильно пользоваться
поисковыми серверами, ведь на самом деле
и в этом казалось бы несложном деле есть
свои нюансы. Мы предлагаем Вам несколько
простых советов, которые помогут ускорить
процесс поиска информации в интернете
и сделать его эффективнее.
Итак, вы вошли на поисковый сервер, набрали искомую строчку и … не находится ничего или почти ничего. Скорее всего, вы ввели слишком подробный или специфический запрос. В этом случае я могу посоветовать вам правильно составлять поисковую фразу. Например, вместо “Классификация деревьев хвойных пород в заповедниках средней полосы” лучше набрать “Хвойные породы заповедники”. Запрос станет более общим, но под него попадет большее количество потенциально искомых страниц. Ведь не обязательно же на сайте заповедника будут слова “средняя полоса”, может быть просто отмечено название области, где он находится.
Не ограничивайтесь одним
Более типична, однако, другая ситуация – поисковый сервер «завалил» Вас ссылками, но среди них нет подходящей информации. На этот случай есть свои решения.
Не ограничивайтесь первой страницей результатов. Дело в том, что конкуренция за попадание на первые позиции по поисковым запросах, которые могут принести прямую коммерческую прибыль владельцам сайта очень высока. И на первых позициях там, как правило, находятся не самые объективно подходящие под запрос (релевантные) сайты, а сайты, чьи владельцы наиболее активно и успешно занимаются продвижением своей Интернет-страницы (поисковой оптимизацией - SEO). Поэтому нередко стоит идти дальше. Ведь ответ на Ваш запрос может оказаться на второй, третьей, пятой и даже десятой страницах поисковой выдачи.
Уточняйте географию поиска и предметную область. Обычно при поиске каких-нибудь товаров или услуг добрая половина ссылок указывает на фирмы города с самой большой экономической активностью – Москвы. Поэтому жителям других городов следует либо указать город в строке запроса, либо уточнить регион средствами самого поискового сайта. Также бывает полезно воспользоваться рубрикатором поисковика и указать предметную область – например “Компьютеры” или “Фото”.
Ищите в найденном. Многие поисковые сервера позволяют искать в найденном, то есть производить ступенчатый поиск. Например, поисковая фраза «Санатории кавказские минеральные воды» сформирует первоначальный массив страниц, посвященных санаториям региона Кавказских минеральных вод, а, используя функцию поиска в найденном вместе с новой строчкой «Кардиология», можно выделить из него только санатории, занимающиеся сердечными болезнями.
Пользуйтесь преимуществами расширенного поиска. Функции расширенного поиска, которые есть у многих поисковых серверов, очень помогут вам в отсечении ненужных документов. Они, например, позволят искать только документы на определенном языке, или определенного формата, или документы, созданные в нужном диапазоне дат. Последнее бывает полезно, если вы ищете новости.