Происхождение слова «Яндекс»

Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 10:06, курсовая работа

Краткое описание

Причина такого положения проста и кроется в технологии получения и представления результатов поисковыми системами. При этом надо понимать, что главная проблема заключается в отсутствии четких правил, доступных и открытых для всех желающих. Чем больше неопределенности в алгоритмах формирования поисковых индексов (некий черный ящик), тем меньше поисковые системы отражают процесс формирования реальной информации. И соответственно, тем меньше будет уровень доверия к результатам поиска поисковых систем.

Содержание

Введение 2
Происхождение слова «Яндекс» 4
Индексирование интернета 6
Подготовка к ответам 6
Архитектура ответа на вопрос 10
Обработка запроса 12
Определение языка запроса 12
Морфологический разбор и снятие омонимии 13
Расширение запроса 13
Работа над ошибками 15
Машинное обучение 16
Матрикснет 17
Формирование результатов поиска 23
Оформление результатов поиска 25
Дополнительная информация в сниппете 25
Заключение 27
Список литературы 28

Скачать полностью (740.90 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

яндекс.docx

— 754.31 Кб (Скачать документ)

На базе технологии «Спектр» в поиске Яндекса реализованы диалоговые подсказки. Они появляются под строкой поиска в ответ на неоднозначные запросы. Диалоговые подсказки описывают наиболее популярные категории, в которые попал запрос, и позволяют в один клик перейти к ответам только из выбранной категории. Например, по запросу [голубика] Яндекс предлагает «полезные свойства», «википедия», «калорийность» и «рецепты». За каждой из этих ссылок пользователя ждет соответствующая страница результатов поиска.

Формирование результатов поиска

Для заголовка результата поиска Яндекс чаще всего использует заголовок самого документа. Если он слишком длинный, Яндекс выбирает фрагмент, который больше всего подходит по смыслу к заданному запросу.

Бывает, что у документа нет заголовка или заголовок не соответствует содержанию. Например, названия файлов в формате doc или pdf часто короткие и малоинформативные. В таких случаях Яндекс создаёт заголовок самостоятельно, основываясь на текстах ссылок на документ, заголовках в самом тексте документа и его содержании.

Для формирования описания страницы, которое помещается в сниппете, программа выбирает все фрагменты текста документа со словами из запроса. Каждый из таких фрагментов разбивается ещё на несколько частей — например, со словами из запроса в начале, в конце и в середине. Затем программа сравнивает их все между собой и выбирает лучшие — они и попадают в сниппет.

При выборе программа учитывает несколько десятков факторов. Некоторые из них повышают шансы попадания фрагмента в сниппет, а некоторые — наоборот. Например, если слово содержится в длинном предложении, больше вероятность, что это часть повествования, а не навигационная ссылка. Это хороший фрагмент для сниппета. Также в сниппет скорее попадут фрагменты из разных частей текста — так можно полнее описать содержание страницы. А вот фрагмент, схожий с заголовком текста страницы, вряд ли попадёт в сниппет — чтобы не дублировать информацию.

Для каждого фактора компьютерная система рассчитывает коэффициент. С помощью машинного обучения система учится сама понимать значимость факторов, основываясь на данных от специалистов-асессоров (они просматривают некоторые наборы сниппетов, вручную разделяют их на хорошие и плохие и сообщают эти оценки системе). Затем компьютерная система уже без помощи людей строит формулу, по которой создает сниппеты.

Оформление результатов поиска

Результат поиска оформляется так, чтобы пользователю было легче его воспринимать. Заголовки выделены синим цветом и подчеркнуты — так на веб-страницах традиционно выделяются ссылки. Узнать знакомый ресурс помогает фавиконка — небольшой фирменный значок сайта — слева от заголовка результата поиска. Если заголовок или текст описания содержит прописные буквы, Яндекс старается сделать их строчными — так проще читать.

А чтобы было легче «зацепиться глазом», все слова из запроса в результатах поиска выделены жирным шрифтом. При этом Яндекс умеет сопоставлять аббревиатуры и их расшифровки, полные имена, сокращения и инициалы, числа и их текстовое написание. Например, по запросу [петр 1] Яндекс найдет документы, которые содержат и «Петр I», и «Петр первый», и выделит в сниппетах разные варианты написания имени.

Чтобы помочь пользователю быстрее понять содержание документа, Яндекс может выделить некоторые слова, которых нет в запросе. Это происходит при ответе на общие, многозначные запросы. Например, для запроса [снежная королева] в разных сниппетах будут дополнительно выделены слова «мультфильм», «сказка», «магазин». Дополнительные слова Яндекс узнаёт, анализируя переформулировки запросов. Специальная программа следит за тем, как пользователи уточняют свои запросы, и рассчитывает значимость таких уточнений. Затем эти знания используются при формировании сниппета.

Дополнительная информация в сниппете

Яндекс старается сделать так, чтобы пользователи могли быстро найти ответ — иногда даже сразу на странице результатов поиска. Для разных ответов нужна разная дополнительная информация. Например, если человек задаёт в запросе название организации, возможно, ему нужно узнать, где она находится или как с ней связаться. Чтобы не пришлось тратить время на поиски страницы с контактами на сайте организации, Яндекс добавляет её телефон и физический адрес с ссылкой на карту в сниппет.

Если Яндексу известна структура сайта, он показывает её пользователю. Над текстом сниппета сайта появляются ссылки на его наиболее посещаемые страницы — чтобы при желании пользователь мог перейти в нужный раздел, тратя меньше кликов и трафика. А адрес документа Яндекс преобразует в навигационную цепочку — названия разделов и подразделов сайта, из которых состоит путь до документа.

Для некоторых предметных областей Яндекс создаёт специальные сниппеты. Например, для страниц с описаниями товаров или для сайтов гостиниц, ресторанов, кинотеатров. Основная информация появляется в сниппете — цена товара, «звёздность» гостиницы, кухня ресторана, количество залов кинотеатра. Благодаря таким специальным сниппетам пользователь экономит время и трафик,

организация получает посетителя сайта, заинтересованного именно в её услугах.

Заключение

Теперь подытожим все вышесказанное.

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
Основные характеристики поисковых систем:

Полнота
Точность
Актуальность
Скорость поиска
Наглядность

В состав поисковой системы входят компоненты:

Модуль индексирования
База данных
Поисковый сервер

Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием поисковых систем, лучше узнать основные функции, характеристики и принцип работы поисковиков.

Список литературы

http://company.yandex.ru/

Информация о работе Происхождение слова «Яндекс»