Автор работы: Пользователь скрыл имя, 21 Ноября 2013 в 16:15, реферат
В 21 веке развитие информационных технологий обусловило переход человеческого сообщества от индустриального к постиндустриальному, или как ещё его называют, информационному. В частности, это проявляется в всё более возрастающем и повсеместном внедрении в нашу жизнь компьютерных. Особое месте в жизни почти каждого жителя нашей планеты Земля занимает World Wide Web – паутина, в сетях который мы крутимся каждый день. В особенности нас привлекает возможность найти информацию практически любой сферы интересов. И в этом нам помогаю автоматизированные информационно-поисковые системы (АИПС). Именно о них я и хотел написать в своём реферате в рамках озвученной темы.
Введение 3
Понятие автоматизированных информационных поисковых систем 4
Как работает поисковая система Google. 5
Как работает поисковая система Яндекс 7
Заключение 9
Список использованной литературы 10
Автоматизированные
ПРИДНЕСТРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
им. Т.Г. Шевченко
Юридический факультет
Реферат
по предмету: «Информационные технологии в юридической деятельности»
на тему: «Автоматизированные информационные системы»
Выполнил: студент 2-го курса 203 группы
очного отделения
специальность «юриспруденция»
Мкртчян Эдвард Араикович
Рецензент: ст. пр. Е.В. Соломатина
Тирасполь, 2013 г.
Оглавление
Введение 3
Понятие автоматизированных информационных поисковых систем 4
Как работает поисковая система Google. 5
Как работает поисковая система Яндекс 7
Заключение 9
Список использованной литературы 10
Введение
В 21 веке развитие информационных технологий обусловило переход человеческого сообщества от индустриального к постиндустриальному, или как ещё его называют, информационному. В частности, это проявляется в всё более возрастающем и повсеместном внедрении в нашу жизнь компьютерных. Особое месте в жизни почти каждого жителя нашей планеты Земля занимает World Wide Web – паутина, в сетях который мы крутимся каждый день. В особенности нас привлекает возможность найти информацию практически любой сферы интересов. И в этом нам помогаю автоматизированные информационно-поисковые системы (АИПС). Именно о них я и хотел написать в своём реферате в рамках озвученной темы.
Интернет, как мировая всеобъемлющая сеть существует относительно недавно, всего несколько десятилетий. Но за этот короткий срок среди АИПС появились лидеры. Это такие поисковые системы, как Google и Yandex. И в качестве примера именно на изучении их работы я подробно хотел остановиться в своей работе.
Таким образом информация в реферате будет носить больше практический, чем теоретический характер, что сегодня, на мой взгляд, более актуально и полезно для современного пользователя сети Интернет.
Для начала необходимо определить
такие понятия, как информационная
система, автоматизированная информационная
система (АИС) и автоматизированная
информационно-поисковая
Информационная система (ИС) – это структурированная совокупность программно–технических и прочих вспомогательных средств, технологических процессов, которые обеспечивают сбор, представление и накопление информационных ресурсов, поиск и выдачу сведений, которые необходимы для удовлетворения информационных потребностей информационных пользователей .
Автоматизированная
Автоматизированная
Пришла очередь самой известной поисковой системы. Без понимания того, как она работает, трудно не только добиться успеха в поднятии рейтинга своего сайта, но и жить вообще.
Тремя ключевыми процессами для Google, позволяющими поисковой системе выдавать наиболее соответствующие поисковым запросам результаты, являются следующие:
Рассмотрим подробно каждый из них.
Сканирование
Сканирование - это процесс, во время которого роботы Google обнаруживают новые и обновленные страницы для добавления в свою базу. Google использует огромное количество компьютеров, чтобы извлечь «просканировать» миллиарды страниц в Интернете.
Программа, которая делает выборку,
называется «Googlebot» (также известна как робот,
бот или паук). Googlebot испол
Процесс сканирования Google начинается со списка URL-адресов(адрес сайта в интернете) веб-страниц, полученных от предыдущего сканирования и дополненных данными карты сайта, предоставляемыми вебмастерами. Когда Googlebot посещает каждый из этих сайтов, он обнаруживает ссылки на другие страницы и добавляет их в список страниц, подлежащих сканированию.
Новые сайты со временем переходят в статус существующих, «мертвые» (т.е. не ведущие никуда) ссылки выявляются и данные используется для обновления индекса (базы данных) Google. Google не принимает плату за то, чтобы сканировать чей-то сайт чаще: они предпочитают держать отдельно поисковый сервис от своих приносящих доход услуг AdWords (рекламные услуги).
Индексация
Индексация – процесс обработки роботом Google каждой из страниц, на которую он заходит, в целях формирования массивных баз данных из всех слов, которые он распознает и расположения этих слов на каждой из страниц. Кроме того, Google обрабатывает информацию, расположенную в ключевых тегах и атрибутах, таких как title тегах(Определяют заголовок документа) и атрибутах alt(устанавливает альтернативный текст для изображений).
Googlebot может обрабатывать многие,
но не все типы контента(
Обработка.
Обработка наступает в момент, когда пользователь вводит поисковый запрос, тогда поисковая система заходит в свою базу данных (индекс) для подбора наиболее соответствующих запросу страниц и возвращается с результатами, которые являются наиболее соответствующими для пользователей.
Соответствие определяется с помощью более, чем 200 факторов, одним из которых является PageRank (PR) данной страницы. PR - это мера важности страницы на основе входящих ссылок с других страниц. Проще говоря, каждая ссылка на страницу вашего сайта с другого сайта, добавляет PageRank вашему сайту.
Не все ссылки равны: Google работает над улучшением условий работы пользователей путем выявления спам-ссылок и других методов, которые негативно влияют на результаты поиска. Лучшими ссылками считаются те, которые даны, основываясь на качестве контента.
Для того, чтобы ваш сайт
занял хорошее место в
Работа поисковой системы Яндекс представляет собой работу поисковых роботов, которые переходя по прямым ссылкам, индексируют сайты, сохраняя странички к себе в базу. Эти поисковые роботы никогда не переходят по редиректным ссылкам (специальное перенаправление), переходить по таким ссылкам они не умеют. Странички они к себе закачивают не полностью, они не видят скриптов (программный код), картинок, флеш-анимаций. Вместо самой картинки, Яндекс будет видеть только ее название в виде html кода.
Поисковые роботы бывают двух типов: обычные роботы и быстрые роботы. Как узнать каким роботом проиндексирована страница? Узнать это можно довольно просто:
Если в результатах поиска около страницы (сайта) возле фразы «сохраненная копия» есть надпись «5 часов назад», это значит, что на нее заходил быстрый робот. При этом страница, которая проиндексирована пока что еще только быстрым роботом в результатах поиска может еще не участвовать и может выпасть из индекса. Так что нужно дождаться пока на сайт не зайдет обычный робот и не проиндексирует вашу страницу.
Яндекс выстраивает сайты в определенном порядке. На что он опирается при построении выдачи? Существуют три основных фактора.
То есть, если мы введем в
поисковике слово «квартиры», Яндекс
выстроит сайты с учетом частоты количества
слов "квартиры" в тексте.
Условно можно предположить, что в тексте
сайта, стоящего на первом месте, будет
чаще встречаться слово "квартиры", чем на сайте, стоящем на более
низком месте. Почему условно можно
предположить, потому что это не значит,
что если сайт на первой позиции, то в его
контенте больше ключевых слов. Просто
у такого сайта, допустим, может быть большой
вес и он просто перекрывает большее количество
ключевиков на сайте стоящем ниже, то есть
его вес играет значительно большую роль,
чем количество ключевых слов другого
более слабого по весу сайта но с большим
количеством ключевиков.
Чем больше внешних
ссылок на сайт, тем выше он в поисковой
выдаче. Также большое значение имеет авторитетность
сайта, который на вас ссылается. То есть одна ссылка с авторитетного
сайта может заменить, к примеру, тридцать
ссылок со слабых сайтов.
Яндекс так и думает, что если этот сайт А ссылается на сайт В, то значит на сайте В есть что-то интересное, и должно
быть оно будет полезно посетителям, значит
надо его поднять в поисковой выдаче. Следовательно чем
выше в глазах поисковика сайт, тем больший
эффект даст ссылка с него.
К сожалению, нет такого показателя
веса сайта, но есть некоторые, косвенные
признаки, по которым мы можем определить
насколько весомый сайт или страница.
Так вот существуют такие показатели или тематический
индекс цитирования - ТИЦ, придуманный поисковой системой
Яндекс. И придуманный - google pagerank
PR.
Условно можно предположить, что чем больше
эти показатели, тем больший вес сайт имеет,
если у ресурса большой ТИЦ, то на него
стоит много ссылок, значит сайт имеет
большой вес. Также по PR можно предположить,
что если страница имеет не нулевой PR,
то эта страница весома.
В своей работе я постарался
максимально познавательно и
лаконично изложить наиболее актуальный
материал, касающийся наиболее популярных
информационно-поисковых
Список использованной литературы:
Материалы сайтов:
Мкртчян Эдвард 203 группа
Информация о работе Автоматизированные информационные системы