Автор работы: Пользователь скрыл имя, 24 Апреля 2014 в 20:44, контрольная работа
Основная задача Интернет – предоставление необходимой информации. Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По даннымМинкомсвязи РФ на начало 2012 года количествопользователейИнтернета в России составило 70 млн. человек (всё население РФ - 143 млн. чел.). В течении года доля россиян, пользующихся интернетом, продолжала расти.
Введение.
«Появившись около двадцати лет назад, Интернет изменил все, что нас окружает, но эти перемены – ничто по сравнению с тем, что нам еще предстоит», – заявил на днях глава компании Cisco Джон Чемберс (John Chambers).
Основная задача Интернет – предоставление необходимой информации. Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей. Любой пользователь, располагающий ПК и соответствующими программами, сможет подключиться к сети, используя её возможности для самых разных целей – проведения досуга, обучения, чтения научных работ, отправки электронной почты и т.д. По данным Минкомсвязи РФ на начало 2012 года количество пользователей Интернета в России составило 70 млн. человек (всё население РФ - 143 млн. чел.). В течении года доля россиян, пользующихся интернетом, продолжала расти.
Более или менее серьезный подход
к любой задаче начинается с анализа возможных
методов ее решения. Поиск информации
в Интернете может быть произведен по
нескольким методам, значительно различающимся
как по эффективности и качеству поиска,
так и по типу извлекаемой информации.
В ряде случаев приходится использовать
весьма трудоемкие методы - результат
того стоит.
Можно выделить следующие основные методы
поиска информации в Интернете, которые,
в зависимости от целей и задач ищущего,
используются по отдельности или в комбинации
друг с другом:
1. Непосредственный поиск с использованием
гипертекстовых ссылок.
Поскольку все сайты в пространстве WWW
фактически оказываются связанными между
собой, поиск информации может быть произведен
путем последовательного просмотра связанных
страниц с помощью броузера.
Хотя этот полностью ручной метод поиска
выглядит полным анахронизмом в Сети,
содержащей более 60 млн. узлов, "ручной"
просмотр Web-страниц часто оказывается
единственно возможным на заключительных
этапах информационного поиска, когда
механическое "копание" уступает
место более глубокому анализу. Использование
каталогов, классифицированных и тематических
списков и всевозможных небольших справочников
также относится к этому виду поиска.
2. Использование поисковых машин.
Сегодня этот метод является одним из
основных и фактически единственным при
проведении предварительного поиска.
Результатом последнего может являться
список ресурсов Cети, подлежащих детальному
рассмотрению.
Как правило, применение поисковых машин
основано на использовании ключевых слов,
которые передаются поисковым серверам
в качестве аргументов поиска: что искать.
Если делать все правильно, то формирование
списка ключевых слов требует предварительной
работы по составлению тезауруса.
3. Поиск с применением специальных средств.
Этот полностью автоматизированный метод
может оказаться весьма эффективным для
проведения первичного поиска. Одна из
технологий этого метода основана на применении
специализированных программ - спайдеров,
которые в автоматическом режиме просматривают
Web-страницы, отыскивая на них искомую
информацию. Фактически это автоматизированный
вариант просмотра с помощью гипертекстовых
ссылок, описанный выше (поисковые машины
для построения своих индексных таблиц
используют похожие методы). Нет нужды
говорить, что результаты автоматического
поиска обязательно требуют последующей
обработки.
Применение данного метода целесообразно,
если использование поисковых машин не
может дать необходимых результатов (например,
в силу нестандартности запроса, который
не может быть адекватно задан существующими
средствами поисковых машин). В ряде случаев
этот метод может быть очень эффективен.
Выбор между использованием спайдера
или поисковых серверов являет собой вариант
классического выбора между применением
универсальных или специализированных
средств.
4. Анализ новых ресурсов.
Поиск по новообразованным ресурсам может
оказаться необходимым при проведении
повторных циклов поиска, поиска наиболее
свежей информации или для анализа тенденций
развития объекта исследования в динамике.
Другой возможной причиной может явиться
то, что большинство поисковых машин обновляет
свои индексы со значительной задержкой,
вызванной гигантскими объемами обрабатываемых
данных, и эта задержка обычно тем больше,
чем менее популярна интересующая тема.
Это соображение может оказаться весьма
существенным при проведении поиска в
узкоспециальной предметной области.
Краткая история INTERNET.
Вначале ничто не предвещало,
что INTERNET станет общедоступной компьютерной
сетью. Как и многие другие великие идеи,
"Сеть сетей" возникла из проекта,
предназначавшегося совершенно для других
целей. Ее прародительницей стала сеть
АRPANET, разработанная и развернутая в 1969г.
компанией Bolt, Beranek, and Newman (BBN) по заказу
Агентства передовых исследовательских
проектов (ARPA) Министерства обороны США.
ARPANET объединяла учебные заведения, военные
организации и их подрядчиков. Она была
создана с целью помочь исследователям
в обмене информацией, а также (что явилось
одной из главных целей) для отработки
методов поддержания связи в случае ядерного
нападения.
Основатели ARPANET первоначально позволяли
ученым только войти в систему и запустить
программу на удаленном компьютере. Скоро
к этим возможностям прибавились передача
файлов, электронная почта и списки рассылки,
обеспечившие общение исследователей,
интересовавшихся одной и той же областью
науки и техники. Но по мере роста ARPANET
развивались и другие сети, и вскоре стала
очевидной потребность в новых средствах
связи.
В 1990 году появилась новая технология
INTERNET названная World Wide Web (WWW), что обычно
переводится как "Всемирная паутина".
Эта система была разработана, в основном,
в Европейской лаборатории элементарных
частиц в Швейцарии (CERN). Сеть предназначалась
первоначально для физиков, но затем получила
широкое признание.
WWW построена по технологии, в основе которой
лежит принцип создания гипертекстовых
документов (Web-страниц). Гипертекстовый
документ заключает в себе ссылки на другие
подобные документы, которые, в свою очередь,
содержат ссылки на следующие, и т.д. Таким
образом, они оказываются связанными между
собой.
Для работы в WWW используется протокол
HTTP (Hyper Text Transmission Protocol), а программы, позволяющие
работать с соответствующими документами
в INTERNET, называют просмотрщиками или браузерами.
Что такое INTERNET.
INTERNET - глобальная компьютерная
сеть, охватывающая весь мир. Сегодня
INTERNET имеет более 30 миллионов абонентов
и практически в любой точке мира. Ежемесячно
размер сети увеличивается на 5-7%. INTERNET
образует как бы ядро, обеспечивающее
связь различных информационных сетей,
принадлежащих различным учреждениям
во всем мире, одна с другой.
Всплеск интереса к глобальной информационной
сети INTERNET наблюдается сейчас повсеместно.
В сложившихся условиях потребность в
информации о сети INTERNET становится особенно
острой. В настоящее время по INTERNET распространяется
множество документов, касающихся как
функционирования сети и работы в ней
пользователей, так и связанных с различными
сферами жизни: наукой, культурой, экономикой
и т.д. При чём обновление информации в
INTERNET, обширной разветвленной сети, которая
включает в себя компьютерные узлы, разбросанные
по всему миру, происходит, практически,
в режиме реального времени.
В действительности INTERNET не просто сеть,
- она есть структура, объединяющая обычные
сети. INTERNET - это "Сеть сетей".
Чтобы описать сегодняшнюю INTERNET, полезно
воспользоваться строгим определением.
В своей книге "The Matrix: Computer Networks and Conferencing
Systems Worldwide" Джон Квотерман описывает
INTERNET как "метасеть, состоящую из многих
сетей, которые работают согласно протоколам
семейства TCP/IP, объединены через шлюзы
и используют единое адресное пространство
и пространство имен".
Для организации межсетевых соединений
необходим соответствующий протокол.
Протокол - это набор договоренностей,
который определяет обмен данными между
различными программами. Протоколы задают
способы передачи сообщений и обработки
ошибок в сети, а также позволяют разрабатывать
стандарты, не привязанные к конкретной
аппаратной платформе. Все параметры -
от скорости передачи данных до методов
адресации при транспортировке отдельных
сообщений - задаются протоколами, используемыми
в данной конкретной сети.
В INTERNET базовым протоколом служит TCP/IP
(Transmission Control Protocol/Internet Protocol). IP отвечает
за адресацию сетевых узлов, а TCP обеспечивает
доставку сообщений по нужному адресу.
Эти мощные протоколы были предложены
в 1974 г. Робертом Кэном, одним из основных
разработчиков ARPANET, и ученым-компьютерщиком
Винтоном Серфом, вице-президентом CNRI.
Следует иметь в виду, что TCP/IP не единственный
протокол, пригодный для объединения различных
сетей. INTERNET ныне превратилась в многопротокольную
сеть, интегрирующую другие стандарты.
Основные среди них - стандарты взаимодействия
открытых систем (OSI).
Предложенные Международной организацией
по стандартизации (ISO) протоколы OSI получили
широкое распространение в Европе. Системы,
основанные на других протоколах, тоже
подключаются к INTERNET через шлюзы. Например,
BITNET - это сеть, которая использует для
передачи данных свои собственные стандарты,
однако, по крайней мере, частично, она
доступна через шлюзы из INTERNET.
В INTERNET нет единого пункта подписки или
регистрации; вместо этого вы контактируете
с поставщиком услуг, который предоставляет
вам доступ к сети через местный компьютер.
Последствия такой децентрализации с
точки зрения доступности сетевых ресурсов
также весьма значительны. Среду передачи
данных в INTERNET нельзя рассматривать только
как паутину проводов или оптоволоконных
линий. Оцифрованные данные пересылаются
через маршрутизаторы, которые соединяют
сети и с помощью сложных алгоритмов выбирают
наилучшие маршруты для информационных
потоков.
ПОИСКОВЫЕ СИСТЕМЫ.
Основная задача INTERNET - предоставление
необходимой информации. Чтобы найти нужную
информацию необходимо знать адрес Web-страницы,
на которой эта информация находится.
Лучше всего искать в Сети необходимую
информацию с помощью поисковых систем.
Поисковая система представляет собой
специализированный Web-узел. Поисковые
системы классифицируют по методам поиска.
Поисковые каталоги предназначены для
поиска по темам. Обычно они построены
по иерархическому принципу, т.е. каждый
шаг поиска это выбор подраздела с более
конкретной тематикой искомой информации.
На нижнем уровне поиска пользователь
получает относительно небольшой список
ссылок на искомую информацию.
Поисковый индекс обеспечивает поиск
по заданным ключевым словам. Обычно ключевые
слова вводятся при заполнении специальной
формы поиска, после чего нажимается кнопка
"Поиск". В результате поиска формируется
набор гиперссылок на Web-страницы, содержащий
указанные термины. Обычно поисковые индексы
выдают огромное количество искомых страниц.
В этом списке представлены ссылки на
различные Web-страницы, причем ссылки располагаются
по степени убывания встреченных на данных
страницах слов, совпадающих с ключевыми
словами. При просмотре списка необходимо
выбрать те страницы, которые нужно просмотреть.
Некоторые системы составляют список
ссылок по степени свежести страниц, другие
же - по степени вероятности того, что данные
страницы окажутся искомыми. Вычисление
вероятности основывается на данных о
том, как скоро на странице встречается
искомое слово. Первыми в таком списке
идут ссылки на те страницы, у которых
ключевые слова встречаются уже в названии.
Поисковые каталоги предоставляют доступ
к меньшему количеству страниц, чем поисковые
индексы, но они точнее указывают на основные
ресурсы Сети. Поэтому при первичном поиске
информации целесообразно использовать
поисковые каталоги. А квалифицированным
пользователям Internet более полезны поисковые
индексы. Они позволяют разыскать малоизвестные
и узкоспециализированные ресурсы. Многие
современные поисковые системы сочетают
в себе оба указанных метода.
Программа INTERNET EXPLORER 5.0 имеет специальные
средства организации поиска без явного
обращения к поисковым системам. Можно
получить доступ к одной из известных
поисковых систем, просто щелкнув на кнопке
"Поиск", слева появится окно поиска.
Далее можно набрать ключевые слова для
поиска и выбрать поисковую систему. Результаты
поиска будут отражены в правой части
окна обозревателя. Если выбрать нужную
ссылку, то в правом окне появится содержимое
выбранной страницы. Чтобы скрыть окно
поиска, необходимо щелкнуть на кнопке
"Поиск" еще раз.
При работе с INTERNET ЕХРLORER можно проводить
поиск прямо в поле "Адрес". Для этого
в адресную строку вводиться слово или
фраза для поиска. Под адресной строкой
откроется окно со словом "Поиск"
и искомой фразой. INTERNET EXPLORER начнет поиск
с использованием заранее определенной
системы поиска; при этом кнопка "Поиск"
на панели инструментов нажмется сама.
Можно осуществить поиск нажав кнопку
"Пуск" и выбрав опцию меню "Найти".
Окно INTERNET EXPLORER откроется само с уже нажатой
кнопкой "Поиск".
Если удалось найти то, что искали, но все
же не совсем то, то в этом случае пригодится
механизм связанных ссылок. Для любой
Web-страницы можно просмотреть список
ссылок, имеющих к ней отношение, возможно,
среди них окажется как раз то, что нужно.
Чтобы просмотреть связанные ссылки, нужно
сделать следующее. Необходимо выбрать
в меню "Сервис" команду "Показать
связанные ссылки".
После этого на панели инструментов нажать
кнопку "Поиск", и в левой части экрана
полнится окно, содержащее список ссылок,
связанных с данной страницей. Нужно щелкнуть
на одной из ссылок, и просмотреть в правом
окне соответствующую Web-страницу.
Чтобы скрыть окно поиска, необходимо
щелкнуть еще раз на кнопке "Поиск".
Механизмы поиска.
Поисковые cистемы обычно состоят
из трех компонентов:
* агент (паук или кроулер), который перемещается
по Сети и собирает информацию;
* база данных, которая содержит всю информацию,
собираемую пауками;
* поисковый механизм, который люди используют
как интерфейс для взаимодействия с базой
данных.
Cредства поиска и структурирования, иногда
называемые поисковыми механизмами, используются
для того, чтобы помочь людям найти информацию,
в которой они нуждаются.
Cредства поиска типа агентов, пауков,
кроулеров и роботов используются для
сбора информации о документах, находящихся
в Сети Интернет. Это специальные программы,
которые занимаются поиском страниц в
Сети, извлекают гипертекстовые ссылки
на этих страницах и автоматически индексируют
информацию, которую они находят для построения
базы данных.
Каждый поисковый механизм имеет собственный
набор правил, определяющих, как cобирать
документы. Некоторые следуют за каждой
ссылкой на каждой найденной странице
и затем, в свою очередь, исследуют каждую
ссылку на каждой из новых страниц, и так
далее. Некоторые игнорируют ссылки, которые
ведут к графическим и звуковым файлам,
файлам мультипликации; другие игнорируют
cсылки к ресурсам типа баз данных WAIS; другие
проинструктированны, что нужно просматривать
прежде всего наиболее популярные страницы.
Агенты - самые "интеллектуальные"
из поисковых средств. Они могут делать
больше, чем просто искать: они могут выполнять
даже транзакции от Вашего имени. Уже сейчас
они могут искать cайты специфической
тематики и возвращать списки cайтов, отсортированных
по их посещаемости. Агенты могут обрабатывать
содержание документов, находить и индексировать
другие виды ресурсов, не только страницы.
Они могут также быть запрограммированы
для извлечения информации из уже существующих
баз данных. Независимо от информации,
которую агенты индексируют, они передают
ее обратно базе данных поискового механизма.
Агенты извлекают и индексируют различные
виды информации. Некоторые, например,
индексируют каждое отдельное слово во
встречающемся документе, в то время как
другие индексируют только наиболее важных
100 слов в каждом, индексируют размер документа
и число слов в нем, название, заголовки
и подзаголовки и так далее. Вид построенного
индекса определяет, какой поиск может
быть сделан поисковым механизмом и как
полученная информация будет интерпретирована.
Агенты могут также перемещаться по INTERNET
и находить информацию, после чего помещать
ее в базу данных поискового механизма.
Администраторы поисковых систем могут
определить, какие сайты или типы сайтов
агенты должны посетить и проиндексировать.
Проиндексированная информация отсылается
базе данных поискового механизма так
же, как было описано выше.
Общий поиск информации в Сети осуществляют
программы, известные как пауки. Пауки
сообщают о содержании найденного документа,
индексируют его и извлекают итоговую
информацию. Также они просматривают заголовки,
некоторые ссылки и посылают проиндексированную
информацию базе данных поискового механизма.
Кроулеры просматривают заголовки и возвращают
только первую ссылку.
Роботы могут быть запрограммированы
так, чтобы переходить по различным cсылкам
различной глубины вложенности, выполнять
индексацию и даже проверять ссылки в
документе. Из-за их природы они могут
застревать в циклах, поэтому, проходя
по ссылкам, им нужны значительные ресурсы
Сети. Однако, имеются методы, предназначенные
для того, чтобы запретить роботам поиск
по сайтам, владельцы которых не желают,
чтобы они были проиндексированы.
Люди могут помещать информацию прямо
в индекс, заполняя особую форму для того
раздела, в который они хотели бы поместить
свою информацию. Эти данные передаются
базе данных.
Когда кто-либо хочет найти информацию,
доступную в INTERNET, он посещает страницу
поисковой системы и заполняет форму,
детализирующую информацию, которая ему
необходима. Здесь могут использоваться
ключевые слова, даты и другие критерии.
Критерии в форме поиска должны соответствовать
критериям, используемым агентами при
индексации информации, которую они нашли
при перемещении по Сети.
База данных отыскивает предмет запроса,
основанный на информации, указанной в
заполненной форме, и выводит соответствующие
документы, подготовленные базой данных.
Чтобы определить порядок, в котором список
документов будет показан, база данных
применяет алгоритм ранжирования. В идеальном
случае, документы, наиболее релевантные
пользовательскому запросу будут помещены
первыми в списке. Различные поисковые
системы используют различные алгоритмы
ранжирования, однако, основные принципы
определения релевантности следующие:
1. Количество слов запроса в текстовом
содержимом документа.
2. Тэги, в которых эти слова располагаются.
3. Местоположение искомых слов в документе.
4. Удельный вес слов, относительно которых
определяется релевантность, в общем количестве
слов документа.
База данных выводит ранжированный подобным
образом список документов с HTML и возвращает
его человеку, сделавшему запрос.
Различные поисковые механизмы также
выбирают различные способы показа полученного
списка - некоторые показывают только
ссылки; другие выводят cсылки c первыми
несколькими предложениями, содержащимися
в документе или заголовок документа вместе
с ccылкой.
Когда Вы щелкаете на ссылке к одному из
документов, который вас интересует, этот
документ запрашивается у того сервера,
на котором он находится.
ЗАКЛЮЧЕНИЕ.
С развитием INTERNET появилась возможность
быстрого и удобного поиска необходимой
документальной информации. Теперь можно
не заниматься подбором и изучением огромного
количества литературы в книжных магазинах
и библиотеках. Информацию можно получить,
не выходя из дома или офиса. Для этого
нужен только непосредственно сам компьютер,
подключенный к INTERNET с установленной специальной
программой - браузером, предназначеной
для просмотра содержимого Web-страниц.
Благодаря разнообразию поисковых систем,
специально разработанным для рядового
пользователя, каждый может без труда
отсечь заведомо ненужный поток информации,
лишь правильно сформулировав цель поиска.
СПИСОК ИСПОЛЬЗОВАННОЙ
ЛИТЕРАТУРЫ.
1. М. Пайк. Internet . СПб., 1996.
2. 3. Энциклопедия Интернет, СПб, 2001
4. Информатика. Базовый курс. Учебник для
ВУЗов, СПб, 2001
5. How the browsers compare//http://www.microsoft.
6. Нэш К.//Война браузеров.-Сети.-1997г.-№1.-с.
7. Крол Эд//Всё об Internet.-Киев.-Торгово-изд.
бюро BHV.-1995г.-с.33.
8. Крол Эд//Всё об Internet.-Киев.-Торгово-изд.
бюро BHV.-1995г.-с.50.
9. Крол Эд//Всё об Internet.-Киев.-Торгово-изд.
бюро BHV.-1995г.-с.100.