Методы информационного эффективного поиска и обмена информацией

Автор работы: Пользователь скрыл имя, 30 Апреля 2013 в 23:28, дипломная работа

Краткое описание

Целью данной бакалаврской работы является рассмотрение практического поиска и обмена информации в сети Интернет.
Для этого необходимо решить следующие задачи:
- анализ возможностей сети Интернет, технология поиска и обмена информации в нем;
- рассмотреть приемы эффективного поиска и обмена информацией.
Предметом исследования в работе являются сеть Интернет и ее возможностей, служб, методов мониторинга и подходов оценки релевантности найденных документов.

Содержание

Введение……………………………………………………………
3
1 Возможности Интернет стратегии поиска и обмена информацией……………………………………………………………..

7
1.1 Анализ и классификация методов мониторинга при поиске информации..........................................................................................

7
1.2 Передача информации в Интерне…………………………..
10
1.3 Поисковые системы, понятие поисковые индексов и каталогов………………………………………………………………...

17
2 Методы информационного эффективного поиска и обмена информацией…………………………………………………………….

34
2.1 Поиск и оценка найденной информации…………………...
34
2.2 Проблемы поиска теоретической научной информации в Интернет………………………………………………………………….

38
2.3 Интеллектуальные системы и перспективы поиска информации……………………………………………………………...

43
Заключение………………………………………………………...
53
Глоссарий………………………………………………………….
57
Список использованных источников…………

Прикрепленные файлы: 1 файл

Диплом информатика (1).doc

— 1.05 Мб (Скачать документ)

В истории Интернет существовали разные виды сервисов, одни из которых в настоящее время уже не используются, другие постепенно теряют свою популярность, в то время как третьи переживают свой расцвет.

Ряд из них не потеряли своей актуальности на данный момент:

  • World Wide Web – всемирная паутина – служба поиска и просмотра гипертекстовых документов, включающих в себя графику, звук и видео.
  • E-mail – электронная почта – служба передачи электронных сообщений.
  • Usenet, News – телеконференции, группы новостей – разновидность сетевой газеты или доски объявлений.
  • FTP – служба передачи файлов.
  • ICQ – служба для общения в реальном времени с помощью клавиатуры.
  • Telnet – служба удаленного доступа к компьютерам.
  • Gopher – служба доступа к информации с помощью иерархических каталогов.

Среди этих служб можно  выделить службы, предназначенные для  коммуникации, то есть для общения, передачи информации (E-mail, ICQ), а также  службы, назначение которых – это  хранение информации и обеспечение  доступа к этой информации пользователей.

Появляются и новые  возможности передачи информации посредством  Интернет: IP –телефония, Skype.

Использование коммуникаторов их популярность во многом определена именно возможностью обмена информацией  через Интернет. Мобильный Интернет включает громадное количество сервисов - это и просмотр различных сообщений, организация видеосвязи, традиционный поиск информации, оплата услуг и т.д.

Существенный сдвиг  в развитии Интернет произошёл с  появлением группы сервисов, основанных на активном участии пользователей в формировании контента. Основное внимание здесь уделяется организации взаимодействия между пользователями сервиса в виде публичного обмена информационными ресурсами (текстовыми сообщениями, фотографиями, видеофрагментами и др.), взаимного оценивания и маркировки содержания. Эти сервисы получили название «социальных сервисов» и составили основу современной концепции развития сети Интернет, которая получила название Web 2.0. Основным источником информации в Web 2.0 являются обычные пользователи, каждый из которых может принять участие в развитии сети

В Web 2.0 изначально сайт представляет собой не сборник содержания, которое может заинтересовать посетителя, а некое пространство, где пользователь имеет возможность проявить собственную активность: загрузить фотографии или видеоролики (Flickr и YouTube и др.), опубликовать свою статью (например, блоги и др.), разместить свои анкетные данные (ВКонтакте, Одноклассники.Ру и др.). То есть Web 2.0 -сайт, не являясь изначально коллекцией контента, постепенно – за счет высокой пользовательской активности – становится интересен и значим.

Последовательное развитие сети Интернет создает все новые  возможности поиска и обмена информацией.

Анализ существующих систем показывает, что наибольшее использование для поиска информации приходится на поисковую систему Google, так как главная задача поиска это точность и полнота предоставляемых данных. Также можно отметить, что значительно возросли рейтинги российских поисковых систем. Российская или зарубежная предоставляет различные возможности поиска, из различных баз данных, поэтому сказать точно какой именно лучше пользоваться достаточно трудно. Увеличивается доля поиска информации и средствами в социальных сетях. Значительно возрастает роль интеллектуальных метопоисковых систем – таких как NIGMA. Дальнейшее развитие информационно-поисковых систем видимо все больше будет основываться на методах искусственного интеллекта.

 

Глоссарий

 

п/п

Новые понятия

Содержание

1

Аутентификация

проверка принадлежности субъекту доступа предъявленного им идентификатора; подтверждение подлинности.

2

Браузер

программное обеспечение для просмотра веб-сайтов, то есть для запроса веб-страниц их обработки, вывода и перехода от одной страницы к другой.

3

Всемирная паутина

распределенная система, предоставляющая доступ к связанным  между собой документам, расположенным  на различных компьютерах, подключенных к интернету.

4

Качество информации

совокупность свойств, обусловливающих пригодность информации удовлетворять определенные потребности  ее пользователей в соответствии с назначением информации.

5

Конфиденциальность  информации

это известность ее содержания только имеющим соответствующие полномочия субъектам

 

Коэффициент точности поиска

отношение числа найденных  релевантных документов к общему числу выданных документов.

 

Коэффициент полноты  поиска

отношение числа найденных  релевантных документов к общему числу релевантных документов, имеющихся в информационном массиве.

6

Операционная  система

комплекс управляющих  и обрабатывающих программ, которые, с одной стороны, выступают как интерфейс между устройствами вычислительной системы и прикладными программами, а с другой — предназначены для управления устройствами, управления вычислительными процессами, эффективного распределения вычислительных ресурсов между вычислительными процессами и надёжных вычислений.

7

Пертинентность

практически полный синоним  релевантности. Иногда имеет дополнительное значение «КПД информационной полезности»  – то есть отношения нужной пользователю информации ко всему полученному на запрос объему данных. В этом смысле пертинентность – метрика качества поисковой выдачи

8

Поисковая машина

комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы.

9

Поисковая система

программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.

10

Протокол передачи гипертекста HTTP

Является протоколом прикладного уровня для распределенных мультимедийных информационных систем.

11

Протокол telnet

Обеспечивает передачу потока байтов между процессами, а  также между процессом и терминалом.

12

Релевантность

в поисковых системах - мера соответствия результатов поиска задаче поставленной в запросе..

13

Тематический  каталог

сайт либо раздел сайта, который содержит упорядоченный  по тематике набор ссылок на другие сайты.

14

Целостность данных

свойство, при выполнении которого данные сохраняют заранее  определенный вид и качество.

15

Электронная почта

технология и предоставляемые ею услуги по пересылке и получению электронных сообщений (называемых «письма» или «электронные письма») по распределённой (в том числе глобальной) компьютерной сети.

16

BitTorrent

сетевой протокол для кооперативного обмена файлами через Интернет.

17

ICQ

российская, а до 2010 года американская централизованная служба мгновенного обмена сообщениями сети интернет, в настоящее время принадлежащая инвестиционному фонду Digital Sky Technologies (Россия).

18

IRC

сервисная система, при  помощи которой можно общаться через  сеть Интернет с другими людьми в режиме реального времени.

19

FTP (File Transfer Protocol)

Протокол пересылки  файлов, который реализует удаленный  доступ к файлу.

20

HTML

(от англ. HyperText Markup Language — «язык разметки гипертекста») - стандартный язык разметки документов во Всемирной паутине.

21

Spiders

один из видов роботов, непрерывно "ползают" по Web, "перепрыгивая" с одной страницы на другую, с целью сбора статистических данных о самой Web либо формирования централизованной базы данных с индексами содержимого Web.


 

 

Список использованных источников

 

1. Аликберов, А. Как работают роботы поисковых машин : [Электронный ресурс]. – Режим доступа: http://www.citforum.ru/internet/search/art_1.shtml

2. Басов, В.И. Цифровые интегральные сети связи [Текст] / В.И. Басов, Г.И. Загарий, В.Н. Самсонкин, Ю.Н. Терещенко. - Харьков: Регион-информ, 2008. – 168 с. - ISBN: 5-93517-169-4.

3. Берлин, А.Н. Коммутация в системах и сетях связи [Текст] / А.Н. Берлин - М.: Эко-Трендз, 2006. – 344 c. - ISBN: 5-88405-073-9

4. Бжезинский, К.М., Сети ISDN [Текст] / К.М Бжезинский. - М.: Горячая Линия - Телеком, 2006. – 264 с. - ISBN: 5-93517-233-4

5. Боккер, П. Цифровая связь с интеграцией служб. Понятия, методы, системы [Текст] / П. Боккер. - М.: Радио и связь; 2007. – 304 с. - ISBN: 5-256-01198-8

6.Бройдо, В.Л. Вычислительные системы, сети и телекоммуникации [Текст] : Учебник для вузов / В.Л. Бройдо. - СПб., 2006. – 704 с. - ISBN: 5-94723-634-6

7. Вивек, О. Структура и реализация современной технологии MPLS [Текст] / О. Вивек. – М.: Вилямс, 2007. - 480 с. - ISBN: 5-8459-0633-4

8. Волкова, В.Н. Основы теории систем и системного анализа [Текст] : Учебник для студентов вузов, обучающихся по специальности «Системный анализ и управление» / В.Н. Волкова, А.А. Денисов. - изд. 2-е, перераб. и доп. - СПб.: Изд-во СПбГТУ, 2007. - 512 с.

9. Галичский, К.В. Компьютерные системы в телефонии [Текст] / К.В. Галичский. - СПб.: BHV-СПб, 2005. – 400 с. - ISBN: 5-94157-253-0

10. Галкин, В.А. Телекоммуникации и сети [Текст] : Учебное пособие для вузов / В Галкин, Ю Григорьев. - М.: Лори-пресс, 2007. – 608 с.- ISBN: 5-7038-1961-2

11. Гленн, У. Проектирование инфраструктуры Active Directory и сети на основе Microsoft Windows Server 2003 [Текст] / У. Гленн, М.Т. Симпсон - СПб.: Русская Редакции, 2005. – 592 с. - ISBN: 5-7502-0031-0

12. Гургенидзе, А.Т. Мультисервисные сети и услуги широкополосного доступа [Текст] / А.Т. Гургенидзе, В.И. Кореш. – М.: Наука и Техника, 2008. - 390 с. - ISBN: 5-94687-108-5

13. Джеймс, С. ISDN: Просто и доступно [Текст] / С. Джеймс. - М: Лори, 2006. – 304 с. - ISBN: 5-85582-047-5

14. Костров, Б.В. Телекоммуникационные системы и вычислительные сети [Текст] / Б.В Костров. - М.: Техно-BOOK, 2007. – 256 с. - ISBN: 5-9605-0126-6

15. Крухмалев, В.В. Основы построения телекоммуникационных систем и сетей [Текст] / В.В. Крухмалев, В. Гордиенко, А. Моченов, А. Крыжановский, Л. Марыкова. - М.: Горячая линия - Телеком, 2007. – 510 с. - ISBN: 5-93517-202-1

16.Лихтциндера, Б.Я. Мультисервисные АТМ сети [Текст] / Б.Я. Лихтциндера. - М.: Эко-Трендз, 2005. – 320 с. - ISBN: 5-88405-062-3

17. Передача информации в Интернете [Электронный ресурс]. – Режим доступа: http://msschool2.narod.ru/1.htm

18. Полонская Е.Л. Самоучитель. Язык HTML.(HTML человеческим языком (для чайников и блондинок)) [Текст] / Е.Л. Полонская - СПб.: Издательский дом Вильяме, 2007. - 320 с. - ISBN: 5-8459-0466-8

19. Пятибратов, А.П. Вычислительные системы, сети и телекоммуникации [Текст] / А.П. Пятибрато, С. Мак-Квери, К. Мак-Грю, Л. Фой. – М.: Финансы и статистика, 2005. – 512 с. - ISBN: 5-279-02301-9

20. Рейтинг поисковых систем Internet [Электронный ресурс]. – Режим доступа: http://fevt.ru/news/rejting_ps_internet/2010-04-22-140

21. Родичев, Ю.А. Компьютерные сети - архитектура, технологии, защита [Текст] / Ю.А. Родичев. – М.: Универс – групп, 2006 - 390 с. - ISBN: 5-467-00067-5

22. Семантический Web: [Электронный ресурс]. – Режим доступа: http://infomesh.net/2001/swintro

23. Симонович, С.В. Информатика: Базовый курс [Текст] / С.В. Симонович. – М.: СПб.: Питер, 2006. - 455 с. - ISBN 56504-2140-5346324-124640

24. Степанов, В. С компьютером на ты [Текст] / В. Степанов. - М.: Юнити, 2006. – 168 с. – ISBN 151243-5435-143

 25.Титоренко, Г.А. Информационные технологии управления [Текст] / Г.А. Титоренко. - М.: Юнити, 2008. – 411 с. - ISBN 190241-14125-23-43265

26. Уолкер, В. Безопасность ЭВМ и организация их защиты [Текст] / В. Уолкер. – М.: Финансы и статистика, 2007. – 344 с. – ISBN 9839-32470-1234-1

27. Феррари, Д. Оценка производительности вычислительных систем [Текст] / Д. Феррари. – М.: СПб.: Питер, 2006. – 495 с. – ISBN 18924-1251283-1252305-4845031-138

28. Хендерсон, Л.М. Frame Relay. Межсетевое взаимодействие [Текст] / Л.М. Хендерсон, Т Дженкинс - М.: Век +, Горячая Линия - Телеком, Энтроп, 2006. – 316 с. - ISBN: 5-93517-013-2

29. Хомоненко, А.Д. Основы современных компьютерных технологий [Текст] / А.Д. Хомоненко. – М.: СПб.: Корона принт, 2008. – 412 с. – ISBN 18240-12845-1241-345

30. Хоникарт, Д. Internet без проблем [Текст] / Д. Хоникарт. - М.: Радио и связь, 2007. – 240 с. – ISBN 9351-5494-2491

31. Хофман, Л. Современные методы защиты информации [Текст] / Л. Хофман. – М.: СПб.: Питер, 2009. – 329 с. – ISBN 4920-329049-2329-001

32. Шаньгин, В. Защита компьютерной информации. Эффективные методы и средства [Текст] / В. Шаньгин. - М.: ДМК-Пресс, 2008. – 239 с. – ISBN 125149-3155-544

33. Шмалько, А.В., Цифровые сети связи: основы планирования и построения [Текст] / А.В. Шмалько. - М.: Эко-Трендз, 2007. – 282 с. - ISBN: 5-88405-032-1

34. Шнайер, Б. Прикладная криптография. Протоколы, алгоритмы, исходные тексты на языке С [Текст] / Б. Шнайер. - М.: Издательство ТРИУМФ, 2008. – 540 с. – ISBN 82048-4895048-4890-59033

35. Якименко, А.С. Средства защиты информации [Текст] / А.С. Якименко. - М.: Юнити, 2007. – 238 с. – ISBN 9102-4801-4845-4249

 

 

 

 

Приложение  А

 

Рейтинг мировых поисковых систем (по данным Nielsen NetRatings)

 

Основные поисковые  системы

Основные поисковые  системы

http://www.google.com/ — 46.2%

http://www.yandex.ru/ — 54.8267%

http://www.yahoo.com/ — 22.5%

http://www.rambler.ru/ — 21.7645%

http://search.msn.com/ — 12.6%

http://www.google.com/ — 15.6207%

http://www.aol.com/ — 5.4%

http://www.mail.ru/ — 4.5466%

http://www.myway.com/ — 2.2%

http://www.aport.ru/ — 1.5788%

http://www.ask.com/ — 1.6%

 

http://search.netscape.com/ — 1.6%

 

 

Рейтинг российских поисковых систем (по данным SpyLog

 

Прочие поисковые  системы (7.9%)

Прочие поисковые  системы (1,6627%)

http://home.iwon.com/

http://www.msn.com/

http://www.dogpile.com/

http://www.yahoo.com/

http://www.earthlink.com/

http://www.metabot.ru/

http://www.alltheweb.com/

http://www.altavista.com/

http://www.hotbot.com/

http://www.meta.ua/

http://www.teoma.com/

http://www.alltheweb.com/

http://www.altavista.com/

http://www.bigmir.net/

http://www.gigablast.com/

http://www.ask.com/

http://www.looksmart.com/

http://www.cnet.ru/find/

http://www.lycos.com/

http://www.aol.com/

http://dmoz.org/

http://www.lupa.ru/

http://www.about.com/

http://www.overture.com/

http://www.britannica.com/

http://www.toursearch.ru/

http://www.excite.com/

 

http://www.webwombat.com.au/

 

http://www.webcrawler.com/

 

http://www.pepesearch.com/

 

http://www.aeiwi.com/

 

http://www.links2go.com/

 

http://www.searchking.com/

 

http://www.qango.com/

 

 

 

 

 

 

 

Приложение  Б

Информационно-поисковая система Яндекс

 

 

 

 

Приложение  В

Интеллектуальная информационно-поисковая система Нигма

 

 

 

 

 

Приложение Г

Размеры страниц различных поисковиков

 




Информация о работе Методы информационного эффективного поиска и обмена информацией