Использование средств и технологий тематического поиска в разнородных информационных ресурсах для подготовки обзора по теме «Рынок стра

Автор работы: Пользователь скрыл имя, 10 Ноября 2012 в 16:59, курсовая работа

Краткое описание

Проектирование и реализация интерфейса к БД информационных источников

Содержание

Введение 3

1. Поиск в разнородных информационных ресурсах для подготовки обзора по теме: «Рынок страхования» 4

1.1. Структурно-логическое представление темы 4

1.2. Поиск в информационных ресурсах 5

1.2.1. Реферативно-библиографические документальные БД 5

1.2.2. Электронные каталоги и библиотеки 7

1.2.3. Поиск в Internet- машинах 12

1.3. Обзор релевантных документов 18

Выводы 19

2. Создание БД информационных источников, проектирование и реализация интерфейса для работы с БД 20

2.1. Описание БД и её структуры 20

2.2. Создание соединения с БД «Mydb» 21

с использованием механизма ADO 21

2.3. Описание интерфейса приложения для БД «Mydb» 23

2.3.1. Создание интерфейса для страницы Таблица 23

2.3.2. Создание интерфейса для страницы поиска 24

2.3.3. Оформление таблицы 26

2.4. Руководство для работы с приложением 27

Заключение 29

Cписок источников и литературы: 30

Приложение 1 31

Таблица релевантных документов 31

Приложение 2 35

Код программы 35

Прикрепленные файлы: 1 файл

Курсовая.docx

— 4.24 Мб (Скачать документ)

 

Проведём анализ полученных результатов поиска (табл. 1.5).

Таблица 1.5

Анализ результатов поиска

 

Вид поиска

Всего документов

Кол-во релевантных

документов

Полнота r

Точность p

по полю «Ключевые слова»

148

94

16,4%

63,5%

по полю «Аннотации»

565

~377

65,7%

66,7%

по полю «Название публикации»

179

103

18%

57,5%


Проведенный анализ показывает, что поиск в электронной библиотеке Elibrary в целом оказался эффективным (точность по всем полям более 50%). Преобладающее количество документов по данной теме было найдено при поиске по полю «Аннтоции». [13]

 

1.2.3. Поиск в Internet- машинах

Google (www.google.ru)

Реализуем два вида запросов:

по естественно-языковой формулировке темы запроса:

страховой рынок (рис. 1.11)

 

Рис.1.11. Поиск в системе Google

 

по булевоподобному выражению («профессиональный» язык запросов)

"страховой рынок"  or "рынок страхования" (рис. 1.12)

 

 

Рис.1.12. Поиск в системе Google

 

Соответственно получаем следующие результаты по запросам:

  1. Общее количество документов равно 1 260 00. Среди 25 просмотренных документов оказалось 17 релевантных.
  2. Всего 37 700 документов, релевантные составили 20 из 25 просмотренных (рис. 1.13).

 

 

Рис.1.13. Результаты поиска в системе Google

 

Проведём анализ полученных результатов поиска (табл. 1.6).

Таблица 1.6

Анализ результатов поиска

 

Вид поиска

Всего документов

Кол-во релевантных  документов

Точность p

Полнота r

Простой поиск

1 260 000

17 из 25

68%

46%

Профессиональный поиск

37 700

20 из 25

80%

54%


Поиск в системе Google оказался эффективным; общая точность находится в диапазоне 65-80%. Использование режима профессионального поиска позволяет сократить общее количество выданных результатов и при этом увеличить точность. [4]

 

Nigma (www.nigma.ru)

Осуществим аналогичный поиск в системе Nigma:

обычным поисковым запросом (рис. 1.14)

 страховой рынок

Рис.1.14. Поиск в системе Nigma

расширенным поисковым  запросом (рис. 1.15)

используем возможность поиска точной фразы: страховой рынок

 

Рис.1.15. Поиск в системе Nigma

 

 

Проведём анализ полученных результатов поиска (табл. 1.7).

Таблица 1.7

Анализ результатов поиска

 

Вид поиска

Всего документов

Кол-во релевантных  документов

Точность p

Полнота r

Простой поиск

46 000 000

15 из 25

60%

44%

Расширенный поиск

584 000

19 из 25

76%

56%


 

Поиск в системе Nigma, как и в большинстве других систем, можно осуществить в двух вариантах: расширенном и простом.  Профессиональный поиск является удобным и быстроосуществимым: у пользователя нет необходимости переходить от одной страницы к другой, так как окно поиска раскрывается на той же странице документа. [5]

 

Yandex (www.yandex.ru)

Проведем поиск следующим  образом:

обычным поисковым  запросом (рис.1.16)

рынок страхования

 

Рис.1.16. Поиск с ситеме Yandex

расширенным поисковым  запросом по заголовкам (рис.1.17)

 title: (рынок страхования)

 

Рис.1.17. Поиск с ситеме Yandex

В результате найдено 149 000, из 25 просмотренных документов релевантными оказались 18 (рис.1.18)

Рис. 1.18. Результаты поиска в системе Yandex

поиск фразы в  пределах одного предложения осуществляем, используя символ ’’&’’(рис.1.19)

 рынок & страхования

Рис.1.19. Поиск в системе Yandex

 

Проведём анализ полученных результатов поиска (табл.1.8).

Таблица 1.8

Анализ результатов поиска

 

Вид поиска

Всего документов

Кол-во релевантных  документов

Точность p

Полнота r

Простой поиск

45 000 000

14 из 25

56%

29%

Расширенный поиск по заголовкам

149 000

18 из 25

72%

37%

Расширенный поиск 

(в пределах предложения)

6 000 000

17 из 25

68%

35%


 

ИПС Яндекс - одна из самых популярных в нашей стране интернет-машин, она стоит на втором месте по популярности после системы Google. Точность выдаваемых результатов в Яндексе несколько ниже, чем в Google, так же при использовании расширенного режима поиска происходят большие отклонения в количестве выданных документов даже при несущественных изменениях запроса. Стоит  отметить, однако, что при составлении запроса можно воспользоваться памяткой по использованию языков запроса, ссылка на которую расположена в верхнем углу окна поискового запроса. Это значительно облегчает работу неопытным пользователям. [6]

 

Rambler (www.rambler.ru)

Проведем поиск:

обычным поисковым  запросом

рынок страхования

Рис.1.20 Поиск в системе Рамблер

Проведём анализ полученных результатов поиска (табл. 1.9).

Таблица 1.9

Анализ результатов поиска

 

Вид поиска (предложение  поиска)

Всего документов

Кол-во релевантных  документов

Точность p

«рынок страхования»

45 000 000

14 из 25

56%


 

В ИПС Рамблер используются алгоритмы поисковой системы  Яндекс, поэтому результаты оказываются  идентичными. [7]

 

Alta Vista (www.altavista.com)

Осуществим  поиск следующим образом:

обычным поисковым  запросом (рис. 1.21)

рынок страхования

Рис.1.21.Поиск в системе Alta Vista

 

расширенный поиск только в заголовках (рис.1.22)

intitle:рынок intitle:страхования  

Рис.1.22. Поиск в системе Alta Vista

 

Проведём анализ полученных результатов поиска (табл. 1.10).

Таблица 1.10

Анализ результатов поиска

 

Вид поиска

Всего документов

Кол-во релевантных  документов

Точность p

Полнота r

Простой поиск

1 120 000

19 из 25

76%

66%

Расширенный поиск (по заголовкам)

1 600

10 из 25

40%

34%


 

По результатам анализа  можно сделать вывод, что система  Alta Vista достаточно эффективна. Возможность расширенного поиска позволяет сократить общее количество результатов, однако точность при этом так же уменьшается. [8]

 

1.3. Обзор релевантных документов

Осуществим краткий обзор релевантных документов. Для этого занесём некоторое количество данных, найденных в результате поиска в разных источниках,  в таблицу (см. таблица П.1).

В дальнейшем эта информация будет использована при проектировании БД в среде Access.

 

Анализ релевантных документов

Страхование - одна из древнейших категорий, отражающих особую сферу  экономических отношений общества. На любой стадии общественно-экономического развития существует вероятность риска  разрушительного воздействия внешних сил, поэтому исследование и анализ рынка страхования и его проблем - это одна из наиболее злободневных тем сегодня.

Информационно-поисковые системы содержат по этому вопросу огромное количество информации, которая отражается в статьях, методических изданиях, учебниках, диссертация и прочих источниках.

 Такие электронные  ресурсы как библиотеки и базы  данных являются наиболее надежными  источниками, информация в них  независима и уникальна, что  доказывает отсутствие повторений  в таблице релевантных документов (таблица П.1). Кроме того, количество выдаемых данных в большинстве ресурсов достаточно велико, т.е. у пользователя есть широкий выбор среди релевантных документов, а так же возможность просмотреть сведения по какой-либо смежной теме среди других источников. [3]

Интернет - машины в отличие от электронных баз данных содержат много новостной информации, статьи в них могут неоднократно дублироваться различными сайтами, что существенно увеличивает объем выдаваемых данных.  Однако, число релевантных документов среди общего коичества достаточно большое, поэтому даже неопытный пользователь с легкостью найдет любую необходимую информацию по теме «Рынок страхования». [2]

В целом, результаты поиска по данной теме, можно разделить на несколько областей:

    1. теоретические основы страхования;
    2. анализ поведения и отношений между участниками страхования, в т.ч. между рынками различных стран, регионов и т.д.
    3. перпектива развития рынка страхование;
    4. поиск, анализ и решение проблем современного рынка страхования;
    5. страхование жизни;
    6. автострахование;
    7. медицинское страхование.

Приведенные выше темы охватывают все аспекты такого понятия, как  «Рынок страхования», т.е. проведенный поиск можно считать эффективным.

Выводы

  1. В ходе работы были использованы современные технологии информационного поиска, которые позволяют совершенствовать поисковый запрос для увеличения числа релевантных документов в общем объёме данных. В частности, были опробованы следующие виды поиска: по ключевым словам, по заголовкам, в аннотациях, по общему словарю,  поиск усеченных слов, по булевоподобым выражениям т.д.
  2. В целом самыми распространенными и удобными являются Интернет-машины, так как поиск в них доступен каждому и не требует специальных навыков и знаний. Минусами этих систем являются частое дублирование данных, отсутствие тщательной проверки содержимого сайтов, частые ошибки при использовании режима расширенного поиска.
  3. Основное преимущество электронных библиотек и баз данных – достоверность и надежность содержащейся в них информации. Постоянные обновления позволяют получать самые новые сведения. Однако, услуги, предоставляемые такими источниками информации, являются платными, так же необходимо осуществить регистрацию на сайте.
  4. По итогам поиска была составленя таблица релевантных документов, которая в дальнейшем послужит основой для создания тематическо-ориентированной библиографической БД и специального приложения для работы с ней.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Создание БД информационных источников, проектирование и реализация интерфейса для работы с БД

2.1. Описание БД и её структуры

Информацию о релевантных документах, представленную в Таблице П.1, можно разделить на несколько полей: Ф.И.О. автора, название ИПС, адрес сайта, реферат, его заголовок, год издания, а также номер записи.  При составлении таблицы в среде Access были использованы перечисленные выше поля,  записанные следующим образом:

  • Name – тип поля текстовый;
  • FIO – тип поля текстовый;
  • Date – тип поля числовой;
  • Site – тип поля текстовый;
  • IPS – тип поля текстовый;
  • Article – тип: поле Memo;
  • No – тип поля счетчик (ключ таблицы Documents).

В таблице  2.1 приведена структура описанных выше данных. Здесь для каждого поля записи указаны его основные характеристики.

 

Таблица 2.1. Описание структуры таблицы Documents

Имя столбца

Ключ

Тип данных

Описание

No

#

Счетчик

Идентификатор записи

Name

 

Строка

Название

FIO

 

Строка

ФИО

Date

 

Число

Дата издания

Site

 

Строка 

Адрес сайта

IPS

 

Строка 

ИПС


 

При работе с БД «Mydb» должна быть возможность добавлять, удалять, модифицировать информацию, указанную выше. Кроме того, для удобства работы нужно просматривать упорядоченный список по любому из полей с возможностью поиска и выбора из него записей, так же должна быть реализована возможность сохранения и загрузки данных. Для выполнения этих задач  было создано специальное приложение с помощью ООЯП Delphi. [1]

 

 

2.2. Создание соединения  с БД «Mydb»

с использованием механизма ADO

  1. Для соединения с БД в Блокноте был создан файл связи с данными с расширением *udl: mydb.udl. Поставщиком данных был указан Micosoft Office 12.0 Access Database Engine OLE DB Provider, источником данных –   БД «Mydb» (рис.2.1).

Информация о работе Использование средств и технологий тематического поиска в разнородных информационных ресурсах для подготовки обзора по теме «Рынок стра