Принципи роботи пошукових ситем

Автор работы: Пользователь скрыл имя, 03 Июня 2013 в 13:03, контрольная работа

Краткое описание

Пошукова система - це програмно-апаратний комплекс, призначений для здійснення пошуку в мережі Інтернет, який реагує на запит користувача, що задається у вигляді текстової фрази (пошукового запиту), видачею списку посилань на джерела інформації, в порядку релевантності (відповідно запиту). Найбільші міжнародні пошукові системи: «Google», «Yahoo», «MSN». У російськомовному Інтернеті це - «Яндекс», «Рамблер», «Апорт». Є також українська пошукова система – «Мета».
Алгоритм пошуку документів серед знайдених і тих, що зберігаються на сервері html-сто

Прикрепленные файлы: 1 файл

пошукові системи.docx

— 22.85 Кб (Скачать документ)

Інститут журналістики

Київського національного  університету імені Тараса Шевченка

 

 

 

 

 

 

 

Самостійна робота

З курсу: «Соціальна інформатика»

Доповідь на тему: «Принципи роботи пошукових ситем»

 

 

 

 

Виконала: студенка 1 курсу магістратури

(спеціальність: журналістика)

заочної форми навчання

Гордійко Дарія

Викладач: Рябічев В.Л.

Київ, 2012

 

Пошукова система - це програмно-апаратний комплекс, призначений для здійснення пошуку в мережі Інтернет, який реагує на запит користувача, що задається у вигляді текстової фрази (пошукового запиту), видачею списку посилань на джерела інформації, в порядку релевантності (відповідно запиту). Найбільші міжнародні пошукові системи: «Google», «Yahoo», «MSN». У російськомовному Інтернеті це - «Яндекс», «Рамблер», «Апорт». Є також українська пошукова система – «Мета».

Алгоритм пошуку документів серед знайдених і тих, що зберігаються на сервері html-сторінок, так званий прямий алгоритм пошуку, не є найкращим рішенням, хоч він дозволяє знайти все необхідне. Справа в тому, що прямий алгоритм пошуку не підходить для роботи з великою кількістю даних, через витрати часу на виконання тієї чи іншої операції.

Тому для пошуку з великою  кількістю даних розробили алгоритм пошуку зворотних індексів чи попереднього індексування. При цьому алгоритмі пошуку, пошукова система відчищає html-сторінку від усього «сміття» і перетворює її в текстовий документ, позначаючи всі знайдені слова безліччю значень.

Отже, задача будь-якої пошукової системи це пошук html-сторінок в своїй базі їх сортування і видача в порядку релевантності.

Але ніяка «розумна» програма особливо на початковому етапі не зможе коректно працювати і саме тут їй на допомогу приходять люди - асесори. Вони перевіряють роботу пошукової системи за численними запитами. Всі зауваження враховуються технічними фахівцями, вносяться зміни і коректування в формулу пошукової системи, відповідно підвищується і якість видачі інформації.

Для зручності пошуку пошукова система повинна мати максимально  функціональний та «дружелюбний» інтерфейс. Один з провідний пошуковиків Google дозволяє налаштувати кожному користувачеві мову інтерфейсу пошукової машини, вибрати мовні зони для пошуку, кількість повідомлень при видачі результатів і ін. Інтерфейс Google містить досить складну мову запитів, що дає можливість обмежити сферу пошуку окремими доменами, мовами, типами файлів і т. д. Наприклад, пошук intitle: Google site: seoexp.com дасть всі статті розташовані на цьому ресурсі, на всіх мовах, в заголовку яких зустрічається слово «Google». Саме тому користувач, що вперше потрапив на сайт пошукової системи Google, здивується чистому вікну, яке не містить нічого крім рядка пошуку. Це дозволяє завантажувати його набагато швидше від конкуруючих пошуковиків.

Практично всі великі пошукові системи мають свою власну структуру, відмінну від інших. Однак можна  виділити загальні для всіх пошукових машин основні компоненти:

  • Модуль індексування – дозволяє обходити по посиланнях задану множину ресурсів, завантажувати сторінки, витягувати з одержаних документів посилання на нові сторінки та здійснювати повний аналіз цих документів. Складається з трьох допоміжних програм-роботів: Spider (павук) Crawler («мандрівний» павук) та Indexer (робот-індексатор.
  • База даних, або індекс пошукової системи - це система зберігання даних, інформаційний масив, в якому зберігаються спеціальним чином перетворені параметри всіх завантажених і оброблених модулем індексування документів.

  • Пошуковий сервер – найважливіший елемент всієї системи, оскільки від його алгоритмів функціонування, безпосередньо залежить якість та швидкість пошуку.

В ефективному пошуку інформаційних  ресурсів Інтернету допомагають декілька правил:

1. Грамотне використання  можливостей одного пошукового  сервера може бути ефективніше,  ніж звернення з тим самим  запитом до великої кількості  серверів.

2. У запиті слід використовувати  ті слова, що точніше за все  характеризують тему, яка цікавить  користувача.

3. Для більшості пошукових  серверів має значення послідовність  слів у запиті, тому найбільш  важливі і характерні терміни  треба розміщувати на початку  запиту і додавати до них  менш значущі терміни.

4. Фрази і словосполучення  слід брати в лапки, оскільки  в противному разі вони будуть  сприйняті пошуковим сервером  просто як набір ключових слів.

5. У запиті можна зазначати  одне або кілька власних імен.

6. Рекомендується вживати  синоніми – їх використання  дозволяє не тільки поширити  діапазон пошуку, а й надає  більше ваги власне смисловій  частині запиту.

7. Не рекомендується користуватися  поширеними словами типу "комп'ютер", "інформація", "дані" тощо.

8. Багато пошукових систем  припускають можливість використання  в запитах логічних операторів "І" (AND), "або" (OR), "не" (NOT). Їх грамотне використання дозволяє зробити пошук надзвичайно точним і направити його саме туди, куди потрібно.

9. Якщо серед перших 20-30 посилань, отриманих від пошукового  сервера, немає потрібного посилання,  слід подумати про те, щоб радикально  змінити набір ключових слів  або скористатися іншим сервером.

10. Слід пам'ятати, що WWW-сторінка, на яку користувач потрапляє  при першому підключенні до  пошукової системи, найчастіше  являє собою спрощений бланк  запиту на пошук інформації. Щоб  отримати доступ до найбільш  потужних засобів опису, треба  перейти на сторінку ускладненого  пошуку (Advanced Search).


Информация о работе Принципи роботи пошукових ситем