21:22 Пошукова система | |
Пошукова система (англ. search engine) — це комп'ютерна система, призначена для пошуку інформації. Одне з найбільш відомих застосувань пошукових систем — веб-сервіси для пошуку текстової або графічної інформації у Всесвітній павутині. Існують також системи, здатні шукати файли на FTP-серверах, товари в інтернет-магазинах, інформацію в групах новин Usenet. Для пошуку інформації за допомогою пошукової системи користувач формулює пошуковий запит[1]. Робота пошукової системи полягає в тому, щоб за запитом користувача знайти документи, що містять зазначені ключові слова, або слова, пов'язані з ключовими словами[2]. При цьому пошукова система генерує сторінку результатів пошуку. Така пошукова видача може містити різні типи результатів, наприклад: веб-сторінки, зображення, звукові файли. Деякі пошукові системи також отримують інформацію з відповідних баз даних і каталогів ресурсів в Інтернеті. Пошукова система тим краще, чим більше документів, релевантних запиту користувача, вона буде повертати. Результати пошуку можуть ставати менш релевантними з-за особливостей алгоритмів (див. «Міхур фільтрів»[⇨]) або внаслідок людського фактору[⇨]. Станом на 2015 рік найпопулярнішою пошуковою системою в світі є Google, однак є країни, де користувачі віддали перевагу іншим пошуковикам. Так, наприклад, в Росії «Яндекс» обганяє Google більше, ніж на 10 %[⇨]. За методами пошуку та обслуговування поділяють чотири типи пошукових систем: системи, що використовують пошукових роботів, системи, керовані людиною, гібридні системи та мета системи[⇨]. В архітектуру пошукової системи зазвичай входять: пошуковий робот, який збирає інформацію з сайтів мережі Інтернет або з інших документів, індексатор, що забезпечує швидкий пошук по накопиченій інформації, та пошуковик — графічний інтерфейс для роботи користувача[⇨] Існує чотири типи пошукових систем: з пошуковими роботами, керовані людиною, гібридні та мета системи[16]. системи, що використовують пошукових роботів Складаються з трьох частин: краулер («бот», «робот» чи «павук»), індекс і програмне забезпечення пошукової системи. Краулер потрібний для обходу мережі і створення списків веб-сторінок. Індекс — великий архів копій веб-сторінок. Мета програмного забезпечення — оцінювати результати пошуку. Завдяки тому, що пошуковий робот в цьому механізмі постійно досліджує мережа, інформація більшою мірою актуальна. Більшість сучасних пошукових систем є системами даного типу. системи, керовані людиною (каталоги ресурсів) Ці пошукові системи отримують списки веб-сторінок. Каталог містить адреса, заголовок та короткий опис сайту. Каталог ресурсів шукає результати тільки з описів сторінки, представлених йому веб-майстрами. Гідність каталогів в тому, що всі ресурси перевіряються вручну, отже, і якість контенту буде краще порівняно з результатами, отриманими системою першого типу автоматично. Але є і недолік — оновлення даних каталогів виконується вручну і може суттєво відставати від реального стану справ. Ранжування сторінок не може миттєво змінюватися. В якості прикладів таких систем можна привести каталог Yahoo[en], dmoz і Galaxy. гібридні системи Такі пошукові системи, як Yahoo, Google, MSN, поєднують в собі функції систем, що використовують пошукових роботів і систем, керованих людиною. мета-системи Метапоисковые системи об'єднують і ранжирують результати відразу декількох пошуковиків. Ці пошукові системи були корисні, коли у кожної пошукової системи був унікальний індекс, і пошукові системи були менш «розумними». Оскільки зараз пошук набагато покращився, потреба в них зменшилася. Приклади: MetaCrawler[en] і MSN Search. | |
|
Всего комментариев: 0 | |