21:24 Пошуковий спам | |
Пошуковий спам (спамдексинг або веб-спам) — сайти і сторінки в Інтернеті, створені з метою маніпуляції результатами пошуку в пошукових машинах — в кінцевому рахунку, для обману користувача. Не мають відношення до вмісту сторінки, але популярні в пошукових запитах слова в тегах «meta keywords», «description», наприклад «sex», «халява». В результаті пошукові машини стали аналізувати не тільки спеціальні теги, але і сам текст сайту. «Накачування» тексту ключовими словами — штучне підвищення частоти ключового слова або виразу в тексті та (або) використання елементів розмітки HTML (h1-3, strong, b, e, i) для штучного підвищення ваги ключового слова. «Невидимий текст — текст, невидимий для відвідувача сторінки, але індексований пошуковою машиною. Застосовується колір тексту, відповідний кольору фону, текст розміром в 1 піксель, блоки тексту, зі стилем «display:none». Посилальний спам — посилання, «накручують» параметр «link popularity» і PageRank сайту. Так як пошуковики, відповідаючи на запит, орієнтуються на кількість посилань, наявних на інших сайтах на даний ресурс, з'явилася ідея якось збільшити число таких посилань: Створити невеликі сайти на безкоштовному хостингу, зареєструвати їх у великій кількості тематичних каталогів і з них посилатися на основний. Взяти участь в обміні посиланнями. Купувати посилання за гроші. Посилальний спам з гостьових книг, блогів, вікі та ін. Пошукові машини борються з цим, створюючи фільтри, в які додають сайти, посилання з яких не враховуються при ранжируванні. Дорвеї — проміжні сторінки, створені для накрутки ваги сторінки при ссылочном ранжируванні або для організації Гугл-бомби. У відповідності з технологією дорвеїв в пошуковому індексі треба просувати спеціальну сторінку дорвей. А вже з цієї сторінки перенаправляти на рекламну. В однієї рекламної може бути необмежене число дорвеїв. Пошукові машини у відповідь видаляють зі своєї бази даних сайти, в яких є автоматичне перенаправлення. На що спамери відповідають простим прийомом: просять відвідувача самого натиснути на кнопку «Вхід на сайт» або щось подібне. Маскування, або «клоакінг» — аналіз змінних запиту, при якій пошуковій машині віддається вміст сайту, відмінне від того, яке бачить користувач. Головна проблема, що породжується пошуковим спамом, полягає в тому, що він генерує безліч сміттєвого контенту, ускладнюючи ефективну роботу пошукових серверів, спотворює об'єктивне ранжування інтернет-ресурсів і релевантність пошукових результатів. У підсумку це багато в чому знецінює Інтернет як джерело отримання об'єктивної інформації. Якщо ранні пошукові машини могли довіряти ключовими словами, вказівок на частоту оновлення, то, у зв'язку з активним використанням цих методів для «обману» пошукових систем, більш пізні версії пошукачів були змушені практично повністю ігнорувати ці вказівки, критично ставлячись до кожної зі сторінок сайту, що зробило скрутним пошук «добропорядних» сторінок c рідким вмістом і прописаними ключовими словами. Наприклад, сторінка з текстом середньовічної пісні і ключовими «Середні століття, поезія, Східна Європа», не володіє великою кількістю посилань з інших сайтів, не містить у тексті слова «Середні століття, поезія», навряд чи буде знайдена за цими ключовими словами. | |
|
Всего комментариев: 0 | |