Top Banner
ИНТЕРНЕТ-ПОИСК И ПОИСКОВЫЙ СПАМ Павел Уваров руководитель группы разработки отдела поисковых систем
20

11 Uvarov Optimization2008

Aug 12, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 11 Uvarov Optimization2008

ИНТЕРНЕТ-ПОИСК ИПОИСКОВЫЙ СПАМ

Павел Уваров руководитель группы разработки

отдела поисковых систем

Page 2: 11 Uvarov Optimization2008

Главная техническаязадача поисковика

• Пользователь доволен– релевантностью– быстротой ответа– функционалом

Page 3: 11 Uvarov Optimization2008

Что ищет пользователь?• Информацию (“когда родилсяНьютон”)

• Сайт (“официальный сайтналоговой службы”)

• Сервис (“где купить авиабилетonline”)

• Интерес (“продам микроволновку”,“ищу собутыльника”). Не являетсязадачей традиционного поиска

Page 4: 11 Uvarov Optimization2008

Традиционные методыинтернет-поиска

• Поиск по тексту документов• Поиск по текстам ссылок• Ссылочная авторитетность

(Pagerank)• Требование оперативности ->простота методов -> уязвимостьдля спама

Page 5: 11 Uvarov Optimization2008

Конфликт интересов• Поисковику важно оставитьпользователя довольным

• Сайтам важно оказаться впоисковой выдаче, даже еслипользователь не будет этимдоволен

• Результат -- борьба поисковика соспамом

Page 6: 11 Uvarov Optimization2008

Спам• Хорошая оптимизация -- этостремление попасть в поисковуювыдачу без ущерба для еерелевантности

• Вся остальная оптимизация --недобросовестная, то есть спам

• Борьба со спамом -- пессимизация

Page 7: 11 Uvarov Optimization2008

Как пессимизировать?• Банить сайт• Перестать учитывать ссылки сэтого сайта

• Антипейджранк (яд)• Нужна осторожность

Page 8: 11 Uvarov Optimization2008

Автоматическиеметоды пессимизации

• Статистический анализ текста(выявление дорвеев)

• Выявление скрытого текста• Статистический анализ ссылок

(выявление ссылочного спама илинк-ферм)

• Исполнение javascript с фиксациейредиректов

• Выявление клоакинга

Page 9: 11 Uvarov Optimization2008

Ручные методыпессимизации

• Ассессирование (ручной анализпоисковой выдачи)

• Модерирование (просмотрзарегистрированных сайтов)

• Обработка жалоб (спамеры стучатдруг на друга)

Page 10: 11 Uvarov Optimization2008

Уязвимые местапоисковиков

• Мутирующий контент• Мутирующие ссылки• Клоакинг• Маскировка под нормальныесайты

Page 11: 11 Uvarov Optimization2008

Пример скрытого текста

Page 12: 11 Uvarov Optimization2008

Клоакинг (что отдается пользователю)

Page 13: 11 Uvarov Optimization2008

Клоакинг (что отдается поисковомуроботу)

Page 14: 11 Uvarov Optimization2008

Самый обычный дорвей

Page 15: 11 Uvarov Optimization2008

Злобный дорвей

Page 16: 11 Uvarov Optimization2008

Дорвей, замаскированный под форум

Page 17: 11 Uvarov Optimization2008

Дорвей, замаскированный подфотогалерею

Page 18: 11 Uvarov Optimization2008

Линк-ферма или по-русскилинкопомойка

Page 19: 11 Uvarov Optimization2008

Размещение ссылок на немодерируемыхфорумах

Page 20: 11 Uvarov Optimization2008

Борьба со спамом --увлекательное занятие :)

Спасибо за внимание.Вопросы?