Канн С.К. Подходы к обнаружению ложного веб-трафика сайтов
Навигация
ОБРАЗОВАНИЕ И НАУКА: СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ*31.08.2015  
 
Обложка

КАНН С.К. (ГПНТБ СО РАН, Новосибирск)
 
ПОДХОДЫ К ОБНАРУЖЕНИЮ ЛОЖНОГО
ВЕБ-ТРАФИКА САЙТОВ

Библиотечный сайт Отделения ГПНТБ СО РАН (www.prometeus.nsc.ru) ежедневно посещают тысячи пользователей, но в последнее время приходится сталкиваться со значительным завышением показателей библиотечной веб-статистики. Речь идет о так называемом «фроде» (англ. fraud) - мошенничестве в сфере информационных технологий. По данным «Википедии», в 2005 году сотовые операторы потеряли от подобного жульничества 25 млрд. долларов [1]. Примерно тогда же с подделкой реферального веб-трафика, то есть трафика, полученного от перехода по ссылкам со сторонних сайтов, из групп в социальных сетях и пр., столкнулся и сайт Отделения. В 2006 г. доступ к одному из документов www.prometeus.nsc.ru превысил 200 тысяч обращений, а в 2007 г. он же превзошел статистику и титульной страницы сайта.

 
Таблица. Источники трафика к сайту www.prometeus.nsc.ru за время
с 30.08.2014 по 31.08.2015 г. (по данным Яндекс-Метрики)
 
ИсточникКоличество
визитов
Доля от общего
количества
1доступы из поисковых систем336 91680,5 %
2прямые заходы58 68914,0 %
3переходы по ссылкам (рефереры)11 4802,74 %
4внутренние переходы7 8781,88 %
5переходы из социальных сетей2 5890,62 %
6переходы с сохраненных страниц7670,18 %
 

Именно реферальный трафик, как правило, не играющий главной роли в источниках доступа (см. таблицу), превратился в подлинную головную боль многих веб-мастеров [2-5]. За формулировкой о «неправомочном использовании ресурсов и услуг в сетях связи» скрываются не только экономические угрозы разорения компаний на рекламных «кликах», но и откровенно вредоносные действия - воровство контента, слежка, построение ботнетов, etc. Оказывается, что 30-40% рекламного трафика - это полная фикция, порожденная ботами.

Лучший способ борьбы со «спамом статистики» - наложение фильтров и блокирование адресов разносчиков мусора, хотя сделать это очень непросто. В библиотечной практике требуется постоянная и согласованная деятельность библиотечных специалистов с администраторами сетей и серверов.

В Отделении ГПНТБ СО РАН выработаны подходы, направленные на обнаружение «фейкового трафика», загрязняющего библиотечную статистику. Использование системы лог-анализа AWStats позволяет эффективно выявлять IP-адреса спам-ботов, генерирующих поддельные заголовки реферера, и исключать эти доступы из общей статистики сайта. Как правило, в отчетах AWStats за большие промежутки времени у спам-ботов полностью совпадает количество пройденных страниц и хитов. Другими словами, боты делают к каждой html-странице лишь один доступ, не захватывая все файлы, с ней ассоциированные. Впоследствии детальное изучение лог-файла показывает, что в поле реферера выявленные боты оставляют веб-адреса интернет-магазинов детской и женской одежды, фармацевтических сайтов и пр. И эти же веб-адреса спам-ботов «всплывают» в отчетах AWStats в разделе источников трафика.

...
 
[1] Фрод // Википедия [сайт]. URL: https://ru.wikipedia.org/wiki/Фрод
[2]Мошенники рунета // Ведомости [сайт]. 26.03.2014. № 3556. URL: http://www.vedomosti.ru/newspaper/articles/2014/03/26/moshenniki-runeta
[3]Осторожно, рефспам // Optimizatorsha.Ru [сайт]. 3.12.2014. URL: http://optimizatorsha.ru/yandex/refspam/
[4]Как удалить фейковый трафик с вашего сайта // Megamozg.ru [сайт]. 13.07.2015. URL: http://megamozg.ru/post/17406/
[5]Странные страницы в статистике // Клуб Я-Метрики. 2014. 15 декабря. URL: http://clubs.ya.ru/metrika/replies.xml?item_no=12395
 

Опубликовано в сборнике:Юком ОБРАЗОВАНИЕ И НАУКА: СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ: сборник научных трудов по материалам международной научно-практической конференции 31 августа 2015 г.: в 4 томах. Том 4 / Министерство образования и науки РФ. - Тамбов: Изд-во ООО «Консалтинговая компания Юком», 2015. - С.66-68: табл. - Библиогр.: в примеч., с.67-68 (5 назв.). - ISBN 978-5-990720-97-8 (Том 4). - DOI: 10.17117/2015.08.04
 
 ПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:57:24 2019. Размер: 14,960 bytes.
Посещение N 1281 с 30.09.2015