Канн С.К. Влияние фильтрации рефспама на показатели посещаемости библиотечного сайта
Навигация
НАУКА И ОБРАЗОВАНИЕ В XXI ВЕКЕ*28.02.2018 
 
Обложка

КАНН С.К. (ГПНТБ СО РАН, Новосибирск)
 
ВЛИЯНИЕ ФИЛЬТРАЦИИ РЕФСПАМА НА ПОКАЗАТЕЛИ ПОСЕЩАЕМОСТИ БИБЛИОТЕЧНОГО САЙТА

Создатели сайтов с диверсифицированным библиотечным контентом всегда стремились привлекать к своим ресурсам качественную профильную аудиторию пользователей. Эта цель наиболее полно отражает предназначение библиотек в новую информационную эпоху. На сайте Научной библиотеки Томского политехнического университета дана исчерпывающая формулировка цели, к которой следует стремиться: «Миссия библиотеки, - пишут авторы, - заключается в том, чтобы предоставить каждому пользователю качественный и эффективный доступ к любым информационным ресурсам, которые способствуют их образовательной, научной и профессиональной деятельности, к записанной мудрости, опыту и идеям других..» [1].

Однако гарантировать упомянутый качественный и эффективный доступ наиболее заинтересованному контингенту пользователей необычайно трудно. Причина кроется в том, что трафик библиотечного сайта отличается сложной комплексной природой и более чем на 85% формируется ботами. Если меньшую часть из них можно считать условно полезной для продвижения библиотечных ресурсов, то остальные носят откровенно деструктивный характер - ухудшают репутацию сайта, угнетают показатели посещаемости, снижают результативность работы, искажают статистику.

Безотносительно к целям создания ботов, темпы их выхода в интернет в последние годы значительно возросли. Подавляющая часть ботов используется для нелегальной или неодобряемой деятельности - DDoS-атак, перебора паролей, генерации спама. Вдобавок, возник и новый бизнес по майнингу криптовалюты. С.Ю.Комаров называет внешний трафик библиотечных сайтов, ориентированный на технологии вирусного SEO и неприемлемый контент (порнографию и пр.), негативным трафиком, предлагая исключать его из итоговой статистики и аналитики академических библиотек [2, с.128-129].

Действенным средством очищения веб-статистики от реферального спама является фильтрация внешнего трафика на уровне сервера с помощью стоп-листа .htaccess, куда вносятся IP-адреса самых активных спам-ботов. Проверка и оценка этой меры на практике проводилась на сайте Отделения ГПНТБ СО РАН prometeus.nsc.ru с февраля по декабрь 2017 г. Рабочая гипотеза состояла в том, что эффекты количественного уменьшения внешнего трафика, вызванные фильтрацией спам-адресов, должны компенсироваться качественным ростом ключевых показателей сайта (KPI - key performance indicators).

Основные результаты исследования отражены в Таблицах 1 и 2. В первой колонке обеих таблиц приводится конкретная дата, на которую производилось расширение списка блокировки спам-ботов (файла .htaccess) и фиксация метрик посещаемости.

 
Таблица 1. Ключевые метрики посещаемости сайта prometeus.nsc.ru в 2017 г. с учетом блокировки спам-ботов (по данным Google Analytics [GA] и Яндекс-Метрики [Я-М])*
 
На датуБлокиро-
ванных
IP-адресов
спам-ботов
Посетители
(с 01.01)
Визиты
(с 01.01)
Просмотры
(с 01.01)
GAЯ-МGA к
Я-М
(%)
GAЯ-МGA к
Я-М
(%)
GAЯ-МGA к
Я-М
(%)
06.02.17615219212199899,65279492797199,92570265899296,67
10.03.17618400784051298,935282052673100,2810192310357098,41
03.04.17942546505534098,75731187313399,9813779614015498,32
04.05.171291737767473898,7110001210027699,7418270418575798,36
13.06.172584992459969099,5513440813463099,8423939024234398,78
21.07.17447711105011144499,65152358151702100,4327419527614299,29
06.09.175008121032120781100,21166629165829100,4830493030679299,39
28.09.175624129283128363100,72177202176601100,3432615632725799,66
04.10.175730130233129661100,44179201178667100,3033080433202899,63
01.11.175834137263136180100,80189190188812100,2035429735587299,56
08.12.170146552145612100,65203872203591100,1438602438828399,42
*В таблице представлены данные с накоплением, отражающие изменение общей суммы показателей на дату пополнения списка блокировки новыми спам-ботами.
 

Во 2-й колонке указано количество IP-адресов, внесенных в блок-лист на соответствующую дату первой колонки. В остальных колонках Таблицы 1 представлены данные по посещаемости сайта с накоплением за предыдущий период, начиная с 01.01.2017 г. Они позволяют сопоставить два ряда метрик, полученных от двух систем веб-аналитики сайта prometeus.nsc.ru - Яндекс-Метрики (установлена в 2011 г.), и Google Analytics (2016).

Сравнение «доблокировочного» периода (8.04.2016-5.02.2017) с тестовым (6.02.2017-8.12.2017), примерно одинаковым по продолжительности (около 305 дней), обнаруживает падение всех количественных показателей в среднем на 25%.

При этом по просмотрам и пользователям больше упала Яндекс-Метрика, а по визитам (сеансам) - Google Analytics. Вместе с тем, увеличение списка блокировки отчетливо обнаруживает эффект сближения метрик обеих систем вплоть до их полного совпадения (см. Табл.1).

В течение всего 2017 года показатель просмотров по GA колебался в узком диапазоне 98,32 - 99,66% от данных Я-М. Ряд метрик различается на несколько десятков или сотен единиц. Так, на 3.04 разница по визитам между GA и Я-М составила всего лишь 15 (!).

 
Таблица 2. Ключевые метрики посещаемости сайта prometeus.nsc.ru на отдельные даты 2017 г. по данным Google Analytics и Яндекс-Метрики (продолжение)
 
На датуБлокиро-
ванных
IP-адресов
спам-ботов
Новые посетители (%)Отказы (%)Глубина просмотра
(страниц)
GAЯ-МGAЯ-МGAЯ-МGA к
Я-М
(%)
06.02.1761587,995,578,2476,82,042,1196,68
10.03.1761888,196,978,5577,21,931,9797,97
03.04.1794288,397,778,8877,61,881,9297,92
04.05.17129188,498,379,2378,01,831,8598,92
13.06.17258488,698,879,7878,71,781,8098,89
21.07.17447788,698,979,5178,41,801,8298,90
06.09.17500888,799,079,0777,91,831,8598,92
28.09.17562488,999,178,9977,81,841,8599,46
04.10.17573088,899,178,9477,81,851,8699,46
01.11.17583488,999,278,6277,41,871,8899,47
08.12.17088,999,278,3277,01,891,9198,95
 

В Таблице 2 можно проследить некоторые положительные эффекты фильтрации реферального спама. Показатель «новых посетителей» устойчиво растет в течение всего года - как по GA (87,9-88,9%), так и по Я-М (95,5-99,2%). Для информационного сайта с универсальным политематическим контентом это явление можно считать нормальным, хотя было бы неплохо, чтобы и количество возвращающихся посетителей тоже не уменьшалось. Зато видна положительная тенденция на снижение уровня отказов как по GA, так и по Я-М.

Сначала этот показатель слегка нарастал (до 79,78% по GA и до 78,7% по Я-М), но по мере расширения списка блокировки - с 2,5 тыс. до 6 тыс. IP-адресов - начал устойчиво падать и к декабрю достиг 78,32% по GA и 77% по Я-М. Одновременно выросла и глубина просмотра страниц, снижавшаяся весной. К концу года она составила 1,89 по GA и 1,91 по Я-М (см. Табл.2).

Выводы. Таким образом, ограничение влияния реферальных спам-ботов на трафик библиотечного сайта выявила следующие эффекты фильтрации:

  1. Блокировка 6 тысяч спамерских IP-адресов в течение года снизила трафик на 25%. Приблизительная оценка позволяет утверждать, что при занесении в блок-лист .htaccess примерно 250 ботов внешний трафик снижается в среднем на 1%. Можно предполагать, что при высоких уровнях трафика и регулярной фильтрации спамеров их блокировка будет не столь чувствительна для показателей посещаемости.
  2. Количественное снижение показателей компенсируется качественным улучшением KPI. Уровень отказов в течение года снизился в среднем на 1-1,5%, а глубина просмотра возросла на 0,1 страницы.
  3. Отсев спама из веб-статистики сервера сближает показатели Яндекс-Метрики и Google Analytics (вплоть до совпадения) и значительно повышает точность статистических оценок. Одновременно формируются условия для более рационального и эффективного управления библиотечным сайтом.
...
 
[1] Миссия библиотеки // Научно-техническая библиотека Национального исследовательского Томского политехнического университета (ТПУ). URL: http://www.lib.tpu.ru/mission.html.
[2]Комаров С.Ю. «Позитивный» и «негативный» внешний трафик из социальных сетей к сайтам научных библиотек // Информационные технологии в гуманитарных исследованиях. Выпуск 22: Ю.П.Холюшкин и др. Очерки по науковедению. Новосибирск: ГПНТБ СО РАН, 2017. С.128-134.
 

Опубликовано в журнале:Юком ВЕСТНИК НАУЧНЫХ КОНФЕРЕНЦИЙ. Тамбов, 2018. N 2-1(30): Наука и образование в XXI веке: по матер. междунар. науч.-практ. конф. 28.02.2018 г.: в 3 частях. Часть 1. С.73-75: табл. Библиогр.: с.75 (2 назв.). - ISSN 2412-8988. - DOI: 10.17117/cn.2018.02.01
 
Статья в формате pdfПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:57:28 2019. Размер: 28,200 bytes.
Посещение N 790 с 30.03.2018