Канн С.К. Проблема выбора инструментов для сбора и анализа веб-статистики библиотечного сайта
Навигация
СОВРЕМЕННОЕ ОБЩЕСТВО, ОБРАЗОВАНИЕ И НАУКА*30.09.2015  
 
Обложка

КАНН С.К. (ГПНТБ СО РАН, Новосибирск)
 
ПРОБЛЕМА ВЫБОРА ИНСТРУМЕНТОВ ДЛЯ СБОРА И
АНАЛИЗА ВЕБ-СТАТИСТИКИ БИБЛИОТЕЧНОГО САЙТА

По мере развития библиотечного интернета все чаще появляются данные о деятельности библиотечных сайтов. При этом мало кто указывает источники их получения и не комментирует, что имеется в виду под распространенными терминами «посещений», «обращений» и пр. Складывается ситуация, когда без соответствующих оговорок значение большинства приводимых цифр можно считать ничтожным. Сайты настолько индивидуальны, а технология получения данных настолько непредсказуема, что каждый показатель рождает сомнения. При этом адекватность веб-статистики определяется следующими важнейшими факторами: 1) спецификой организации информации на сайте (объемом и структурой ресурсов; наличием серверных «зеркал» и/или кросс-доменных ресурсов; типом контента - статическим, динамическим или смешанным); 2) технологией сбора е-метрик и особенностями трактовки понятий («хитов», «посещений», «страниц»); 3) используемыми инструментами (анализ логов, внешние системы аналитики, etc.).

Существенно и то, что сложившиеся особенности веб-среды как бы выносятся за скобки. Показатели статистики рассматриваются как результат идеальных, «добропорядочных» отношений между библиотечными сайтами и их пользователями. Между тем, сетевые обмены не всегда носят идиллический характер. Сайты подвергаются вредоносным воздействиям в самом широком смысле и диапазоне - от простого хулиганства до попыток взлома и спамерских атак. В итоге происходит искажение текущей и долгосрочной статистики.

Не секрет, что библиотечная информация является самым актуальным, универсальным и политематическим видом информации. Сайты библиотек концентрируют массу ключевых слов (поисковых терминов), привлекательных текстов и «высоколиквидных» ссылок. Открытые бесплатные библиотечные ресурсы массового спроса становятся привлекательным средством для продвижения низкоконкурентных сайтов, нацеленных на продажу товаров и услуг. Часть вебмастеров не считает зазорным использовать популярные трастовые ресурсы в качестве «доноров» SEO-оптимизации, делая попытки монетизировать спам в прибыль. Им в помощь создаются специализированные веб-сервисы SEO анализа, содержащие рекомендации как обходить блокировки или оценивающие вероятность фильтра на исходящие ссылки (XTool.ru и др.). Не вдаваясь в подробности, можно констатировать, что качество библиотечной веб-статистики зависит как от четкого взаимодействия информационных и технических служб сопровождения сайтов, устанавливающих фильтры и отсеивающих спам, так и от гибкости используемых инструментов статистики.

В этом смысле лучшим решением для библиотек, на наш взгляд, была бы разработка специализированного программного обеспечения, адаптированного к специфике библиотечной деятельности. Созданный инструмент позволил бы не только сравнивать показатели совершенно разных сайтов, но и значительно ограничил бы возможности манипулирования веб-статистикой.

В настоящий момент сбор и анализ достоверных данных о работе сайтов библиотек возможен лишь на основе комплексных решений и с использованием множества инструментов - специализированных модулей веб-статистики, лог-анализаторов, счетчиков-трекеров, веб-рейтингов и систем интернет-аналитики. Все они не лишены недостатков, а их многообразие, сопряженное со свободой выбора в отношении любых доступных инструментов, делает сопоставление деятельности учреждений абсолютно невозможным.

Опыт Отделения ГПНТБ СО РАН (www.prometeus.nsc.ru) показывает, что использование внутренней системы лог-анализа доступов к сайту AWStats, даже в новейшей версии, обеспечивает большой объем разнообразных данных о деятельности сайта, но не гарантирует от заблуждений и ошибок. У этой системы, кстати, далеко не самой худшей, все-таки имеются существенные недостатки. Например, она лишена «тонкой» настройки фильтров, из-за чего детальная структуризация данных по ботам и уникальным посетителям, по доступу к ресурсам (совокупностям страниц) и по взаимному сопоставлению одного с другим или вовсе невозможны, или же требуют титанического труда по ручному обсчету показателей, вычислению процентов, коэффициентов и пр. AWStats не позволяет отфильтровывать и изучать «просмотры», превышающие 30-секундный интервал пребывания, поэтому итоговая статистика загрязняется анонимными ботами. Наконец, 15-летний опыт использования убеждает в том, что если доступ к веб-статистике AWStats делается свободным и открытым для всех желающих, что вполне естественно для библиотечного сайта, то php-код системы становится соблазнительной приманкой для хакеров и спамеров всех мастей. Например, по итогам 2014 г. число доступов к статистике AWStats (846 027 обращений - 137% к уровню прошлого года) превысило показатели даже титульной страницы www.prometeus.nsc.ru (814 114). После этого было решено запаролить открытый доступ к статистике AWStats.

Из ныне имеющихся инструментов сбора и анализа статистики самыми предпочтительными представляются системы Яндекс-Метрики и Гугл-Аналитики, генерирующие более правдоподобные данные. Возможно, что до создания специальных библиотечных инструментов эту веб-статистику следует включать в библиотечные отчеты по сайту. Обе системы хорошо справляются с фильтрацией спам-ботов (по строгим правилам и по поведению), а в их разработке участвуют профессиональные коллективы программистов. Конечно, и в случае названных систем невозможно гарантировать получение идеально точных результатов, чему немало причин: ошибки в установленном коде отслеживания, отказ в реализации скриптов на стороне пользователя (при анонимизации, сбоях или отключении javascript браузера), блокирование, потеря активности или очистка cookies и т.п. Но при корректной настройке трекинга даже собранных данных вполне достаточно для принципиальной оценки основных трендов развития сайта и принятия эффективных решений.

В заключение хотелось бы пожелать разработчикам Я-Метрики, которая работает на сайте Отделения уже более 4-х лет, обращать внимание не только на запросы частных и коммерческих структур, но и на нужды общественных библиотек, разработав для этого специализированные библиотечные модули с параметрами, настраиваемыми на библиотечные показатели.

 

Опубликовано в журнале:Юком ВЕСТНИК НАУЧНЫХ КОНФЕРЕНЦИЙ. - Тамбов, 2015. - N 1-4(1): Современное общество, образование и наука: по матер. междунар. науч.-практ. конф. 30.09.2015 г.: в 5 частях. Часть 4. - С.77-78. - ISSN 2412-8988. - DOI: 10.17117/cn.2015.01.04
 
 ПубликацииПубликации С.Канна
[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:57:32 2019. Размер: 17,172 bytes.
Посещение N 1108 с 02.11.2015