This version of the page http://stat.abp.com.ua/articles/08_4.php (0.0.0.0) stored by archive.org.ua. It represents a snapshot of the page as of 2007-12-28. The original page over time could change.
Особенности национальной интернет-статистики(Часть 4).
Особенности национальной интернет-статистики(Часть 4).

Ну и одним из главных недостатков, которому сейчас придается все более важное значение, является безопасность. Предоставление доступа к статистике третьему лицу может быть крайне нежелательным. К примеру, списки рефереров, если достанутся конкурентам, могут быть использованы ими для рекламы на самых ваших прибыльных ресурсах. И это только самый невинный пример.

Теперь о лог-анализаторах. Тут все одновременно и проще и сложнее. Начнем с того, что серверные логи фиксируют всю информацию – будь то визит поискового робота, загрузка мультимедийного/ Flash / Java / Exe файла, вытягивание отдельной картинки с сервера (ох, блоггеры это любят!), и вообще позволяют вести учет трафика. Можно получать коды доступов к страницам, что невозможно учесть счетчиком (если только у вас нет кастомизированной 404-ой страницы). При наличии хорошего лог-анализатора с гибкой системой отчетов веб-мастер выудит всю нужную для себя информацию. Но… Возникает опять-таки проблема с диалапщиками. При каждом коннекте пользователю присваивается новый IP-адрес, и сервер, а следовательно, и лог-анализатор будут интерпретировать его как нового уникального посетителя, а это не так. Эта проблема решена счетчиками в виде вышеупомянутых куки, но в лог-файлах куки не фиксируются никак. Далее. Как известно, в больших офисах, как правило, пользователи выходят в Интернет через прокси-сервер, который присваивает одинаковый IP-адрес всем пользователям. То есть, теоретически, даже если в корпорации работает 100 человек, и десять из них (представим себе) зайдут на ваш сайт, то сервер зафиксирует их как одного посетителя. Если вы ориентируетесь на корпоративного клиента, то погрешность получается весьма ощутимая. Кроме того, прокси-сервера, как правило, кешируют содержимое запрошенных страниц, а следовательно, все последующие пользователи, которые сидят за прокси, получают, по сути одну и туже версию страницы.

Кажется, единственным решением в данной ситуации может быть комбинация двух видов статистики. Но как этого добиться? Ведь счетчик тянется из сервера провайдера статистики, а логи лежат на сервере, где установлен сайт. Никто из провайдеров статистики пока не предлагает комбинированного подсчета. Тем не менее, сервисы, которые комбинируют два вида статистики существуют. Так, провайдеры хостинга иногда предлагают свои собственные разработки в области статистики. Как правило, они несовершенные, но могут удовлетворить базовые требования к статистике.

Давайте же представим идеальную систему подсчета. Как она должна выглядеть? Представьте себе, вы устанавливаете у себя на сайте свой собственный счетчик, который вызывается с вашего же сервера. Полученная статистика фиксируется специализированной программой. Но этого по условию задачи недостаточно – ведь у нас остаются незадействованными логи с их преимуществами. Эта же программа является лог-анализатором и обрабатывает как статистику со счетчика, так и информацию, зафиксированную в логах. Конечно, такую систему намного проще себе представить, если у вас есть свой собственный сервер и вы имеете полные администраторские права. Если же вы покупаете хостинг, это может повлечь за собой некоторые проблемы – так не все провайдеры предоставляют доступ к логам – но это вопрос скорее выбора провайдера. Возникает еще одна проблема – насколько будет высоко доверие рекламодателей к такой статистике, ведь известно, что данными счетчиков определяется цена рекламы на вашем сайте. Где гарантия, что вы не накручиваете свою статистику?

Тем не менее, пока, поскольку таких систем нет, приходится комбинировать два вида сбора статистики и находить середину. К сожалению, показания счетчиков и лог-анализаторов могут различаться в десятки раз.

Юрий Коберский