Почему в direct попадает другой трафик и как это исправить
Если ваш direct трафик Сеансы, когда пользователь ввел URL сайта в поиске или использовал закладку выше 30%, не спешите открывать шампанское и отмечать потрясающую узнаваемость компании. Вполне возможно, что Google Analytics определил в direct трафик посещения сайта, которые на самом деле к нему не относятся.
Почему так происходит? Причины могут быть техническими (обрывы сессий, редиректы и т.д.) и технологическими (переходы на сайт из мобильных приложений, email, мессенджеров и т.д.).
К какой проблеме это приводит? Невозможно правильно оценить эффективность источников трафика, которые ошибочно записываются в direct.
В этой статье вы узнаете, как найти и устранить недочеты, которые искажают статистику по источникам трафика в GA.
Причины, по которым GA определяет сессии в direct трафик
Google Analytics ищет информацию об источниках трафика в следующей последовательности:
- Сначала GA проверяет наличие Adwords/DoubleClick тегов ( gclid Параметр автоматической пометки AdWords. Добавляется в URL целевой страницы, когда пользователь нажимает на объявление / gclsrc Параметр автоматической пометки DoubleClick Search ).
-
Затем — наличие
UTM-меток
Переменная, которая добавляется в URL и позволяет системе веб-аналитики получить дополнительную информацию об источнике трафика
(
UTM_source/UTM_medium
и т.д.). Подробнее о UTM-метках читайте в нашей статье. - После ищет HTTP referrer В протоколе HTTP один из заголовков запроса клиента. Содержит URL источника запроса .
- И наконец, Google Analytics пытается идентифицировать пользователя по clientID или userID, проверяя совпадение за последние 4 часа, и привязать данные о хите к последней сессии пользователя. Например, пользователь перешел на сайт из рекламного объявления и через 2 часа купил товар в офлайн-магазине. Если данные о покупке отправляются в Google Analytics через Measurement Protocol и пользователя удается распознать по userID, хит (совершенная транзакция) будет засчитан в последнюю онлайн-сессию пользователя, у которой уже есть источник трафика (в нашем примере — google/cpc).
Чтобы определить источник трафика, достаточно одного из этих параметров. Если ничего из перечисленного не найдено, GA записывает источник трафика — direct.
Детальная схема обработки данных описана в справке GA.
По нашему опыту, в крупных проектах в direct попадает до 15% сессий, которые на самом деле к нему не относятся. Причины происходящего можно условно разделить на три группы: сессии, при которых не передается реферер, обрывы сессий и другое.
Не передается реферер
HTTP Referer — в протоколе HTTP один из заголовков запроса клиента. Содержит URL источника запроса. Если перейти с одной страницы на другую, то referer второй страницы будет содержать адрес первой страницы.
Реферер не передается в таких случаях:
- Переходы по ссылкам из оффлайновых документов: PDF, Word, Power Point и т.д.
- Переходы из мобильных и стационарных приложений: Skype, Viber, Facebook, VK, Google Search и т.д.
- Переходы из Email: Microsoft Outlook, Thunderbird и т.д.
- Отправка данных по Measurement Protocol без указания source/medium.
-
Редиректы без передачи HTTP заголовка или UTM-меток в ссылке. Например, пользователь
зашел по ссылке site.com, но система перенаправила его на site.ru.
Если при редиректе не передавать HTTP заголовок (в т.ч. реферер, который привел
посетителя на сайт, например, facebook.com) или UTM-метку в конечной ссылке
(
google.ru/?UTM_source=facebook&UTM_medium=cpc
), то данный трафик будет попадать в direct. Чаще всего эта ошибка возникает, если вы делаете редиректы на стороне клиента (с помощью javascript). - Переходы c HTTPS на HTTP страницы (согласно п. 5.5.2 в стандартах работы Web). Например, если у вас сайт на HTTP, то переходы без UTM-меток c https://www.youtube.com/ будут засчитываться в direct, потому что зашифрованный протокол передачи данных HTTPS не передает реферер.
- Посетитель включил настройки приватности браузера (режим инкогнито) и дополнения для блокировки скриптов вроде ScriptSafe (установить можно здесь) и других.
-
Ошибки в коде. Иногда ошибки в скриптах могут обновлять куки, и этот трафик
будет записываться в direct. Также при указании в коде ссылки
<а href=..>
атрибута‘rel=noreferrer’
реферер передаваться не будет. -
Ошибки, когда браузер не передает реферер. Например в IE8 теряется реферер при
использовании редирект метода
Javascript:location.href
иMeta refresh — 0
. Также Internet Explorer теряет реферер, когда пользователь нажимает на ссылку, которая использует JS метод window.open или когда пользователь нажимает на линк, вставленный во Flash приложение. - Неправильная UTM-разметка кампании (например, UTMSource вместо UTM_source). Если у ссылки есть UTM-метка, то GA игнорирует реферер. В тех случаях, где разметка ссылки не соответствует справке, визиты будут записывать в direct.
Обрывы сессии
Пользовательские сессии могут обрываться в следующих случаях:
- Отсутствие GA/GTM кода на посадочных страницах сайта. При переходе с посадочной страницы без GA кода на следующую страницу вашего сайта в реферер запишется собственный URL и UTM-меток уже не будет. GA запишет эту сессию в direct (если собственный домен добавлен в «Список исключаемых источников перехода») или в referral (если не добавлен).
- Авторизация через социальную сеть с полным переходом на нее вместо авторизации через всплывающее окно.
- Медленно загружается код GA — пользователь переходит на следующую страницу сайта до загрузки кода.
- Отправка хита весом более 8 кбайт на посадочной странице. Хит не будет отправляться в GA, соответственно сессия будет обрываться.
- Некорректная настройка кросс-доменного отслеживания.
Другие причины, которые искажают данные по direct трафику
Посещения сайта сотрудниками компании. Их можно исключать по IP адресам, специальным cookies на корпоративных/промежуточных страницах, с помощью расширений в браузерах или фильтров в Google Analytics.
Посещения сайта ботами. Найти IP-адреса ботов можно в логах сайта или с помощью OWOX BI Pipeline, собрав данные об активности на сайте в Google BigQuery. Вычислять ботов рекомендуем:
- По поведению на сайте. Например, время визита до 2 секунд, отсутствие транзакций, высокий показатель отказов и т.д.
- По User Agent (браузеры, провайдеры, локация, устройства). Например, один провайдер (site.ru), один регион (Москва, Россия).
Краткие рекомендации по поиску проблем
Определив проблемы с direct трафиком, вы сможете исправить статистику по источникам трафика и, соответственно, точнее оценивать ROAS.
Как решить проблемы с передачей referrer:
- Проставить UTM-метки на всех ссылках (как размечать кампании, описано в статье «Что такое UTM-метки и как их применять»).
- Создать пользовательский параметр уровня хита и записывать в него значение referrer, а потом анализировать данные в специальных отчетах.
Как найти проблемы с обрывами сессий:
- С помощью консоли разработчика и GA debugger.
- С помощью записей сессий в Google Tag Assistant.
- Проверить наличие GA/GTM кода на страницах сайта, используя Screaming Frog или другие сервисы.
Мы подготовили наглядное руководство, как найти проблемы с direct трафиком, и готовы поделиться. Укажите email, на который вам его отправить.