Важная особенность работы Google Analytics, которая влияет на качество данных
Приветствую, вас!
Вчера участвовал в онлайн-секции RIW 2009. Понравился доклад Романа Зыкова на тему «Анализ эффективности продвижения». Советую всем посмотреть, там дается методика оценки эффективности источников трафика для сайта.
В этом докладе Роман обозначил одну проблему, которая возникает при отслеживании трафика с помощью Google Analytics. И обозначил варианты ее решения. К сожалению, в докладе не было наглядных примеров этих решений. Но, к счастью, я в своей практике уже использовал подобные приемы.
Поэтому решил, что вам тоже будет полезно узнать об этом. Тем более, если вы работаете с Google Analytics. Так что сегодня я расскажу об этой проблеме, и дам вам готовый механизм для ее решения.
Проблема при отслеживании трафика
Когда на ваш сайт поступает входящий трафик, Google Analytics определяет тип этого трафика, и в зависимости от этого, присваивает ему определенные атрибуты. Например, если трафик определяется как поисковый, то ему присваиваются такие атрибуты как название поисковика и ключевое слово.
Всего в Google Analytics существует 4 типа трафика:
1) Рекламные кампании (Campaigns)
2) Поисковый трафик (Organic)
3) Ссылочный трафик (Referral)
4) Прямой трафик (Direct [none])
Каждому типу трафика соответствуют свои атрибуты. Когда посетитель попадает к вам на сайт, то Google Analytics создает несколько файлов куки (cookies), в которых будет храниться информация о посещении вашего сайта. Данные об источнике перехода, записываются в куке _utmz, а затем передаются на сервера Google Analytics, чтобы вы могли увидеть их в отчетах. Время жизни этой куки 6 месяцев.
Дак вот, при каждом новом посещении с внешнего источника эта кука перезаписывается. И в Google Analytics уходят данные об источнике нового посещения. В результате вы можете посмотреть, все источники, с которых к вам приходил один посетитель.
Главная особенность работы этой куки в том, что если посетитель пришел через прямой трафик (например, просто набрал адрес в браузере), то эта кука НЕ перезаписывается, и в отчет попадают данные, которые были в ней сохранены до этого посещения. А данные о прямых заходах фиксируются только тогда, когда при этом кука _utmz создается впервые, то есть посетитель впервые попал на сайт.
Рассмотрим это на примере. Посетитель попал на ваш сайт через поисковик. В куке сохранились данные о поисковике и поисковом запросе. Далее посетитель посмотрел сайт, сохранил его в закладки браузера, и ушел. Затем дня через два, он вернулся на сайт по этой закладке. Как вы думаете, какой источник трафика для этого посещения будет отправлен в отчет?
Если кука не была удалена специально, то к этому заходу будут присвоены атрибуты поискового трафика, хранящиеся в куке с прошлого раза. Не смотря на то, что в этот раз посетитель зашел через закладку.
Поэтому, не весь трафик с offline закладок учитывается как прямой трафик (direct), имейте это в виду.
Такой алгоритм работы Google Analytics, приводит к проблеме — когда вы пытаетесь отследить эффективность какого-то источника трафика, то данные могут быть не корректны.
Например, посетитель пришел на ваш сайт по рекламному баннеру. В cookie _utmz записалась информация об этой рекламной кампании. Посетитель изучил сайт, заинтересовался вашим товаром, но сразу покупать не стал, и ушел. Через неделю, когда появились деньги, он вспомнил про ваш сайт, и стал искать его через поисковик. Нашел по какому-то запросу, зашел на сайт и купил то, что нужно. В этом случае, информация в _utmz перезаписалась на данные из поисковика. А также, к этим данным была приписана и покупка, которую совершил посетитель.
В результате получается, что результат мы получили не от рекламного баннера, а от поискового трафика.
Как решить эту проблему
Для решения этой проблемы, существует 2 метода:
Первый метод заключается в том, чтобы использовать в ссылках параметр utm_nooverride. Пример использования: www.site.com/products.php?utm_nooverride=1
В этом случае, существующая кука не будет перезаписана информацией с этого перехода. Но, такой метод не совсем удобен в использовании. Во-первых, не все переходы, можно пометить этим параметром (например, поисковый трафик). Во-вторых, данные по источнику с таким параметром, не будут учтены. Используйте данный метод, только если он подходит под ваши задачи.
Второй метод заключается в том, что первый источник трафика, с которого пришел посетитель, сохраняется в отдельную переменную, которая не будет перезаписываться. В этом случае можно оценить эффективность, как первого источника, так и последнего. Данный функционал не входит в базовые возможности Google Analytics, поэтому для реализации этого метода, надо писать свой java-скрипт. Исходный код моего скрипта можете скачать здесь.
Принцип его работы такой:
1) Достаем всю информацию об источнике из куки _utmz
2) Собираем полученные данные в одну строку. Формат строки такой: название кампании+источник+тип трафика+кейворд+содержание кампании. Как видно, учитываются все параметры трафика.
3) Записываем эту строку в пользовательскую переменную.
В моем случае, для хранения данных об источнике перехода, используется пользовательская переменная, которую можно задать функцией pageTracker._SetVar (); Поэтому, если вы уже используете эту переменную для своих целей, то мой скрипт у вас работать не будет.
Этот скрипт надо расположить на основных страницах входа на ваш сайт. Список этих страниц можно получить в Google Analytics, в разделе «Содержание -> Самые популярные страницы входа». После чего, информацию о первых источниках, можно увидеть в отчетах по источникам трафика, выбрав в выпадающем меню «Размер», пункт «Переменная определенная пользователем»:
На самом деле, данная особенность работы Google Analytics, не для всех является проблемой. Все зависит от особенностей вашего сайта и анализа его работы. Прежде чем внедрять какое-либо из этих решений, спросите себя:
«На данный момент, для моего бизнеса, эффективность какого источника трафика оценивать важнее — того, который привел к первому знакомству с сайтом, или того, который привел к нужному действию (продаже, регистрации, и т.п.)?»
Если выбор падет на последний источник трафика, то вам ничего внедрять не нужно. Если на первый, то можете использовать описанный метод.
Ну вот, на сегодня это все, желаю успехов в реализации. Если остались какие-то вопросы, задавайте.
Также было бы интересно, пообщаться с теми, кто тоже сталкивался с подобной проблемой. Может быть, вы использовали другое решение?
Расскажите об этом вашим друзьям, вдруг им пригодится:
Хотите прочитать еще что-нибудь полезное?
7 комментариев Включайтесь в обсуждение!
Получается, что если я использую Ваш Фильтр №3: Показать полный путь источника, то я не могу пользоваться решением из этой статьи?
Спасибо за статью и за скрипт. Сейчас столкнулся с необходимостью помечать первоисточник трафика — к методу дошел сам, а вот скрипт пригодится на все 100%
Небольшая оптимизация скрипта :
Проверку на наличие __utmv куки стоит вставить в начало скрипта, и если она уже есть, то не стоит дальше выполнять скрипт.
Владимир, спасибо за совет.
Да, Сергей. Но эту проблему можно решить через пользовательские переменные, тогда и фильтр будет работать.
А как посчитать для каждого источника трафика количество первых заходов пользователей. т.е. если посетитель зашел через закладку 2,3й раз — чтоб не суммировалось?
Данил, на самом деле все очень просто: количество первых заходов пользователей — это количество новых посещений(визитов). Все остальные посещения будут считаться вернувшимися.
Подписаться по RSS: