Неожиданные факты об учете дополнительных поисковиков в Google Analytics

Приветствую, вас дорогие читатели!

Сегодня я хочу вам рассказать об одном неожиданном открытии, которое относится к работе Google Analytics. Речь пойдет о том, как на самом деле работает функция _AddOrganic (), поэтому если вы ей пользуетесь, то обязательно советую прочитать эту заметку.

Напомню, что эта функция отвечает за распознавание поискового трафика (учет поисковых запросов), с дополнительных поисковиков, которые не включены в Google Analytics по умолчанию. Эту функцию часто используют в Рунете, чтобы настроить учет ключевых слов с таких российских поисковиков как Рамблер, Нигма, go.mail.ru, webalta.ru, search.qip.ru и многих других.

С чего все началось?

А началось все несколько месяцев назад, с того, что mail.ru перевел всю свою поисковую выдачу на поддомен go.mail.ru. То есть, когда вы вводите поисковый запрос на главной странице mail.ru, то результаты поиска вам показывают на go.mail.ru. В то время, у меня на сайтах в коде Google Analytics были прописаны оба домена, через функцию _AddOrganic (). Логично предположить, что и весь поисковый трафик с mail.ru должен был теперь идти только с источника go.mail.ru.

Но, вместо этого в своих отчетах по поисковому трафику я увидел такую картину:

Трафик с mail.ru

Трафик с go.mail.ru начал падать, а с mail.ru расти. То есть все совсем наоборот. И такую картину я наблюдал на нескольких сайтах, с которыми работаю. При этом в html-коде Google Analytics у всех сайтов были одинаково прописаны оба домена:

1
2
pageTracker._addOrganic ("mail.ru","q");
pageTracker._addOrganic ("go.mail.ru","q");

Никаких изменений накануне я в код не вносил. Поэтому такое перераспределение трафика меня тогда удивило.

В чем же причина?

Я стал разбираться, почему так происходит, и мне удалось выяснить несколько интересных фактов, о которых почему-то ничего не написано в справке Google Analytics. Для начала я расскажу, как вообще выглядит процесс учета посещения с поиска. Когда посетитель с поисковика попадает на сайт, то код GA последовательно сверяет его источник со всеми функциями _AddOrganic () в коде GA. После того, как источник трафика определен, выделяется кейворд, и данные передаются в GA.

Я решил поставить эксперимент. Выбрал три разных сайта из своего актива, у которых в html-коде Google Analytics были по-разному прописаны домены mail.ru. На первом сайте, очередность определения поисковых доменов была такая:

1
2
pageTracker._addOrganic ("mail.ru","q");
pageTracker._addOrganic ("go.mail.ru","q");

На втором, такая:

1
2
pageTracker._addOrganic ("go.mail.ru","q");
pageTracker._addOrganic ("mail.ru","q");

А на третьем сайте стоял чистый код Google Analytics без использования функций _AddOrganic (). После этого, я сделал контрольные переходы с поисковика go.mail.ru на эти сайты, и вот что получилось:

Порядок определения доменов в коде GA Настоящий источник входа Источник входа по данным GA

_addOrganic ("mail.ru","q");

_addOrganic ("go.mail.ru","q");

go.mail.ru Источник: mail.ru
Тип трафика: organic

_addOrganic ("go.mail.ru","q");
_addOrganic ("mail.ru","q");

go.mail.ru Источник: go.mail.ru
Тип трафика: organic
Не определены (чистый код) go.mail.ru Источник: go.mail.ru
Тип трафика: referral

Судя по этим данным, уже можно сделать определенные выводы. Так как источник входа определяется в Google Analytics в той же последовательности, как и прописан в html-коде, то можно сделать вывод, что проверка действительно идет последовательно в том порядке, в котором прописаны функции. И при этом, после первого совпадения проверка прекращается. Иначе в первом случае поисковик был бы определен правильно.

Как раз, первый случай говорит о том, что судя по всему, проверка идет не на строгое соответствие, а на условие «содержит». А именно, если настоящий источник входа содержит в себе определение поисковика из функции _AddOrganic (), тогда в Google Analytics записывается источник из _AddOrganic (), иначе сверка продолжается. Если не найдено ни одного совпадения, источник записывается как referral (ссылочный трафик).

Также я провел дополнительные эксперименты с поисковиками Яндекс и Рамблер:

Порядок определения доменов в коде GA Настоящий источник входа Источник входа по данным GA
Не определены (чистый код) nova.rambler.ru Источник: nova.rambler.ru
Тип трафика: referral

_addOrganic ("nova.rambler.ru","query");

nova.rambler.ru Источник: nova.rambler.ru
Тип трафика: organic

_addOrganic ("blogs.yandex.ru", "text");

blogs.yandex.ru Источник: yandex.ru
Тип трафика: organic
Не определены (чистый код) blogs.yandex.ru Источник: yandex.ru
Тип трафика: organic

Весьма интересные результаты получились. Если кто не знает, то во-первых, Рамблер тоже перевел всю свою поисковую выдачу на поддомен nova.rambler.ru несколько месяцев назад. А во-вторых, еще в конце прошлого года Рамблер добавили в Google Analytics, и его трафик стал распознаваться по умолчанию.

Но, как подтверждает таблица, в Google Analytics Team не знали о том, что Рамблер перевел всю выдачу на nova.rambler.ru и поэтому их дефолтное отслеживание не работает. Отсюда вывод, для нормального отслеживания трафика с Рамблера, обязательно прописывайте в коде строчку:
_addOrganic ("nova.rambler.ru","query");

    Далее, судя по тому, что переходы с blogs.yandex.ru учитываются как с yandex.ru можно сделать два вывода:

  • гипотеза о сверке _AddOrganic () по условию "содержит" верна
  • сверка источника с поисковиками по умолчанию происходит в первую очередь.

Выводы

    Итак, подводя итоги, можно заключить следующее:

  1. В первую очередь сверка идет с поисковиками по умолчанию, а затем уже с содержимым функции _AddOrganic ();
  2. Cверка c функциями _AddOrganic (); идет последовательно в том порядке, в котором они прописаны в коде,
  3. После нахождения первого соответствия сверка прекращается,
  4. Соответствие определяется по условию: содержит ли оригинальный источник входа строку из функции _AddOrganic ();

Хорошо, с этим определились, но осталась проблема. Получается, что не корректно учитывается трафик с сайта blogs.yandex.ru. Google Analytics уитывает его как трафик с yandex.ru. Как же это исправить?

Специально для этого, в функцию AddOrganic был добавлен еще один параметр opt_prepend, который идет последним

_addOrganic(newOrganicEngine, newOrganicKeywordKey, opt_prepend)

Этот логический параметр как раз отвечает за очередность сверки, если его установить в true, то сверка будет производиться сначала с функцией AddOrganic, а уже потом с поисковиками по умолчанию.

Кстати, как оказалось, эта доработка функции AddOrganic произошла как раз 14 октября 2009 года. Вот почему на скриншоте вверху заметки отмечено, что перераспределение трафика с поисковика go.mail.ru на моих сайтах произошло 15 октября.

Советы

Итак, учитывая все выводы, полученные в этой статье, хочу дать вам несколько рекомендаций по использованию функции AddOrganic ():

1) Если вы получаете поисковый трафик с поддомена поисковика, который прописан в Google Analytics по умолчанию без поддомена, тогда используйте функцию _AddOrganic () с третим параметром true. Например, для сайта blogs.yandex.ru функция будет выглядеть так

_AddOrganic ("blogs.yandex.ru", "text", true);

2) Если вы получаете поисковый трафик с поддомена поисковика, который не прописан в Google Analytics по умолчанию, тогда для самого поисковика и для его поддомена используйте разные функции AddOrganic, без третьего параметра. При этом функция с описанием поддомена, должна идти раньше функции с описанием основного домена.

В своей оригинальной статье, про настройку Google Analytics под русские поисковики, я поправил код Google Analytics в соответствии с этими рекомендациями. Так что можете взять пример оттуда.

Если остались вопросы, пишите в комментарии. А уж отзывы тем более :)

Расскажите об этом вашим друзьям, вдруг им пригодится:
 

Хотите прочитать еще что-нибудь полезное?