Modélisation des données dans Google analytics 4

Par Maurice Largeron

Consultant Formateur Marketing Digital chez MLConseil depuis 2011. Agence Google Partner. Organisme Certifié Qualiopi.

13 juin 2022

Comment, face aux obligations de demande de consentement, Google analytics 4  parvient-elle à modéliser certains rapports en cas de refus de collecte de données à des fins statistiques* ?   En cas de refus visiteur , il en résulte des scénarios de mesure incomplets, empêchant les entreprises d’obtenir des réponses à des questions telles que :

  • Combien d’utilisateurs actifs quotidiens ai-je sur un site web ?
  • Combien de nouveaux utilisateurs ai-je acquis lors de ma dernière campagne ?
  • Quel est le parcours de l’utilisateur depuis son arrivée sur mon site web jusqu’à l’acte d’achat ?
  • Combien de visiteurs de mon site sont basés en Allemagne ou au Royaume-Uni ?
  • Quelle est la différence de comportement des utilisateurs entre les visiteurs mobiles et les visiteurs web ?

Qu’est ce que la modélisation, à quoi sert-elle ?

La modélisation comportementale en mode consentement vise à combler ce manque de données en modélisant le comportement des utilisateurs qui refusent les cookies analytiques sur la base du comportement d’utilisateurs similaires qui acceptent les cookies analytiques. Les données « d’entraînement » utilisées pour la modélisation sont basées sur les données des utilisateurs consentants de la propriété où la modélisation est activée.

Par exemple, la modélisation comportementale estime des données basées sur des métriques d’utilisateur et de session, telles que les utilisateurs actifs quotidiens et le taux de conversion, qui peuvent être inobservables lorsque des identifiants tels que les cookies ou les ID utilisateur ne sont pas entièrement disponibles.

Données modélisées vs. données observées

Lorsque les utilisateurs visitent un site et donnent leur consentement pour les cookies Analytics ou lorsqu’ils ne refusent pas la personnalisation à l’aide de l’ID publicitaire dans les paramètres Android, Analytics associe le comportement de l’utilisateur à divers identifiants pour assurer la continuité de la mesure. Google qualifie ce type de données de données observables car elles proviennent d’utilisateurs qui  ont donné la permission d’observer leur comportement.

Lorsque les utilisateurs n’autorisent pas l’utilisation des cookies Analytics ou d’identifiants d’applications équivalents, les événements ne sont pas associés à un identifiant d’utilisateur persistant. Par exemple, si Analytics collecte 10 événements de pages vues, il ne peut pas observer et signaler s’il s’agit de 10 utilisateurs ou d’un seul. Au lieu de cela, Analytics applique un apprentissage automatique pour estimer le comportement de ces utilisateurs en se basant sur le comportement d’utilisateurs similaires qui acceptent les cookies analytiques ou les identifiants d’application équivalents.

L’approche de modélisation comportementale de Google

L’approche de modélisation comportementale de Google applique les meilleures pratiques d’apprentissage automatique suivantes.

Vérifiez l’exactitude et communiquez les modifications

La validation permanente des données permet de maintenir la précision des modèles de Google. Les données utilisateur estimées sont comparées à une partie des données utilisateur observées qui ont été retenues pour l’apprentissage du modèle, et les informations sont utilisées pour ajuster les modèles. Google communique les modifications susceptibles d’avoir un impact important sur les données.

La maintenance d’ un reporting stricte

La modélisation comportementale n’est incluse que lorsqu’il existe une confiance élevée dans la qualité du modèle. Les conditions préalables doivent être remplies. Par exemple, si le trafic consenti n’est pas suffisant pour alimenter le modèle, les événements déclenchés par des utilisateurs non consentants ne sont pas signalés. Cela permet de garantir l’exactitude des données.

La personnalisation du business  entreprise

L’algorithme de modélisation plus général de Google est appliqué séparément pour refléter le comportement unique d’une entreprise et de ses clients.

Comment la modélisation comportementale apparaît dans Google Analytics ?

Analytics intègre de manière transparente les données modélisées et les données observées dans les rapports. Lorsqu’Analytics inclut des données modélisées, on constate  des différences par rapport aux rapports qui n’incluent que des données observées (par exemple, un nombre d’utilisateurs plus élevé dans les rapports qui incluent des données modélisées).

Les administrateurs peuvent gérer la modélisation comportementale pour le mode de consentement dans Admin > Colonne de propriété > Identité de rapport.

Utilisez l’icône de qualité des données (illustrée ci-dessous) pour savoir quand les données modélisées sont intégrées.

icones sur Echantillonnage et modélisation

icones sur Echantillonnage et modélisation

Le tableau suivant résume les messages que l’on peut  voir via l’icône .

GA4 qualité des données

GA4 qualité des données

Certaines pages de l’interface Analytics affichent également une bannière contenant des informations sur l’état de la modélisation.

Le tableau suivant résume les messages vus via une bannière.

GA4 qualité des données sur bannière

GA4 qualité des données sur bannière

Prérequis pour avoir une modélisation des données

Cette modélisation n’est pas pour tout le monde ! Il faut avoir un site avec quand même du trafic , minimum 30000 visiteurs par mois , avec autant d’évènements etc , sinon vous avez souvent ceci en survolant l’icône

Icone ga4 données disponibles

Icone ga4 données disponibles

 

A noter selon Google : le mode de consentement pour les pages Web doit être mis en œuvre de sorte que les balises soient chargées avant l’apparition de la boîte de dialogue de consentement. De cette façon, les balises Google adapteront leur comportement en fonction du choix de l’utilisateur en matière de consentement aux cookies. Veillez à charger les balises Google dans tous les cas, et pas seulement si l’utilisateur donne son consentement. Cela garantira que Google reçoit des pings sans cookie, ce qui améliore la précision de la modélisation pour les propriétés utilisant Google Analytics 4.

Pour réussir l’entraînement des modèles comportementaux, Analytics exige que qu’une propriété Google Analytics 4 remplisse les conditions suivantes :

Le mode consentement est activé sur toutes les pages de d’un/des site(s) et/ou sur tous les écrans de d’une/des application(s).

  • Au moins 1 000 événements quotidiens avec analytics_storage=’denied’ pendant au moins 7 jours.
  • Au moins 1 000 utilisateurs quotidiens envoyant des événements avec analytics_storage=’granted’ pendant au moins 7 des 28 jours précédents. Notez qu’il peut être nécessaire d’atteindre le seuil de données pendant plus de 7 jours au cours de ces 28 jours pour réussir à entraîner le modèle ; cependant, il est possible que même les données supplémentaires ne soient pas suffisantes pour qu’Analytics entraîne le modèle.
  • la modélisation comportementale commence à partir de la date à laquelle une propriété donnée devient éligible.

Pour conclure les fonctions non prises en charge pour la modélisation

Les fonctionnalités suivantes ne prennent pas en charge l’utilisation des données comportementales modélisées :

  • Audiences
  • Rapports et cartes en temps réel avec des données en temps réel
  • Explorations, à l’exception des tableaux de forme libre
  • Segments
  • Métriques prédictives
  • Exportation de données

* Cet article est issu du support google analytics 4 anglais.

En savoir plus sur ce sujet…

Pin It on Pinterest