Les données sont, depuis toujours, la nourriture des systèmes d’information et le carburant des entreprises. Ces dernières années, les capacités de collecte, de stockage, et de génération ont augmenté de manière exponentielle. Il s’agit donc maintenant de distinguer, dans cette masse, les données qui sont critiques pour le métier, nécessaires à l’organisme (l’information), et celles qui sont rejetées ou feront l’objet d’accumulation malsaine (les mauvaises graisses en somme). Si ces “données déchets” ne posent plus de problèmes technologiques (Big Data, stockage) elles complexifient la gouvernance.
En effet, après la phase de collecte des données, ces “data déchets” sont facilement identifiables mais peuvent prendre une place considérable s’il n’y a pas de contrôles effectués. De ce fait, il est nécessaire de vérifier continuellement les méthodes d’acquisition de votre trafic avec la data quality.
Pourquoi la data quality ?
Ces dernières années, les enjeux liés à la “Transformation digitale”, au “Big Data”, “etc., sont passés de tendances à enjeux importants pour les entreprises. Ces concepts sont maintenant ancrés et imputables à la stratégie omnicanale de toutes les entreprises. Cependant ce virage tactique ne s’est pas fait sans erreurs. Toutes les informations présentes dans vos bases de données ne sont pas en l’état exploitables et certaines peuvent même être totalement erronées ! Malheureusement ces données incorrectes représentent un poids plus que conséquent. Selon IBM, en 2016, le coût annuel des problèmes de data quality s’élevait à 3,1 billions de dollars et ça rien qu’aux États-Unis.
Et le monde de la publicité en ligne dans tout ça ? Ce domaine ne fait pas exception à ces problématiques. Les campagnes que vous trackées ne sont pas utilisables dès réception des données. La plupart doivent être retravaillées en aval pour en sortir des résultats non aberrants.
Comment en est-on arrivé là ?
A l’appui des nouvelles technologies en lien avec les données, un constat : tracker les performances web de votre entreprise est aujourd’hui une action habituelle.
En revanche, on ne se préoccupe que rarement de la qualité de ces données. Il y a encore quelques années les statistiques collectées étaient encore assez rare. Il était donc aisé de faire des corrections quasiment en temps réel. Aujourd’hui, le problème est totalement opposé. La surabondance des données ne permet plus de voir “en un coup d’œil” si les résultats des campagnes présentes un résultat attendu ou s’il y a des ajustements à faire.
Conséquences si l’on a des data non dignes de confiance ?
Si votre secteur d’activité se situe essentiellement en ligne vous avez plus qu’intérêt à être certain de la qualité de vos données.
Les “data déchets” peuvent impacter votre stratégie omnicanale sur plusieurs niveaux. La première idée qui peut venir à l’esprit est la notion d’espace de stockage. Même si vos bases de données ont la capacité de garder un flux plus que conséquent, les coûts de maintien et d’entreposage ne sont pas négligeables. En effet, si vous captez les informations d’un utilisateur (visites sur votre site, conversions etc.) mais que par mégarde celles-ci sont erronées et même dédoublées, cela peut avoir des conséquences négatives sur vos analyses.
Et cet enjeu est l’un des plus important. L’analyse des données est le moteur de toutes nouvelles stratégies. En effet, selon une enquête récente de l’OMC le recours au web analytics pour la prise de décisions est passé de 30 % à 42 % au cours des cinq dernières années. Près de la moitié des entreprises utilisent les informations provenant du web et en sont satisfaites.
Néanmoins, Le contrôle de ces informations n’est pas fait par tous. D’après Halobi, que l’on soit une grande ou une petite structure, entre 20 et 40% des data utilisées se trouvent être incorrectes.
Si vous aussi vous utiliser les data web, vous êtes-vous déjà posé cette question : est-ce que mes données reflètent la réalité ? Si votre réponse est non, n’ayez crainte, nous vous donnons quelques conseils pour optimiser l’exploitation de vos données.
Améliorer le contrôle des données pour être juste
Malgré toutes vos précautions, il est difficile de n’avoir que des données de bonne qualité. Mais cela ne veut pas dire qu’aucune action n’est possible pour optimiser la qualité de ces données. Ces quelques conseils ci-dessous vous aideront à diminuer cette part d’informations erronées pour qu’elles deviennent non significatives.
Trackez ce dont vous avez besoin mais trackez le bien !
Pourquoi parle-t-on ici du tracking ?
Tout simplement parce que c’est le premier processus à prendre en compte pour la data quality.
L’objectif n’est pas de vous proposer un guide pour tracker vos campagnes mais de vous révéler l’importance de la data quality pour votre activité.
Avant tout lancement de vos campagnes et de mise en place de votre plan de taggage, vous devez vous assurer que tous les éléments que vous avez sont cohérents. Que ce soit le nom de vos campagnes, les UTMs utilisés ou la période d’activation, il est capital de vérifier que tout soit en ordre. Si par mégarde vous n’avez pas ajouté le bon code de tracking pour une campagne ou que vous n’avez pas mis les bonnes informations, de nombreux risques peuvent émerger.
Déduplication des données, non remontée des informations d’une campagne etc. sont les problèmes majeurs que vous encourez si vous ne prêtez pas une attention particulière à cette première phase.
Notez précisément toutes les informations inhérentes à vos campagnes (nom, période d’activation, UTMs utilisés, le partenaire qui travaille avec vous sur cette campagne…). Tout cela pour confirmer que vous n’omettez rien et donc ne pas avoir besoin de revenir sur ces paramètres dans l’avenir.
Campagnes bien trackées, la data quality s’arrête ici ?
Hélas ce n’est malheureusement pas la fin de votre périple dans ce domaine. S’assurer de la qualité des données ne peut se faire qu’à un instant T. Celle-ci doit être réalisée le plus souvent possible.
Petit cas pratique : vous faites partie d’une société spécialisée dans le e-commerce. Pour comprendre les parcours et les interactions de vos utilisateurs vous avez décidé de mesurer la performance de votre site et de vos campagnes publicitaires. Vous avez donc mis en place votre plan de taggage, vos campagnes avec les utm de tracking analytics.
Satisfait, vous attendez patiemment que votre base de données se remplissent. En théorie, vos data sont rangées et classées comme dans une salle d’archives. Ainsi vous pouvez accéder facilement à toutes les données que vous souhaitez.
Toutefois, dans la vraie vie votre salle d’archives ressemble plus à une chambre d’ado : vos données sont éparpillées dans tous les sens et parfois manquantes. Alors oui, vous trouverez peut-être ce que vous cherchez mais cela vous prendra plus de temps que prévu et vous n’êtes pas certain d’avoir tous les éléments que vous vouliez.
L’un des problèmes récurrents dans l’analyse des données web est donc de “ranger votre base de données” et de vous assurer que rien ne manque.
Et cette méthode est chronophage mais aussi très coûteuse ! Vous passerez plus de temps à nettoyer vos données plutôt qu’à les étudier pour en sortir des insights pour votre stratégie
Le conseil de Wizaly : contrôlez une fois par mois (ou plus si vous le pouvez), les KPIs les plus importants pour votre activité par rapport à la période précédente. Ainsi, s’il y a une baisse de trafic anormal d’un mois à l’autre, vous pourrez réaliser les actions nécessaires pour y remédier. Ici le mot d’ordre est donc la régularité !
Quels sont les profits de la data quality ?
Avoir des données de bonne facture est assez important pour votre entreprise.
Cela vous donnera l’opportunité de :
- Produire un marketing plus précis et plus ciblé
- Prendre de bonnes décisions sur l’avenir de votre entreprise grâce à des informations fiables
- Augmenter la satisfaction de la clientèle et maintenir les coûts d’opportunités à un faible niveau
Certes cela peut prendre du temps pour mettre en place ou pour faire vos vérifications. Mais au global, vous dépenserez moins d’argent, nettoyer vos données vous permettra d’augmenter vos revenus (puisque vos analyses refléteront la réalité).
Avec ces quelques conseils, vous n’aurez plus de problèmes majeurs. Reste le plus difficile : faire perdurer ce processus de data quality dans le temps. Terminons cet article avec cette analogie : La récolte de données n’est pas un sprint mais une course de fond ! Soyez régulier dans le processus de data quality pour exploiter vos données de la meilleure des manières.
Alors n’oubliez pas : ce n’est qu’après s’être assuré que la donnée est de qualité qu’on pourra l’exploiter pas avant !