Le Blog Data par Lizeo
Le niveau de précision de la donnée a un impact non négligeable sur les résultats d’une analyse. En effet, l’écart de prix moyen entre un pneu, avec ou sans marquage constructeur (ex : marquage AO pour Audi) pour une même dimension, peut varier de plusieurs pourcents. Ne pas être en capacité de les distinguer faussera une analyse de prix moyen sur une dimension précise.
Le périmètre
La profondeur
La fraîcheur
La collecte de données prix consommateur en ligne requiert l’usage d’outils qui viennent “parcourir » les sites marchands viser pour collecter l’information recherchée, sans les perturber (collecte éthique).
Ces outils doivent être performants et intelligents car un site e-commerce est amené à changer régulièrement: nouvelle conception, nouvelle mise en page, nouvelle URL, etc.
Ces changements ont un impact direct sur les outils de collecte de la donnée : changement du site = perte de la collecte.
Afin de maintenir ces outils à jour, vous avez besoin d’une équipe qui surveille quotidiennement chacun des sites et s’assure de la bonne opérationnalité du système, 24h/24, 7j/7.
C’est maintenant que la compétence métier « Data » entre en scène.
La description d’un pneu vendu en ligne est un des éléments pouvant varier sensiblement d’un site de vente en ligne à un autre.
La liste des attributs qui constitue la description d’un pneu et qui peut varier sont les suivants :
Afin de pouvoir attacher les prix collectés au bon pneu, il est nécessaire de « comprendre » et décrypter les éléments clés affichés qui permettent d’identifier ce produit afin de pouvoir les comparer à un référentiel ‘propre’ de pneus existants (actuellement ou dans le passé) et validés (avec une source officielle l’attestant). C’est l’étape d’unification de la donnée.
Cette base de données « référentes » est la clé de voûte d’un système performant de matching afin de délivrer une donnée d’un niveau de qualité sans équivalent.
La comparaison des données collectées avec cette base référente permet de vérifier que les informations vues en ligne pour ce pneu existent bel et bien : est-ce que ce pneu est bien de cette marque ? avec ses attributs techniques ? etc.
Cela permet de catégoriser automatiquement et de manière systématique les données collectées en ligne :
Enfin, les prix aberrants les plus grossiers sont également filtrés (ex : un pneu tourisme vendu moins de 20€ a peu de chance d’être réel)
La combinaison d’une base de données de pneu ultra qualitative, de technologies de matching, d’algorithmes de Machine Learning et d’expertise marketing produit permet de fournir une donnée avec un niveau de qualité et d’exhaustivité de haut niveau.
Cela vous permet de vous concentrer sur votre métier (l’analyse) et de gagner en efficacité. En effet, les analyses et les Data Scientists passent entre 50 et 80% de leur temps à nettoyer la donnée avant de commencer à pouvoir la manipuler !
Données d’enrichissement :
L’étape de préparation transforme les données unifiées et enrichies en un ensemble de données (cube) qui intègre vos règles business, vos données internes mais également votre vision du marché et votre segmentation. En effet, les données sur les prix des concurrents sont un élément important de compréhension du marché mais les données internes le sont tout autant.
Exemples de règles business :
Exemples Données internes :
C’est à cette étape que la précision et l’homogénéité dans la collecte de données en ligne à toute son importance. En effet, la granularité des données online et des données interne doit être au même niveau afin de pouvoir faire parler ces 2 sets de données. On « matchera » ainsi ces deux sources de données à un même niveau afin de comparer les mêmes éléments.
Pourquoi nous faire confiance dans cette méthodologie d’analyse des prix sell-out du marché du pneu ?
Lizeo Group soutient ses clients dans leur transformation digitale pilotée par les données et collecte quotidiennement de la donnée de prix de pneus en ligne depuis plus de 10 ans sur plus de 1000 sites e-commerce à travers le monde.
Cela représente environ 11,5 millions lignes de prix par jour, dans toutes les monnaies, qui sont nettoyées, matchées, enrichies et prêtes à l’emploi.
© Lizeo Group 2024, all rights reserved