La notion de data :


Défini dans les années 2000 et popularisé grâce au « Cloud », la notion de « Big Data » (ou mégadonnées ou données massives) concerne l’ensemble des outils et techniques qui permettent de traiter et d’analyser des quantités importantes de données converties en connaissances (informations pertinentes) afin de créer une valeur économique.

Ces données qui peuvent être structurées (Base de données classique) ou non structurées (texte, image, réseaux sociaux, e-mails…) sont souvent analysées à travers les 5 V :

Volume :les quantités de données

Variété :les différents types de données (structurées ou pas, « open data » ou données internes

Vélocité : rapidité de travail

Véracité : fiabilité, authenticité de la data

Valeur : utilité, valeur économique associée à l’information


Les Data Lake


Aux « entrepôts de données » (Data Warehouse) qui gère des données structurées se sont substitués les « lacs de données » (Data Lake) qui gèrent également les données non structurées.

Deux solutions informatiques se distinguent aujourd’hui pour gérer l’ensemble des données collectées : Hadoop (Technologies HDFS et Map Reduce) et Spark.



Deux types de modèles :

-Les modèles prédictifs traditionnels ( algorithmes statistiques) et les modèles exploratoires ou modèles auto-apprenants (algorithmes d’intelligence artificielle).

Prédictif = supervisé

Exploratoire = non supervisé


Le « Datamining » (Forage de données) s’oppose aux techniques statistiques et va rechercher de manière automatisée les relations entre les variables liées à la clientèle pouvant participer à la performance commerciale.



Emergence de nouveaux métiers :


Le « Data Scentist » est l’expert de la data qui maîtrise l’informatique, les statistiques et la dimension marketing stratégique.



La data client :


La data client est devenue aujourd’hui un enjeu stratégique primordiale pour les entreprises.

Collecter, analyser et traiter cette information permet de contrôler l’expérience client, d’optimiser la relation client (limitant ainsi l’attrition) ,de pratiquer une segmentation plus fine de la clientèle ,de mesurer la notoriété, de réduire les coûts, d’améliorer les produits en fonction des attentes, de pratiquer une meilleure communication de manière automatisée...


Les données internes sont collectées à partir du logiciel d’ERP / CRM, du SAV, des conversations sur les réseaux sociaux de l’entreprise (Social CRM)…

Les données externes peuvent être achetées à des prestataires spécialisés, provenir des moteurs de recherche, des réseaux sociaux…