Index
Big Data
Quant on parle Big Data … une chose est certaine : la presse, les éditeurs ou les analystes se sont emparés du sujet. Il est d’ailleurs difficile aujourd’hui de surfer sur le web sans voir apparaître un éléphant pour nous rappeler ce que certains n’hésitent plus à appeler: un tsunami ou un déluge de données.
Tout d’abord quel est le périmètre du phénomène Big Data ? Et surtout quelle est sa réelle maturité ?
Ensuite, peut-on définir sa taxonomie et surtout comment pourrions-nous déterminer les solutions ou tendances technologiques qui en émergerons ? Bref à quel phénomène exact avons-nous à faire et comment allons-nous pouvoir orienter et préparer les Systèmes d’Informations. Et enfin commen s’y prendre pour intégrer cette nouvelle problématique/technologie ?
Il est intéressant de se demander quel nouvel usage pourrons-nous envisager et comment tirer parti de tout cela sans tout bouleverser. Un cataclysme ne s’évite pas, il se prépare … et meilleure est la préparation moins les dégâts sont importants ! C’est du bon sens, et ce bon sens passe aussi par l’exploitation ou l’adaptation de l’existant afin qu’il puisse gérer cette nouvelle transformation. Tout phénomène, tout changement, ou transformation est forcément anxiogène, mais celui-ci apparait plutôt comme positif.
Au contraire des phénomènes informatiques précédents (comme le passage à l’Euro par exemple) ce dernier va apporter un réel plus aux entreprises. Il s’intègre en effet naturellement dans sa stratégie d’amélioration de la performance en offrant la possibilité de mieux communiquer et comprendre ses clients. Voyons donc cette nouvelle perspective de développement comme de nouvelles opportunités qui vont améliorer la compétitivité de manière significative.
Le tsunami de données ?
Jusqu’alors personne n’avait jamais eu accès à des informations aussi libres et complètes sur le comportement, le mode de vie des utilisateurs, leur avis, etc. :
Cette nouvelle richesse est une véritable caverne d’Ali baba pour peu que l’on puisse y accéder d’une part et l’exploiter d’autre part.
- Les données comportementales : elles comprennent les habitudes de navigation et/ou d’achat, commentaires, goûts, etc.
- Les données d’historique : elles englobent le stockage de l’évolution d’un utilisateur/client, les changements d’états, de situation, etc.
L’inconvénient bien sûr est que toutes ces informations représentent une volumétrie considérable. Ces données demandent le plus souvent d’être stockées (parfois en temps réel) afin de pouvoir être consolidées et analysées ultérieurement, un peu à la manière d’un Datawarehouse. Pourquoi d’ailleurs ne pas parler de « Datawarehouse Comportemental » ? En effet comment passer à côté de ces informations quand on veut créer une vision exhaustive de ses clients/prospects (ou vision à 360°) au sein d’un MDM ?
le Big Data en chiffres
Toujours est-il que stocker ces informations implique forcément stocker d’énormes volumes de données. Et en cela les approches traditionnelles ne suffisent plus. Il faut donc songer à de nouvelles solutions technologiques. Des solutions plus souples, plus performantes et bien sûr moins onéreuses.
Donnons quelques chiffres pour illustrer l’ampleur du phénomène :
- 150 millions de Tweets par jour
- 60 millions de mises à jour sur Facebook
- 3 millions de vidéos vues par jour sur Youtube
- 180 millions de blogs
- 135 millions de comptes Linkedin
- 63,6 millions de tablettes vendues dans le monde en 2011
- 6 milliards de téléphones mobiles dans le monde
Rien que pour la France (en 2011), nous pouvons dénombrer 19 millions d’utilisateurs de smartphone. Parmis eux plus de 10 millions les utilisent pour se connecter aux réseaux sociaux, 20 millions d’usagers Facebook, 20 millions de blogs, 3 millions de comptes sur Linkedin, 5 millions de comptes Viadeo…
Pour résumer, et en un chiffre les données représenteront 35 Zettabytes en 2020 dans le monde !

Regardez le degré exponentiel de l’explosion des données d’interaction de la courbe ci-dessus. On en déduit aisément que l’enjeu de demain sera bel est bien de gérer l’afflux de ce type de données quand le volume de données de type transactionnel reste – pour l’instant – maîtrisable.
Il est intéressant aussi de constater que les réseaux sociaux, qui avaient tout d’abord pour principale vocation de relier les personnes selon des centres d’intérêts précis, sont aujourd’hui de plus utilisés de manière professionnelle. Prenons pas exemple les réseaux sociaux du type Linkedin et Viadeo qui deviennent progressivement des canaux incontournables pour le recrutement, les affaires…
L’impact des réseaux sociaux, l’enjeu de demain
Le site netpublic.fr expose d’ailleurs avec détail l’impact de l’utilisation des réseaux sociaux dans le comportement des internautes. Ces réseaux sociaux sont sans nul doute devenus le point d’accès principal au contenu du net … au détriment des moteurs de recherches traditionnels : c’est là la vraie révolution !
Aujourd’hui quel que soit vos centres d’intérêts vous trouverez certainement un ou plusieurs réseau adapté à ce dernier. Vous pourrez ainsi très simplement échanger et rencontrer virtuellement d’autres personnes qui comme vous souhaitent participer et réagir à l’actualité.
Le paysage de réseaux sociaux est donc très hétérogène et s’apparente aujourd’hui à la somme de canaux de média comportementaux extrêmement variés et riche à la fois.
Les entreprises ont bien compris cette richesse. Elles l’exploitent aujourd’hui tant du point de vue du média lui-même que pour les données qu’ils comportent. Par exemple pour faire de la publicité ou détecter les nouveaux besoins. Prenez par exemple American Express qui, suite à une campagne impliquant 1,5 million de fans Facebook, a aidé les PME à augmenter leurs revenus d‘années en années de 28% pendant le week-end suivant Thanksgiving avec “Small Business Saturday”. Mais aussi Twitter qui désormais dilue de la publicité dans ses tweets. Ou bien encore la nouvelle publicité de KIA qui communique sur la façon dont ses choix de production ont étés orientés par les clients eux-même. De manière plus générale on pense au marketing qui donne la parole aux clients et devient alors réellement proactif : le web 2.0
Voici quelques utilisations professionnelles des réseaux sociaux :
- CRM : réagir à des commentaires en temps réel, animer une communauté
- Veille : être en alerte sur les tendances du marché, la concurrence…
- Marketing (annonce de nouveautés, événements, promotions etc.)
- Recruter, accroître son image de marque
- Augmenter la visibilité et le contenu de la marque ainsi que le trafic sur son site web ou blog.
Vous avez compris l’enjeu de demain – mais demain n’est-il pas déjà aujourd’hui ?
L’avenir est très certainement pour ces entreprises qui sauront exploiter au mieux ces données d’un nouveau type en les intégrant naturellement dans leur SI existant.
Ingénieur en informatique avec plus de 20 ans d’expérience dans la gestion et l’utilisation de données, Benoit CAYLA a mis son expertise au profit de projets très variés tels que l’intégration, la gouvernance, l’analyse, l’IA, la mise en place de MDM ou de solution PIM pour le compte de diverses entreprises spécialisées dans la donnée (dont IBM, Informatica et Tableau). Ces riches expériences l’ont naturellement conduit à intervenir dans des projets de plus grande envergure autour de la gestion et de la valorisation des données, et ce principalement dans des secteurs d’activités tels que l’industrie, la grande distribution, l’assurance et la finance. Également, passionné d’IA (Machine Learning, NLP et Deep Learning), l’auteur a rejoint Blue Prism en 2019 et travaille aujourd’hui en tant qu’expert data/IA et processus. Son sens pédagogique ainsi que son expertise l’ont aussi amené à animer un blog en français (datacorner.fr) ayant pour but de montrer comment comprendre, analyser et utiliser ses données le plus simplement possible.