Big Data

big data

Big Data

Définition

Avec l’explosion quantitative de la production de données numériques, les chercheurs ont été amenés à trouver de nouvelles façons de voir, mais aussi d’analyser le monde. Il s’agissait de pouvoir découvrir de nouveaux ordres de grandeur, qui concernaient aussi bien la capture, la recherche, le partage, le stockage, l’analyse, que la présentation des données. C’est dans cette dynamique qu’est apparu le « Big Data ». 

Les Big Data – mégadonnées ou données massives – désignent l’ensemble des données numériques produites par l’utilisation des nouvelles technologies à des fins personnelles ou professionnelles.

Cet ensemble, qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler, regroupe les données produites par les entreprises (mails, documents, bases de données, etc.), celles issues de capteurs, de contenus publiés sur le web (images, vidéos, sons, textes), des transactions (e-commerce, etc.), des échanges sur les réseaux sociaux. On y retrouve également les données transmises par les objets connectés ou encore les données géolocalisées

Bien qu’aucune définition précise ou universelle ne puisse être donnée au Big Data, du fait qu’il s’agit d’un objet complexe polymorphe, il est possible de le voir comme un concept permettant de stocker une quantité très volumineuse, voire indénombrable, de données sur une base numérique, accessibles par tous en temps réel.  

Selon l‘Association for Computing Machinery, l’expression « Big Data » apparaît pour la première fois en 1997, dans des articles scientifiques traitant des défis technologiques à relever pour visualiser les grands ensembles de données. 

La règle des 3 V

En 2001, l’analyste du cabinet Gartner, Doug Laney décrivait les Big Data comme une famille d’outils répondant à une triple problématique, appelée la règle des 3V :  

  • le Volume de données à traiter, de plus en plus massif, 
  • la Variété de ces données, qui peuvent être brutes, non structurées ou semi-structurées, et issues de diverses sources, 
  • la Vélocité, qui désigne le fait que ces données sont produites, récoltées et analysées en temps réel.

 

3V Big Data

Source : In Digital We Trust

Certaines entreprises ajoutent un quatrième « V » à cette définition, pour la Véracité, qui évoque la nécessité de vérifier la crédibilité de la source et la qualité du contenu, afin de pouvoir exploiter ces données.

Exemples d’application

L’exploitation des Big Data a ouvert de nouvelles perspectives dans de nombreux domaines. En voici quelques exemples : 

# Le marketing

La récolte massive de données clients, associée à l’analyse de celles-ci, a offert de nombreuses opportunités aux services marketing des entreprises, comme : 

  • Mieux comprendre les audiences cibles, 
  • Accroître la performance des campagnes marketing (campagnes d’emailing, de retargeting, stratégies de lead nurturing, etc.), 
  • Personnaliser l’expérience utilisateur sur un site, 
  • Optimiser la fidélisation et la relation client, 
  • L’analyse prédictive, pour les tendances futures

# La finance

Dans le monde de la finance, le Big Data a favorisé plusieurs innovations, telles que : 

  • La détection des fraudes à la carte de paiement, 
  • La mutualisation des données entre banques, 
  • L’analyse du « sentiment » des investisseurs pour les traders, 
  • Réaliser le scoring des dossiers de crédit, 
  • Le prêt en peer-to-peer. 

# La santé

Grâce à l’ensemble des données socio-démographiques et de santé, disponibles auprès de différentes sources qui les collectent ( appareils d’imagerie ou encore de traitement des pathologies), via des ordinateurs, l’utilisation des Big Data permet à ce jour : 

  • l’identification de facteurs de risque de maladie
  • l’aide au diagnostic
  • le choix et le suivi de l’efficacité des traitements
  • de mener des études épidémiologiques des maladies dans la population.

Comment se former au Big Data ?

Le Big Data est considéré comme l’un des plus grands défis informatiques actuel. De plus en plus d’entreprises recherchent des personnes capables d’analyser et gérer les quantités de données générées par les activités sur leurs réseaux. Il devient donc indispensable de s’adapter aux besoins imminents du marché en se dotant de compétences solides en Big Data.

Pour pouvoir se former au Big Data, il est souvent recommandé de s’orienter au départ vers des formations générales en informatique ou systèmes d’information, tels que les BTS ou les Licences, afin d’obtenir les bases en informatique. La spécialisation en Big Data se faisant souvent après ceci. À ce stade, plusieurs options sont possibles telles que : 

  • Les formations continues dans des centres de formation certifiés
  • Les écoles et universités proposant des masters et diplômes reconnus par l’Etat
  • Les formations professionnelles certifiées 
  • Les écoles d’ingénieurs
  • Certaines écoles de commerces/management 

Pour pouvoir acquérir des connaissances et des compétences solides dans ce domaine, en vue de pouvoir en faire son métier, il est préférable d’éviter les tutoriels ou encore les formations sur quelques jours, qui ne permettent que de s’initier au Big Data.

Une formation solide en Big Data doit aborder aussi bien la théorie que l’aspect pratique de cette science. Elle doit être assurée, idéalement, par des experts, qui non seulement l’enseignent mais l’exploitent dans de vrais projets. Ainsi, il sera toujours préférable de valoriser des formations diplômantes, certifiées, et dispensées par des professionnels du secteur.