Le Big Data est un terme employé depuis les années 1990 pour désigner un ensemble de données non structurées, semi-structurées et structurées au volume important.
Webinar Oracle Technology Data Week
Commencer une nouvelle série Netflix, commander un Uber, parcourir une infographie… des activités anodines qui sont pourtant optimisées et personnalisées depuis l’avènement du Big Data. Si les données volumineuses sont au cœur de nos vies au quotidien et à l’échelle mondiale, connaissons-nous vraiment ce que le Big Data représente, quelles sont ses applications dans les différents métiers et surtout, comment peut-on en tirer parti ?
Le Big Data est un terme employé depuis les années 1990 pour désigner un ensemble de données non structurées, semi-structurées et structurées au volume important. Ce critère est relatif et en constante évolution puisque, selon les prévisions d'un rapport d'IDC, le volume mondial de données qui était à 4,4 zettaoctets en 2013 devrait croître à 163 zettaoctets en 2025.
Le terme Big Data recouvre aussi l'écosystème et les pratiques qui découlent d’un tel volume de données :
L'accès et le stockage de grandes quantités d'informations à des fins d'analyse existent depuis longtemps. Mais le concept de Big Data a pris de l'ampleur au début des années 2000, lorsque l'analyste industriel Doug Laney a défini ses caractéristiques en trois "V" :
les données sont collectées à partir de diverses sources : réseaux sociaux, clics sur une page internet ou une application mobile, appareils intelligents IoT, etc. Elles sont ensuite stockées sur des plateformes comme les Data lakes ou Hadoop. En fonction des entreprises, cela peut correspondre à des dizaines de téraoctets de données, comme à des centaines de pétaoctets.
Les données sont générées et traitées à une vitesse qui peut être quasi réelle, ou même, réelle, dans le cas de produits intelligents liés à l’IoT. Par rapport aux données à faible volume, les données du Big Data sont produites de manière plus continue.
Si les données étaient traditionnellement structurées, le Big Data inclut également des données non structurées ou semi-structurées telles que le texte, l’audio et la vidéo qui nécessitent prétraitement supplémentaire pour en déduire le sens et prendre en charge les métadonnées.
Trois autres « V » ont complété les spécificités du Big Data ces dernières années :
Le flux de données est imprévisible puisqu’il change en fonction du contexte dans lequel elles sont générées. Les entreprises doivent s’adapter par la prédiction de tendances.
La qualité des données est variable, étant donné qu’elles dépendent de nombreuses sources différentes. Les entreprises doivent déterminer si elles sont fiables en les corrélant afin d’obtenir une analyse fine.
Les données deviennent utiles quand des experts les analysent en suivant une procédure complète où interagissent des analystes perspicaces, des utilisateurs professionnels et des dirigeants éclairés qui parviennent à prévoir des tendances, poser des hypothèses pertinentes et prédire les comportements.
Testez et développez des applications gratuitement avec le Cloud Oracle
Les pays développés adoptent de plus en plus les technologies du Big Data. Sur les 7,7 milliards d'humains sur terre en 2019, 5,1 milliards possèdent un téléphone mobile et 4,4 milliards utilisent Internet, soit 57 % d'entre eux. En un an, le nombre d'utilisateurs du web s'est accru de 9,1 %, tandis que la population mondiale n'a progressé que de 1,1 %.
Si les populations y trouvent leur intérêt, les gouvernements des différents pays exploitent le Big Data pour des applications très variées. En Chine, la plate-forme d'opérations conjointes intégrées (IJOP) surveille la population, à partir de données biométriques recueillies dans le cadre d'un programme de tests physiques gratuits. En Israël, une grande application de données a été conçue par Agro Web Lab pour aider à la régulation de l'irrigation. Au Royaume-Uni, une fine corrélation des données à permis de livrer des repas à domicile sans retard pour cause météorologique. L’administration Obama, quant à elle, a mis en place en 2012 84 programmes de données dans 6 départements afin d’explorer comment résoudre les problèmes importants rencontrés par le gouvernement. De fait, très nombreux sont les corps de métiers à exploiter le Big Data, en voici quelques-uns.
Le domaine de la santé manipule beaucoup de données, comprenant notamment de nombreuses informations sur les dossiers médicaux. Une gestion optimale du Big Data améliore le suivi des patients : un diagnostic peut être posé de manière personnalisée selon l’historicité des informations médicales, avec rapidité et précision. Le diagnostic assisté par ordinateur permet une nette amélioration des soins et engendre aussi beaucoup de données : 5 à 10 Go par jour pour le suivi d’une épilepsie, ou encore 450 Mo pour une seule image non compressée de la tomosynthèse mammaire. Quant à la recherche biomédicale, l’analyse des données du Big Data lui permet de progresser plus rapidement et l’exploitation du Machine Learning transforme les méthodes de recherche alors fondées sur les hypothèses.
Le Big Data a révolutionné les pratiques de l’industrie des médias qui emploie désormais massivement les technologies du web. Cibler des personnes à un moment et dans un espace optimal est désormais possible, l’idée étant de délivrer un message conforme à l’attente de l’internaute. C’est le cas par exemple des milieux de l’édition qui récoltent les données des consommateurs afin d’adapter leurs publicités et contenus en ligne. Les flux de données permettent aussi aux journalistes et éditeurs de fournir des contenus variés et riches, tels que des infographies.
Les entreprises tirent parti du Big Data grâce à l’Analyse des Opérations IT (ITOA) qui exploite le Machine Learning afin d’éviter, ou de résoudre, les problèmes IT et ainsi, améliorer les opérations commerciales.
En termes de données, les géants du web exploitent un volume de data impressionnant tels que Facebook qui gère 50 milliards de photos à partir de sa base d'utilisateurs. En juin 2017, le réseau social avait atteint 2 milliards d'utilisateurs actifs par mois.
La science a su tirer parti Big Data dont l’exploitation judicieuse engendre un progrès exceptionnel sur la découverte du monde et de la vie humaine. Voici quelques exemples :
Pour tirer parti du Big Data, les entreprises doivent préalablement comprendre son fonctionnement : comment les données circulent ? Depuis et vers quels environnements ? A partir de quelles sources ? Qui en sont les propriétaires, et les utilisateurs ?
Adopter les bonnes pratiques pour exploiter le Big Data permet d’obtenir des analyses précises qui améliorent l’expérience client et ainsi, la productivité de l’entreprise.