Corporate Finance, DeFi, Blockchain, Web3 News
Corporate Finance, DeFi, Blockchain News

Big data : retour à la réalité

Auparavant un sujet obscur, le Big data se retrouve aujourd’hui sous le feu des projecteurs, beaucoup de gens en parlent – peut-être en parle-t-on trop ? Le buzz qui en résulte est à l’origine de beaucoup d’idées erronées vis-à-vis du Big data, de ses origines ainsi que de son avenir.


Big data : retour à la réalité
Hormis les experts dont on attend une forte maitrise du sujet, les incompréhensions autour du Big data sont peu à peu devenues des mythes a atteint des sommets. J’ai donc décidé de prendre le temps de traiter ce problème en proposant une petite introduction à ce qu’est le Big data, et à ce qu’il n’est pas.

Le Big data, ce n’est pas seulement une question de Volume de données massives, mais aussi de Variété et de Vélocité. Ces trois "V" du Big data ont été énoncés pour la première fois par Doug Laney (de Gartner) dans un rapport de recherche publié en 2001. Même si le volume est important, les deux autres "V" sont des indicateurs clés d’une opportunité Big data.

La "Variété" fait référence aux nombreux types de data et de fichiers qu’il est intéressant (voir même important) de gérer et d’analyser plus en profondeur et pour lesquels les bases de données traditionnelles (c’est-à-dire les bases de données relationnelles) sont mal adaptées. Ces fichiers en question peuvent être des vidéos, audios, des photos, et autres visuels, des documents et formulaires, des données de géolocalisation, des carnets web, des chaînes de textes, etc.

La Vélocité fait référence à la vitesse à laquelle changent les données ainsi que la vitesse auxquelles celles-ci doivent être utilisées pour en tirer de la valeur. Quand les données en question sont créées (et s’agrègent) très rapidement, et qu’elles doivent être utilisées promptement afin d’en dévoiler les différents schémas et problèmes, la Vélocité est alors plus importante, et vous aurez de plus grandes chances de bénéficier d’une opportunité Big data. Les technologies traditionnelles sont particulièrement mal adaptées pour stocker et utiliser les données à haute vélocité ; la création de nouvelles technologies est donc nécessaire.

Le Big data est bien plus que des données non structurées. Même si les données non structurées sont parfois décrites comme des informations n’ayant pas de schéma de donnée prédéfinie et/ou qui ne trouve pas sa place parmi des tableaux de données relationnelles, le terme "non-structuré" n’est pas précis et ne prend pas en compte les variétés et subtilités des structures typiquement associées au Big data. De plus, le Big data peut contenir au sein de ses données des ensembles de données qui n’ont pas la même structure. Il serait donc plus approprié de parler de Big data "multistructuré", car ce terme inclurait alors les chaines de texte, documents de tous types, fichiers audio et vidéo, métadonnées, pages web, emails, flux de média sociaux, données de formulaire, etc. Les points communs récurrents de ces types de données variées reposent sur le fait que lorsqu’ils sont stockés dans un des nouveaux formats Big data, le schéma des données n’est pas connu ni défini quand les données sont saisies et stockées ; en revanche, le schéma des données est souvent appliqué au moment de l’utilisation de ces données. Ceci peut paraître révolutionnaire, mais pour les utilisateurs de Big data c’est tout simplement pratique.

Le Big data est partout. Il est vrai que les pionniers du Big data étaient des géants du Web (Google, Yahoo, Facebook, etc.), mais ceci s’explique par le fait que le volume, la variété et la vélocité des données générées par leurs services demandaient des solutions radicalement nouvelles. Maintenant, grâce à la baisse rapide des coûts d’une puissance de calcul en forte croissance (souvent basé sur le Cloud), mais aussi les logiciels open source et de l’assaut moderne des données qui ont un potentiel économique (si elles sont utilisées correctement), il y a une quantité infinie d’applications du Big data.

L’ampleur du buzz qui entoure le Big data tend à faire oublier que nous n’en sommes qu’aux premières générations de ces nouvelles technologies et concepts très puissants. En effet, on a pu voir que l’engouement menait souvent à une association maladroite entre les travaux autour du Big data et les solutions Big data, sur lesquelles j’ai déjà écrit. Ainsi, la recherche et l’éducation sont importantes pour permettre une réelle compréhension de la technologie du Big data et de son exploitation.

Écrit par Brian Gentile, PDG Jaspersoft

Jeudi 27 Septembre 2012




OFFRES D'EMPLOI


OFFRES DE STAGES


NOMINATIONS


DERNIERES ACTUALITES


POPULAIRES