Quotidien finance innovation, innovation financière journal
Financial Year with Finyear
 
 
 
 


              

Le mythe du Data Scientist omniscient


Vous l’avez sans doute constaté, la star du moment c’est le Data Scientist. C’est celui qui va introduire le Big Data dans les entreprises . Tout le monde parle de lui en ce moment (y compris moi) et établir le profil type de cette rock star ne s’avère pas évidente.




Le mythe du Data Scientist omniscient
On veut donc trouver un individu qui maîtrise les données, avec un bon niveau en stats pour nous faire des segmentations, évidement une totale maitrise d’un framework Map-Reduce est requise, donc celle du langage Perl ou Python ou Java ou, au pire, de Pig s’impose. Bien entendu, il va devoir travailler avec les bases de données SQL ou NoSQL, et puis si notre candidat pouvait être le Michel-Ange du DataViz, ce sera un plus indéniable… Pas facile à trouver, c’est certain, mais si on faisait fausse route ?

Le Data Scientist à tout faire…

Etre un Data Scientist tel qu’on cherche à le définir ces jours-ci, c’est un peu être le Superman du BigData. L’annonce postée par eBay sur Monster est cohérente : on sens que la boite commence à avoir du recul dans le domaine. On en trouve d’autres plus fantaisistes, j’aime bien la conclusion de celle-ci :
« Requested Skills:
Good sense of humor
Deep fondness for the Green Bay Packers »

Remarquez, les petites annonces a rallonge, c’est plutôt commun dans le secteur informatique. Les recruteurs exigent tout un tas de compétences contradictoires, souvent sur des technologies concurrentes, avec des années d’expérience tout en étant jeune. Bref, ils préfèrent recruter un mauvais en tout qu’un dieu sur une seule technologie, mais je m’égare. Donc, notre Data Scientist modèle va devoir cumuler des connaissances tant mathématiques, informatique, voire artistique. Autant dire qu’on va dans le mur, il va falloir trouver autre chose.
…ou une équipe qui collabore ?

Evidemment, la solution pour industrialiser le Big Data en entreprise, c’est le travail en équipe. L’enjeu va être de faire travailler tout ce petit monde ensemble. L’idée fait son chemin et, par exemple EMC Greenplum propose une solution de travail collaboratif pour le Big Data. Cette solution s’appelle Greenplum Chorus. Mes plus fidèles lecteurs se souviennent peut-être du lancement de cette offre voici 2 ans. A l’époque, c’était une solution de Datawarehouse en mode Cloud, avec une fonction de provisionning self service et une couche collaborative au dessus de l’édifice. Depuis, Greenplum est passé sous le contrôle d’EMC et a mis la pédale douce sur le volet Cloud. Par contre, le soft, lui il est toujours là. Le provisionning permet de faire du sandboxing et c’est plutôt utile pour bosser sur les données, et la couche collaborative à bien évoluée et s’est transformée en mini réseau social tout dévoué aux projets Big Data.

J’ai causé de cette annonce avec un type de Greenplum lors du congrès Big data qui s’est tenu à la Cité U de Paris cette semaine. S’il a reconnu que ce réseau social Big Data est quelque peu en avance pour notre marché, aux USA il y a une grosse appétence pour ce type d’outils. Bref, on continue à croire à l’homme providentiel et il nous faudra encore un peu de temps pour constituer ces équipes Big Data.

Le grand BI
L'actualité satirique de la Business Intelligence et de l'analytique
www.legrandbi.com

Vendredi 30 Mars 2012
Notez




Nouveau commentaire :
Twitter

Your email address will not be published. Required fields are marked *
Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *



Recevez la newsletter quotidienne


évènements


Lettres métiers


Livres Blancs