Corporate Finance, DeFi, Blockchain, Web3 News
Corporate Finance, DeFi, Blockchain News

Disruption dans les logiciels de data mining

L'adoption croissante d'outils open source met la pression sur les fournisseurs de logiciels propriétaires et fait baisser les prix de leurs solutions de data mining (exploration de données).


Laurent Leloup
Laurent Leloup
Alors que de récentes innovations dans le secteur des logiciels ont considérablement renforcé les capacités de la plupart des logiciels, des solutions logicielles open source gratuites ont encore réalisé une plus grande progression. Plus de la moitié de toutes les tâches d'exploration de données sont maintenant effectuées en utilisant un logiciel open source, décalant ou annulant l'achat de logiciels propriétaires. L'analyse de la firme d'études de marché IBISWorld estime que l'adoption de l'open source a contribué à une baisse de 1% en rythme annuel du prix des logiciels d'exploration de données dans les trois années qui ont précédé 2014, à environ 8000 $ par utilisateur et par an. Bien que la plupart des acheteurs ne peuvent pas compter uniquement sur le logiciel open source et devront encore acheter des logiciels propriétaires d'exploration de données, ils peuvent réduire les coûts totaux en achetant moins de licences propriétaires.

Cher et propriétaire

Pour les non initiés, l'exploration de données est la manipulation et l'examen de très grandes bases de données. L'exploration de données est utilisée pour les bases de données qui sont trop grandes pour être manipulées par le logiciel de gestion de données comme Microsoft Access. Le logiciel d'exploration de données est utilisé par toute organisation qui utilise de grandes bases de données, telles que les institutions financières, les institutions académiques, les vendeurs détaillants, les organismes gouvernementaux et les sociétés de conseil.

Selon les estimations de IBISWorld, environ 50 entreprises développent et éditent des logiciels d'extraction de données, des grands groupes tels que IBM, Microsoft et Oracle aux fournisseurs indépendants tels que StataCorp ou StatSoft qui se spécialisent uniquement dans l'exploration de données.

Le marché pharmaceutique est très concentré, avec IBM et SAS Institute qui contrôlent ainsi près de la moitié du chiffre d'affaires du marché. Le niveau de concentration élevé signifie qu'il y a moins de concurrence des prix sur le marché, réduisant la capacité pour l'acheteur à négocier le meilleur prix.

Le prix du logiciel propriétaire varie principalement avec le coût de production du logiciel et de la demande des secteurs public et privé. Les coûts de production dépendent principalement des salaires des ingénieurs et du niveau d'innovation, et la demande est fondée principalement sur le niveau de l'investissement public et des bénéfices des sociétés. Même si les salaires et la demande ont augmenté ces dernières années, les prix ont baissé parce que les fournisseurs ont été contraints de réduire leurs prix pour maintenir leur part de marché face à la popularité croissante des options open source.

Perturber le marché

La forte concentration des parts de marché sur le marché des logiciels d'exploration de données payants devrait normalement affaiblir le pouvoir de négociation, mais l'existence et la popularité croissante de logiciels d'extraction de données open source, en particulier le langage de programmation "R" (1), a donné aux acheteurs plus de pouvoir et d'options. Peu d'outils open source ont eu autant d'impact sur les logiciels d'extraction de données que "R". D'après l'étude de REXER "2013 Annual Data Miner Survey" R a été l'outil d'exploration de données le plus utilisé depuis 2010; environ 70% des mineurs de données ont déclaré utiliser l'outil en 2013. Actuellement, environ un quart de tous les mineurs de données utilise R comme outil d'analyse primaire, plus que tout autre logiciel.

L'adoption rapide du langage de programmation R a joué un rôle important dans la perturbation du marché. Les vendeurs ont été contraints de baisser leurs prix dans le but de fidéliser les clients. Le prix moyen d'un logiciel propriétaire est tombé à $860 depuis 2008, en dépit de l'amélioration continue de la puissance et des capacités. En outre, les fournisseurs sont de plus en plus disposés à offrir des rabais aux entreprises qui achètent également des logiciels connexes comme la gestion des données et l'analyse. On s'attend à ce que l'utilisation du langage de programmation R augmente au cours des trois prochaines années, ce qui obligera les fournisseurs de logiciels propriétaires d'exploration de données à réduire encore plus les prix. Les prix devraient baisser en moyenne de 1% par an au cours de la période.

Etes-vous adapté à R ?

La popularité et la grande fonctionnalité de R signifient que les entreprises utilisant uniquement des logiciels propriétaires d'exploration de données peuvent potentiellement économiser de l'argent en incorporant une plus grande utilisation de R. Bien que la plupart des entreprises engagées dans l'exploration de données ne soient pas en mesure de basculer entièrement vers R en raison de la nature du travail, les acheteurs peuvent essayer de construire un logiciel R qui émule les fonctions des logiciels propriétaires coûteux, ce qui leur permettrait de libérer des licences et d'économiser sur les coûts de logiciels.

Bien que le logiciel open-source soit généralement libre, d'autres coûts sont importants à évaluer. Son haut niveau de personnalisation est idéal pour les utilisateurs qui ont une solide formation en programmation et spécifiquement en langage R, mais le logiciel est pratiquement inutile pour les entreprises dépourvues de ces programmeurs internes. Ces entreprises devront s'en tenir à un logiciel propriétaire, embaucher un programmeur avec une expertise R (ils exigent généralement un salaire de plus de $ 100,000) ou former leurs membres du personnel existant.

Le logiciel propriétaire est construit avec des interfaces utilisateur robustes et faciles à utiliser pour guider les utilisateurs à travers les deux fonctions standard et avancée. D'autre part, les entreprises qui utilisent R doivent créer et personnaliser leur propre plate-forme avec l'aide du programme lui-même, un processus qui peut prendre un mois ou plus. En raison de son coût, de sa personnalisation et du profil de la courbe d'apprentissage, R est le mieux adapté pour les acheteurs qui accordent une grande valeur à l’économie d'argent et à la possibilité d'écrire du code pour le programme, et une faible valeur à la qualité de l'interface utilisateur et à la facilité d'utilisation.

La flexibilité de R signifie qu'il peut émuler les fonctions d'options propriétaires, telles que SPSS, SAS ou Stata, et son faible coût le rend bon marché pour l'avoir sous la main, même si ce n'est pas le principal outil utilisé. R peut être difficile à utiliser, mais les entreprises qui ont un service informatique, avec le temps et les ressources pour construire et mettre en œuvre une plate-forme R, seront en mesure de réaliser des économies substantielles en réduisant leur dépendance à l'égard des logiciels propriétaires. En conséquence, les acheteurs doivent chercher à construire un package d'exploration de données à base de R qui pourra remplir la fonction d'une ou de plusieurs des solutions logicielles propriétaires qu'ils utilisent. Même si pour les acheteurs il n'est pas rentable de construire une plateforme complète basée sur R, ils devraient être en mesure de tirer parti de son existence au cours des négociations de prix avec les fournisseurs.

(1) "R" (langage de programmation et environnement statistique).
R est un logiciel libre de traitement des données et d'analyse statistiques mettant en œuvre le langage de programmation S. C'est un projet GNU fondé sur l'environnement développé dans les laboratoires Bell par John Chambers et ses collègues. Depuis plusieurs années, deux nouvelles versions apparaissent au printemps et à l'automne. Il dispose de nombreuses fonctions graphiques.
Le logiciel R est considéré par ses créateurs comme étant une exécution de S, avec la sémantique dérivée du langage Scheme. C'est un logiciel libre distribué selon les termes de la licence GNU GPL et est disponible sous GNU/Linux, FreeBSD, NetBSD, OpenBSD, Mac OS X et Windows.
Source Wikipedia



Les médias du groupe Finyear :


Vendredi 20 Juin 2014




OFFRES D'EMPLOI


OFFRES DE STAGES


NOMINATIONS


DERNIERES ACTUALITES


POPULAIRES