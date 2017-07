A présent, ce qui distingue le plus ces deux technologies est à mon sens le caractère bien plus prévisible de l’AI: on en parle depuis des années et cela fait longtemps que des films, des articles de vulgarisation (pour le grand publique) ainsi que des publications techniques (pour le métier), esquissent le futur des machines intelligentes en nous donnant un avant-goût des percées futures.De son côté, la blockchain est une nouveauté qui arrive comme une météorite. Le potentiel disruptif des deux est peut-être identique mais le caractère ponctuel et inattendu de la blockchain, couplé à son étonnant dynamisme, vont lui faire faire des vagues bien plus hautes à court et moyen terme. C’est mon avis, en tous cas.Ayant travaillé dans les deux secteurs, notamment dans la prédiction AI de données boursières, je me fais un plaisir dans ce post de vous parler de Numerai , un hedge fund blockchain-based qui recrute ses prédictions via blockchain.Supposons un doctorant français en machine-learning qui ne connait quasiment rien aux banques ni aux hedges funds. Il sait juste que ce monde recrute les meilleurs spécialistes AI de la planète pour les prédictions stock markets, mais aussi qu’il est difficile de se faire remarquer pour de nombreux crack en machine learning. Il voit tout ça comme une nébuleuse où souvent les connaissances bien placées, la proximité géographique et parfois même la chance, permettent à une petite élite de travailler dans ce secteur velouté.De son côté, l’hedge-fund n’a pas d’autre solution que de contacter le plus de doctorants possible afin de dénicher la meilleure élite et l’embaucher au plus tôt en interne pour la garder à vie. Cette recherche, difficile et coûteuse, est sans garanties:1. on ne peut pas assurer que l’équipe trouvée soit vraiment la meilleure au monde (il est impossible de passer en revue tous les candidats)2. on ne peut pas assurer qu’elle puisse fournir les meilleurs résultats (ceux qui seraient moyennés sur un nombre assez important de try&see prédictifs)Dans ce contexte, lorsqu’un hedge-fund trouve un avantage concurrentiel, il va le protéger à tout prix en payant très cher ses data-scientists afin de les empêcher de rejoindre la société d’à côté. La finance est très compétitive et les gains des uns se font souvent au détriment des autres.Mais pourrait-on faire du crowdsourcing de talents machine learning ? Que se passerait-t-il si ce système en vases clos rencontrait la blockchain ?On assisterait probablement à une inversion de rôles à 180 degrés. La blockchain a le potentiel pour transformer Wall Street d’un ensemble de structures isolées et méfiantes à un pool de partenaires qui collaborent harmonieusement.Au lieu de compter sur le génie d’une personne ou d’une petite équipe, Numerai fait appel en crowdsourcing à environ 12 000 scientifiques anonymes dans le monde entier, un nombre destiné à croître. Ceux-ci utilisent les databases mises à disposition par la société pour construire des modèles de prédiction du marché boursier, avec les techniques d’intelligence artificielle de leur choix. Ces données, enrichies continuellement via des achats tiers, sont cryptées et anonymisées, ce qui, soit dit au passage, rend plus laborieux les traitements côté client.Comment ça marche ? Numeraire est un crypto-token open-source émis sur la blockchain Ethereum par le hedge-fund Numerai. Notez que cette monnaie est donc émis par une société privée, bien que tout soit ouvert et transparent.Le token Numeraire suit la norme ERC20 Vous avez ici l’ABI du contrat et l’adresse du smart-contrat : 0x1776e1F26f98b1A5dF9cD347953a26dd3Cb46671Les plus courageux peuvent analyser ses transactions ici Il y aura en tout 21 millions de tokens Numeraire frappés (minted).Au début, Numerai a envoyé gratuitement 1 million de tokens aux scientifiques early-adopters. Cela s’est fait en fonction de leur classement historique sur le leaderboard de Numerai, construit sur les performances passées dans les tournois préparatoires. Après cette distribution initiale, le smart-contract émet de nouveaux tokens chaque semaine jusqu’à ce que le maximum de 21 millions soit atteint.Depuis le 20 juin 2017, les experts peuvent utiliser leurs jetons pour proposer des prédictions. Si elles sont pertinentes, ils gagnent de l’argent ( des numeraires, qui sont côtés par exemple ici ) sinon ils peuvent perdre leurs jetons.Quand un scientifique est confiant quant à ses prédictions, il les envoie avec des tokens au smart-contract. Cela se fait depuis le site Web de Numerai sans besoin de gérer des clés privées, de lancer un client Ethereum ou encore d’utiliser le plug-in MetaMask Le smart contrat séquestre ces tokens pendant une période suffisamment longue pour avoir le temps de tester la performance sur de nouvelles données (que le modèle n’a jamais vues, c’est une validation à chaud). Personne n’a accès à ces tokens pendant la séquestration, pas même Numerai.Cette période expirée, Numerai notifie à la blockchain les performances des prédictions. Les scientifiques gagnent des dollars selon un mécanisme de vente aux enchères Dutch et peuvent récupérer leurs mises de départ en tokens Numeraire. Ceux qui obtiennent de mauvais résultats (alors qu’ils avaient annoncé une confiance élevée dans leur travail) voient leurs tokens détruits – à jamais – dans Ethereum via un smart contract publiquement vérifiable.Les 100 meilleurs modèles sont aussi récompensés en bitcoin pour des montants plus importants.Chaque tournoi de prédiction a son montant fixe de rémunération finale. Le mécanisme de vente aux enchères répartit ce montant parmi des scientifiques qui soumettent des tuples (c, s)c = confiance en sa prédiction = nombre de Numeraire que le scientifique est prêt à miser pour gagner 1 dollars = quantité de tokens qu’on veut envoyer avec la prédiction.La métrique pour l’évaluation des performances est logloss2 : on considère qu’un modèle a :- de bons résultats si logloss < -ln(0.5),- de mauvais résultats si logloss >= -ln(0.5)Les scientifiques sont classés par ordre décroissant de confiance (c) et sont rémunérés s/c dollars jusqu’à ce que le montant de rémunération ne soit épuisé.Exemple tiré du whitepaper . Supposons une rémunération de 3000$ pour une prédiction qui se serait ainsi terminée :