La ronde infernale des plates-formes
Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
Dans mon dernier article Un anneau pour les gouverner tous, ma réflexion était partie de ce tweet :
pour aboutir au fait que Netflix pouvait saper les bases de l’oligopole technologique car il maîtrisait le bien le plus précieux (my precious), l’attention. Les plates-formes restent néanmoins un sujet d’admiration pour la high tech. Walt Mossberg se fait l’écho de Bill Gates ou de Mark Zuckerberg qui a toujours rêvé de construire une plate-forme. L’idée est que la plate-forme grandit ceux qui l’utilisent. On attribue à Bill Gates cette définition:
On parle de plate-forme lorsque la valeur économique de tous ceux qui l'utilisent dépasse la valeur de l'entreprise qui l'a créée.
Une plate-forme en informatique est un ensemble d’outils standardisés (hardware et/ou software) mis à disposition de créateurs pour leur permettre d’exercer leur métier, de générer une activité économique (production ou vente). Elle se rémunère généralement en tout ou partie sur le volume d’affaires réalisé au travers de ses outils. L’aspect fascinant de la plate-forme est son effet multiplicateur d’activité économique qui la place au dessus de la mêlée des sociétés classiques. Elle facilite et élargit un marché, lui donnant ainsi de la valeur. Elle a un côté Midas que Bill Gates avait relevé.
Taxonomie des plates-formes
On peut dresser une hiérarchie des plates-formes en fonction de la valeur de l’écosystème créé. Il y a d’abord les fausses plates-formes, celles qui ne mettent pas en valeur les créateurs mais en tirent parti pour servir leurs utilisateurs. On peut compter parmi celles-ci Google (moteur de recherche), Facebook (réseau social) ou Amazon (place de marché). Ces sociétés fournissent un produit, pas un outil. Il y a les plates-formes spécialisées qui font valoir un écosystème forcément restreint, une niche. Substack, Uber, Lyft, AirBnB ou Booking sont ce type de plates-formes. La valeur de la plate-forme dérive alors de la taille de la niche. Ces sociétés vont avoir tendance à viser plusieurs niches pour augmenter la taille de l’écosystème. Ainsi en est-il par exemple d’Uber qui s’intéresse au transport de personnes et de biens. Des plates-formes plus généralistes sont plus hautes dans la hiérarchie. Shopify par exemple s’adresse à tous les commerçants en ligne, un marché potentiellement très important. De même les plates-formes publicitaires de Facebook, Google et Amazon permettent l’émergence de quiconque a quelque chose à vendre. La publicité n’est plus réservée aux grandes marques et le système d’adjudication assure le juste prix pour se faire connaître. Plus les créateurs pourront obtenir un effet de levier par la plate-forme, plus cette dernière prendra de valeur. Les plates-formes qui s’adressent aux développeurs sont ainsi au sommet de la hiérarchie car elles peuvent créer non seulement des unicorns mais des unicorns qui pourront les dépasser un jour, devenir aussi des plates-formes ! On peut citer l’App Store, le Google Play Store et les trois opérateurs cloud: AWS, Azure et Google Cloud Platform. Combien de sociétés SAAS qui capitalisent des dizaines de milliards de dollars ont été créés par leur intermédiaire. Il n’est pas étonnant que les quatre plates-formes s’adressant aux développeurs soient des sociétés valant plusieurs trillions de dollars chacune (Apple , Alphabet, Amazon et Microsoft). Représenté sur un graphique:
Bill Gates touche un point important avec sa définition: une société reconnue comme une « vraie » plate-forme change de dimension aux yeux des investisseurs. Ainsi la valorisation d’Amazon a vraiment décollé lorsqu’AWS a été séparé du reste de l’activité en 2016. Ce n’est pas un hasard que Jeff Bezos ait choisi pour successeur Andy Jassy, le responsable d’AWS. Microsoft est également redevenu une star quand Satya Nadella son nouveau PDG a opéré un virage 100% cloud, relayant au second rang l’étouffant Windows. Comment ne pas voir, dans la fulgurante ascension d’Apple, l’IPhone, propulsé par l’App Store ? Quelles sont les activités qui dopent Google depuis quelques années ? YouTube (plate-forme) et Google Cloud platform…
Dura lex, sed lex
La plate-forme se doit d’être vertueuse, de jouer gagnant-gagnant, pour croître à la mesure de son écosystème. Cependant, la relation avec les créateurs est ambiguë. Théoriquement, la plate-forme ne devrait pas les contraindre, sa popularité dépendra au contraire de sa capacité à les émanciper. Pourtant ces derniers ne sont pas mus par la reconnaissance: après avoir grandi avec la plate-forme, ils n’ont de cesse de vouloir casser le lien de dépendance. Les enfants deviennent adultes. Ils vont se plaindre des frais excessifs prélevés par la plate-forme, la mettre en concurrence, voire l’abandonner complètement et créer leurs propres outils. Dès lors, considérant que la réussite des créateurs suit la loi du 80/20, la plate-forme a un risque significatif de rester avec les 80, le peloton. La plate-forme doit se prémunir de ce risque. Comment éviter la fuite des talents ? Plusieurs techniques sont utilisées qui éloignent de l’idéal de départ, semblent solidifier la plate-forme mais la corrompent et finissent par l’affaiblir au contraire :
Capter la relation client et ainsi reléguer les créateurs au rang de sous-traitants prêts à payer pour être bien placés dans les algorithmes de la plate-forme. C’est la stratégie d’Amazon sur le commerce. Le vendeur sur sa place de marché ne connaît pas l’acheteur, Amazon s’interpose. Et s’il veut être bien placé, il faut payer…cette technique est largement utilisée par les plates-formes sans véritable effet de levier sur les créateurs. Elles voient alors la valeur dans le client et non plus le créateur. C’est le cas d’Uber ou Lyft.
Contrôler le hardware sur lequel la plate-forme est utilisée. Apple est le champion de cette technique: L’App Sore est réservé aux produits Apple et Apple ne propose pas d’autres « magasins concurrents ». Des lors Apple peut charger 30% sans crainte de perdre Fortnite par exemple…
Créer une plate-forme monopolistique: c’est la technique de Google, que j’avais développée dans l’article Zoom peut-il chambouler le cloud ?
L’idée est toujours la même: prendre le contrôle d’une technologie qui réduit les frictions antérieures (Android, Chrome, Kubernetes, TenserFlow), la rendre open source pour en généraliser l’adoption, établir sa version améliorée propriétaire et peser sur les standards de place pour structurer le marché à sa convenance.
Copier et reprendre à son compte toutes les innovations en les intégrant, pour rendre compliqué et inutile le départ. Bien entendu ces outils sont presque compatibles avec l’extérieur mais pas tout à fait. Vous aurez reconnu Microsoft. Ses outils sont souvent moins bons que les autres (Teams, Excel, etc.) mais ils font le job, alors pourquoi changer ?
Concurrencer les meilleurs créateurs pour éviter d’en être dépendants, ainsi moins souffrir d’un éventuel départ. Apple Music concurrence ainsi Spotify et Amazon basics de nombreux vendeurs de sa place de marché…
L’open source est -il une exception à la règle ? Certaines plates-formes à la différence de celles développées par Google restent complètement open source. Elles ne sont pas pour autant philanthropes. Citons par exemple MongoDB (base de données) ou Elastic (moteur de recherche d’entreprise) qui imposent à tous les utilisateurs de leurs versions open source (gratuite) de dévoiler également l’intégralité de leur code ! C’est extrêmement dissuasif…
Plates-formes: la grande comédie
Une plate-forme pour percer doit être vue comme un progrès géant par rapport à une solution propriétaire qui enferme les créateurs ou les met carrément hors jeu. Le progrès perçu doit être suffisant pour occulter ses manœuvres protectrices. Lesquelles finiront plus tard par être mises au grand jour par une nouvelle plate-forme qui libérera les créateurs de l’ancienne emprise… la plate-forme surfe sur le grand cycle, intemporel, de la centralisation et de la décentralisation: décentraliser pour libérer, centraliser pour améliorer l’efficacité. L’Histoire est une succession de vagues de décentralisation et de centralisation, toujours pour une bonne raison. De même en économie, comme l’expliquait Jim Barksdale, il y a deux manières de gagner de l’argent: dégrouper et regrouper. La plate-forme libère puis elle organise: l’App Store a permis à de nombreux développeurs de trouver une audience mais il leur faut développer selon les normes d’Apple, ils s’en rendent compte souvent à leur dépends (Fortnite). Facebook a libéré la parole mais il doit maintenant la policer. En réaction à l’internet centralisé se développent les cryptomonnaies, lesquelles se trouvent maintenant centralisées dans Coinbase !
La plate-forme Wintel (Ms-Dos/ x86) a libéré les développeurs de l’emprise d’IBM qui les enfermait sur son propre matériel, OS, serveurs et puces. Puis le cloud (Linux) a libéré les développeurs de Windows et tente de les libérer de l’App Store par les web apps. Le cloud est encore dans la phase vertueuse de décentralisation. La preuve ? Il n’y a pas de procès sur l’oligopole AWS, Azure et Google Cloud Platform. Ce qui est loin d’être le cas pour l’App Store et son concurrent le Google Play Store, ce qui a été le cas pour Windows. Pourtant l’oligopole serre son emprise insidieusement…
La centralisation du cloud
Le cloud se veut ouvert. Le langage favori est Linux. Les programmes peuvent passer d’un cloud à l’autre, transportés dans des containers. Les serveurs se ressemblent, les centres de données aussi. Les trois opérateurs cloud se distinguent de la manière suivante:
AWS, le leader, est le plus innovant, multiplie les produits pour anticiper les besoins de ses clients
Azure fait levier sur sa clientèle entreprise qui est déjà sur Windows, Office, Outlook, etc.
Google Cloud Platform est le cloud le plus avancé techniquement. Étant le plus petit des trois, il jette des passerelles (Kubernetes), pour siphonner les deux autres et joue l’ouverture.
Les seconds couteaux type IBM ou Salesforce essaient de les banaliser en promouvant des plates-formes de développement multi cloud comme Openshift ou AppExchange (décentralisation). Devant ces attaques, les opérateurs cloud cherchent à dresser des barrières pour éviter la fuite de développeurs. Le software en tant que tel n’est pas une option puisqu’il doit pouvoir être transportable. Les serveurs ne sont que des grosses caisses. Que reste-t-il ? Les puces, l’intelligence des serveurs. Le contexte est idéal: il y a aujourd’hui un goulet d’étranglement important sur la puissance de calcul. Les développeurs sont en manque. Celui qui est capable de leur fournir le bon outil peut être le gagnant. D’après Dylan Patel:
Les charges de travail liées à l'apprentissage de l'IA deviennent de plus en plus complexes. OpenAI affirme que la quantité de calcul nécessaire pour former les réseaux les plus puissants double tous les 3,5 mois.
En plus de l’IA, il y a la 3 D, la 5 G, la réalité virtuelle et augmentée, etc. Toutes ces disciplines demandent des accélérateurs (puces GPU ou ASIC), or les serveurs actuels ne sont équipés qu’à hauteur de 10% en accélérateurs. C’est donc au niveau des puces que la bataille va s’engager, centralisation pour les opérateurs cloud, décentralisation pour des plates-formes émergentes.
Les opérateurs cloud se mettent donc à concevoir leurs propres accélérateurs (capables de faire des calculs massifs en série) et le logiciel intégré qui permet aux développeurs de les utiliser. Ils les mettent en batterie de manière propriétaire dans leurs serveurs, essayant de gagner en puissance, économie d’énergie et capacité de mémoire. Ils reprennent ainsi la maîtrise de l’intégration du hardware et du software, un coup de maître digne d’Apple, du Mac et de l’IPhone… À ce stade, il est important de noter qu’il est bien plus complexe pour un développeur de donner des instructions machine à un accélérateur qu’à un CPU: la part logicielle est donc plus importante et la possibilité d’intégration, donc de différenciation aussi. Google a commencé avec la partie software, TenserFlow, qu’il a développé en open source et qui s’est imposé comme le meilleur pour l’apprentissage. Puis il a créé la puce particulièrement adaptée à TenserFlow, la puce TPU. Il peut dès lors proposer le meilleur outil intégré d’apprentissage accessible dans son cloud. Si Google est en avance, les deux autres opérateurs ne sont pas en reste, se lançant tous les deux dans la conception de leurs propres puces CPU et ASIC (accélérateurs). L’idée est de resserrer le verrou sur les développeurs.
Décentraliser le cloud
Nvdia travaille depuis déjà 15 ans sur CUDA, son système d’exploitation permettant avec des utilitaires qu’il fournit, de programmer simplement ses puces graphiques (GPU) pour toute sorte de calcul en série massif (apprentissage profond, cryptographie, représentation 3D, voitures autonomes, etc.). La base installée de CUDA est 500 millions d’appareils. Nvdia a réalisé là un double coup de maître:
CUDA est multi-cloud et extrêmement pratique pour les développeurs qui peuvent programmer sur CUDA et tester sur CUDA dans n’importe quel environnement. Mieux même, les versions successives de CUDA améliorent la capacité de calcul des GPU existantes. Plus besoin de changer de matériel sans cesse.
CUDA par sa simplicité d’utilisation élargit le marché aux 40 millions d’ingénieurs graphiques qui n’ont pas forcément les compétences des 30 millions de développeurs. La plate-forme change ainsi de dimension
Nvdia est bien placé pour ravir le trophée de la plate-forme du futur, celle qui construira un internet en 3D intelligent libéré de l’emprise des opérateurs cloud. Le seul problème ? CUDA est intégré aux puces Nvidia, est donc une solution propriétaire. Perçu comme le libérateur d’abord, Nvidia finira par être vu comme un monopole. Les nouveaux candidats libérateurs sont déjà au travail.
Le premier est bien sûr Intel qui a raté le virage des puces graphiques et se rend compte maintenant que l’avenir est GPU. Écoutons Pat Gelsinger le nouveau PDG:
La perturbation architecturale qui me préoccupe le plus dans le centre de données est celle de l'IA, et non celle d'Arm, et dans ce sens, les produits d’Intel commencent à faire pression sur, je dirais, un Nvidia incontesté. Eh bien, ils vont être contestés à l'avenir, parce que nous apportons des produits de pointe dans ce segment. Nvidia est devenu trop propriétaire, et cela est largement perçu dans l'industrie, et nous allons donc répondre à ce problème avec oneAPI mais le faire d'une manière beaucoup plus favorable et ouverte à l'industrie et à ses innovations…
Son combat pour libérer le développeur sera difficile: Intel est la société intégrée par excellence, il lui faut changer de culture !
Plus gênant encore pour Nvidia est Tenstorrent, la start up dont le célèbre Jim Keller est devenu le directeur technologique (CTO). Tenstorrent fait passer les GPU Nvidia pour des usines à gaz. Il y a un problème à mettre des puces Nvidia en série dans un serveur aux fins de calcul très volumineux: il faut une couche hardware (switch propriétaire onéreux) et software pour définir les hiérarchies d’utilisation et répartir la charge de travail. Le travail du développeur devient complexe et d’autant plus complexe qu’on augmente la batterie de puces. Jim Keller:
Si vous écrivez sur un GPU, vous devez être un programmeur CUDA dans le thread, puis vous devez coordonner au sein du multiprocesseur de streaming, puis coordonner sur la puce, puis vous avez NVLink qui est une chose différente, et enfin vous avez le réseau qui est une chose différente. Il y a beaucoup de couches logicielles différentes dans ce modèle, et si vous avez 1000 personnes, ou si c'est ce que vous pensez être amusant, c'est cool.
Mais si vous voulez simplement écrire un logiciel d'IA, vous n'avez pas envie de gérer toutes ces couches différentes.
Tenstorrent a intégré une couche logicielle dans chaque cœur qui gère la communication avec les autres cœurs. Dès lors il devient possible d’aligner les cœurs à l’infini, la répartition des calculs s’opèrent par intelligence artificielle. Le travail du développeur est considérablement simplifié. Il n’a affaire qu’à un GPU géant avec 1 million de cœurs !
La ronde infernale des plate-formes n’est pas prête de s’arrêter. La programmation est réservée à une élite ! Il y’a environ 30 millions de développeurs sur cette terre sur une population de 7,7 milliards (0,4%) ! Pourquoi ne pas les abstraire et procurer les outils de création à un ensemble beaucoup plus large ? Le développeur qui était devenu la vedette avec le cloud puis les accélérateurs sera relégué avec ces derniers à un faire valoir d’une nouvelle plate-forme. donnant à tous les créateurs la possibilité de concevoir en 3D leurs briques du métavers. Meta (Facebook), le seul qui n’ait pas de cloud, est à la manœuvre. D’autres candidats ont aussi leurs ambitions, critiquant déjà Facebook pour vouloir dominer le hardware de réalité virtuelle…John Riccitiello, PDG d’Unity Software, interrogé par Ben Thompson:
Et donc, un point sur lequel je n'étais pas d'accord avec vous, c'est vraiment que la réalité virtuelle/augmentée (XR) s'ajoute au métavers, il n'est pas nécessairement central à toutes les parties du métavers. Je pense qu'il y aura beaucoup de choses qui ne seront pas des expériences du métavers, mais qui seront amusantes et intéressantes à faire sur un appareil XR. Le premier point est donc que je pense que le XR est intéressant, mais qu'il ne se superpose pas parfaitement au Metaverse.
Puis commettant les résultats du 3ème trimestre:
Nous sommes passés du Web 1 au Web 2, les trucs techniques du Web 1, j'avais une mosaïque dans une boîte, le Web 2 permet un Uber, si vous voulez, des données satellite, données cellulaires, informations de suivi, carte sur votre téléphone, c'est magique, la voiture apparaît. Web 3 est que ces expériences deviennent en temps réel, elles deviennent 3D, elles deviennent interactives et souvent spatiales.
La 3D disponible pour tous les créateurs libère de l’emprise d’Oculus ! La ronde infernale ne s’arrête jamais…
Bonne semaine,
Hervé