Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
Dans ma dernière lettre, j’évoquais la difficulté pour les fintechs de s’imposer du fait d’un manque d’ancrage physique. Elles n’ont pas le bon équilibre entre logiciel et matériel, ce qui entraine un écart entre la promesse (logiciel) et sa réalisation (matériel)
Parallèlement, les plus belles sociétés technologiques, les capitalisations boursières de plus de $500 milliards (Apple, Google, Microsoft…) arrivent à trouver un équilibre en intégrant les deux:
Il est intéressant à cet égard de suivre l’évolution d’OpenAI: manquant cruellement d’ancrage physique, ce dernier est dépendant du cloud de Microsoft pour l’entrainement et l’inférence, de l’iPhone ou du PC pour l’accès à ses services. Pour entrer dans la cour des grands, OpenAI (valorisé autour de $90 milliards) va devoir trouver son point d’ancrage physique. A cet égard, les discussions en cours entre Jony Ives et OpenAI sont instructives. 9 To 5 Mac, le 26 septembre 2023:
Jony Ive est devenu célèbre pour son rôle de Chief Design Officer chez Apple, car il était responsable de nombreux projets importants au sein de l'entreprise. Ive a quitté Apple en 2019 pour fonder sa propre entreprise de design, LoveFrom, et a depuis travaillé avec des partenaires tels qu'Airbnb et Ferrari. Selon un nouveau rapport, Ive discute actuellement du projet d'un nouveau "matériel d'IA" avec Sam Altman, PDG d'OpenAI.
Comme le rapporte The Information, Jony Ive a discuté avec Sam Altman de la construction d'un nouveau dispositif d'intelligence artificielle. On ne sait pas encore exactement quel sera l'objectif de cet appareil ni à quoi il ressemblera, mais des sources familières avec les conversations affirment qu'ils veulent créer un "nouveau matériel pour l'ère de l'IA".
OpenAI ne veut pas se trouver enfermé comme l’a été Meta pendant des années, dépendant pour l’accès à l’utilisateur final d’Apple (iPhone) et de Google (smartphones Android). Meta veut sortir de cette situation par le casque VR et les lunettes AR; OpenAI souhaite lui probablement créer un nouvel OS lié à son propre matériel et ainsi concurrencer frontalement Apple et Google, se hisser dans leur cour.
Le point important à considérer est l’équilibre entre les deux. Car si une offre logicielle déconnectée d’un socle matériel est dangereuse, l’inverse l’est tout autant, voire d’avantage. Une approche matérielle prépondérante peut rendre le logiciel médiocre et créer une réelle distorsion entre l’offre et la demande.
La tentation du matériel
Il est plus facile de fixer un prix sur du matériel que sur du logiciel car il est palpable. Le fabriquant fait une marge raisonnable sur le coût d’achat des marchandises vendues. Pour le logiciel, la marge est quasiment de 100 % quel que soit le prix fixé (le coût est au développement). C’est déroutant pour l’acheteur qui se demande pourquoi il paie une copie gratuite…
C’est ainsi qu’Apple a un logiciel de première qualité (IOS ou MacOS) qu’il monétise principalement au travers de son matériel (iPhone, Watch, Mac, AirPods, etc.).
Google ou Meta, dont l’offre était à l’origine purement logicielle, ont adopté un modèle publicitaire, leur permettant d’éviter de facturer l’utilisateur. On peut voir également les difficultés de X (ex Twitter) qui aimerait bien faire payer un petit abonnement à ses utilisateurs, plutôt que reposer sur un modèle publicitaire peu performant. Elon Musk arrivera-t-il à franchir le pas au risque d’une forte déperdition d’audience ?
Devant cette difficulté, la tentation est de fabriquer du matériel qui sera facile à facturer, quitte à sacrifier le logiciel. Les sociétés ou organisations qui ont pourtant besoin de technologies de pointe peuvent facilement tomber dans ce travers avec des conséquences redoutables sur leur avenir. L’exemple phare est IBM, dont je dirai deux mots pour illustrer les mécanismes de ce travers mais celui qui pourrait avoir les conséquences des plus néfastes est le Pentagone.
Le cas IBM
IBM était dans son ADN un fabriquant d’ordinateurs qu’il vendait ou louait aux entreprises. Du fait de sa domination du marché notamment des gros systèmes, après guerre, IBM s’est fait poursuivre par l’Etat US pour abus de position dominante en 1969. IBM a alors cherché à calmer le Département de la Justice en découplant son software de son hardware (ce qu’a toujours refusé de faire Apple car trop conscient de l’importance du software). Il a donc facturé séparément hardware et software permettant à d’autres concepteurs de software de vendre leur logiciel sur matériel IBM. IBM acceptait ainsi de mettre en concurrence ses propres logiciels avec ceux de tiers. Or la seule loi dans la technologie est celle de l’échelle, en particulier pour le logiciel: frais de développement importants et coût marginal nul. C’est pourquoi, à la différence d’IBM qui pensait d’abord à son propre matériel, les sociétés de logiciel ont cherché à vendre à tous les fabricants d’ordinateurs. Au final, les logiciels d’IBM étaient onéreux (moins d’effets d’échelle) car peu compatibles avec des ordinateurs tiers alors que la concurrence était moins cher car interchangeable sur tout matériel. Cette faiblesse d’IBM l’a entraîné à conclure un accord avec Microsoft en 1975 pour concevoir un OS compatible avec les PCs tiers. MS-DOS (puis Windows) est devenu la pièce importante du PC qui lui a été relégué en arrière plan comme une pièce générique. IBM a certes gagné son procès en 1982 mais perdu la guerre…Aujourd’hui la capitalisation boursière d’IBM est de $130 milliards, celle de Microsoft de $2 300 milliards (18 fois plus)…L’effet d’échelle sur le logiciel est supérieur à celui sur le matériel: quand on sépare les deux, c’est le producteur de matériel qui est le plus en risque…c’est l’exemple d’IBM mais aussi de tous les fabricants de smartphones fonctionnant avec Android (Google).
Le Département de La Défense
Comment se fait-il que l’armée américaine empile du matériel du guerre (porte-avions, F35, missiles, satellites, etc.) équipé de puces de vieilles générations, fabriquées en Asie, alors que la Chine développe une capacité d’intelligence militaire moderne qui lui permettrait d’opposer une réelle défense à tout ce matériel s’il était mis en action ? Pourtant, l’industrie des semi-conducteurs des Etats-Unis a 10 à 20 ans d’avance sur l’industrie chinoise…L’explication est une trop importante focalisation par le Département de La Défense sur le matériel, au détriment du logiciel, qui a entraîné un divorce entre l’armée et la Silicon Valley: le logiciel pousse le matériel à ses limites et vice versa: il y a une interaction de progrès entre les deux qu’a su parfaitement mettre en œuvre la Silicon Valley. L’armée a vu différemment: le Département de La Défense cherchait de gros budgets, la Silicon Valley visait la satisfaction du consommateur car elle n’avait pas le choix et était poussée à l’excellence.
La lune de miel
L’industrie de La Défense après la deuxième guerre mondiale a beaucoup contribué à l’émergence et au succès de la Silicon Valley. Tout part de l’invention du transistor en silicium inventé par William Shockley (dont la mère vivait à Palo Alto). Ce transistor va vite remplacer le transistor à tube beaucoup plus imposant présent dans les gros ordinateurs. L’armée est friande de miniaturisation notamment pour ses missiles ou fusées et va constituer le client final pour de nombreuses sociétés cherchant à produire des semi-conducteurs (Texas Instrument, Fairchild, Hewlett Packard, Intel, etc.). Le développement de l’industrie de semi-conducteurs nécessite un très large marché car c’est une industrie de frais fixes, comme le logiciel, qui se perfectionne avec l’effet d’échelle. Aussi même si le militaire était le premier client, les applications civiles ont permis à cette industrie de décoller, apportant un effet d’échelle inimaginable dans une autre partie du monde, donnant ainsi une avance considérable à l’armée américaine par rapport à l’URSS (qui n’avait pas de débouchés civils).
Le décalage culturel
Les applications civiles sont guidées par la demande que les entreprises de semi-conducteurs essaient de prévoir. Pour percer, il faut être toujours plus innovant, les semi-conducteurs plus puissants et les applications logicielles multiples, tout cela à un prix le plus abordable possible pour le consommateur. L’industrie se structure pour répondre à cette demande et progresser à la vitesse de la loi de Moore pour vendre toujours plus. Chaque génération de puces n’est économiquement viable que si le taux de défaut dans la fabrication est limité. C’est un véritable prouesse avec la miniaturisation toujours plus poussée et les contraintes logicielles croissantes. Cela entraine une spécialisation des fonctions (design, outils de fabrication et de contrôle des rendements, fabrication, packaging, logiciel). au final, il ne reste que quelques entreprises du bloc occidental, encouragées par les Etats-Unis à l’époque de la guerre froide, hyper-spécialisées comme ASML, Applied Materials, Advantest, Tokyo Electron, TSMC, Intel, Microsoft…). Ces entreprises travaillant de concert constituent l’unique chaine de valeur des semi-conducteurs. Aussi, même si le militaire a donné l’impulsion, le civil l’a largement dépassé en terme de demande, puisqu’on trouve les semi-conducteurs pratiquement partout (voitures, électro-ménager, ascenseurs, etc. Le militaire n’est plus qu’un client parmi tant d’autres aux commandes erratiques et qui n’a plus la priorité sur les puces de dernière génération…
Pire encore, l’industrie militaire a évolué dans son propre monde, négligeant l’importance d’un bon équilibre entre semi-conducteurs et logiciel pour plus de performance: Microsoft n’existerait pas sans Intel et vice-versa. Guidée par une logique de justification de budgets les plus importants possibles, le Département de la Défense des Etats-Unis a privilégié l’accumulation d’équipements physiques, dont la valeur est plus facilement appréciable qu’un système d’intelligence artificielle par exemple. La R&D a été progressivement sacrifiée. A l’époque de la guerre froide, il fallait pour impressionner l’adversaire et ses alliés montrer qu’on dépensait des sommes impressionnantes pour l’armement en pourcentage du PNB (supérieurs à 10 % dans les années 50). Les industriels de l’armement qui pouvaient compter sur cette manne ont appris à facturer en fonction de leurs coûts. Leur motivation était avant tout d’avoir des coûts importants (refacturés avec marge) et pour ce faire rien de tel que produire du matériel: bateaux, porte-avions, missiles. La recherche/développement était négligée car plus difficile à appréhender et facturer. Cet état d’esprit convenait parfaitement aux membres du Congrès qui votaient les budgets et pouvaient espérer ramener des emplois et des contrats dans leurs propres Etats. Une culture d’allocation des ressources quantitative plus que qualitative, socialiste plus que capitaliste, s’est mise en place et a perduré jusqu’à ces dernières années. Mac Namara, ancien secrétaire d’Etat à La Défense l’avait institutionnalisé dans les années 60 avec l’instauration de budgets à long terme de type soviétique. Cela a pu suffire à une époque où la force brute des Etats-Unis était suffisante pour gagner une guerre. C’est moins évident aujourd’hui où un meilleur équilibre entre matériel et logiciel permet de limiter les dommages de la force brute, voire d’humilier son promoteur.
L’accès aux semi-conducteurs de pointe
Pendant des décennies, le Pentagone a négligé les semi-conducteurs de pointe (les gravures les plus fines), ceux demandés pour l’intelligence artificielle par exemple pour se concentrer sur les puces personnalisées comme les ASICs ou les FPGAs, gravés sur des galettes 10 nm au mieux. Ces puces sont calibrées pour effectuer des tâches spécifiques à l’équipement de combat (en local, nécessitant un contrôle humain important), pas pour s’intégrer dans un système global d’intelligence logiciel fonctionnant en temps réel. Elles sont idéales pour le traitement du signal, le contrôle du vol, le cryptage, le décodage, la vision de nuit, etc. elles ne résolvent pas le problème de fragmentation des diverses actions militaires et la nécessité d’une coordination quasi-parfaite sur longue distance. Pour avoir des systèmes coordonnés et plus rapides que ceux de l’ennemi, il faut pouvoir entraîner des modèles d’intelligence artificielle plus nourris et donc s’appuyer sur les GPUs dernière génération. Puis il faut un système d’exploitation sécurisé, capable d’intégrer toutes les données des différents systèmes militaires en temps réel et de les analyser; enfin un matériel équipé de puces derniers cri pour converser avec le logiciel et entrer en action. En bref, il y a aujourd’hui des trous dans la raquette. Du fait de ce prisme « gros matériel », largement entretenu par les sociétés d’armement motivées pour le statu quo, le logiciel n’est pas au niveau et ne requiert que des puces de second ordre. Le Pentagone est devenu un client secondaire pour TSMC, qui réserve sa capacité de production des puces de dernière génération à Apple et Nvidia, des clients fidèles aux commandes élevées et consistantes. L’armée US devient ainsi privée d’intelligence artificielle performante, car sortie de la boucle de la Silicon Valley.
Rééquilibrer la balance
Nécessité fait loi: les Etats-Unis ont enfin compris qu’ils pouvaient se faire déborder par la Chine, au plan militaire. Cette dernière a certes une industrie de semi-conducteur balbutiante mais a réalisé avant les États-Unis :
que les semi-conducteurs étaient aujourd’hui au cœur de quasiment tous les produits (ils sont stratégiques comme le pétrole)
que l’armée chinoise pouvait s’appuyer sur l’intelligence artificielle pour développer des armements de pointe capable de défaire le matériel américain.
Elle s’est de ce fait équipée au maximum en technologie occidentale pour faire progresser son industrie nationale et ses champions comme Huawei ou ZTE. Elle est, semble-t-il, capable d’entraîner des modèles d’intelligence artificielle poussés et de les intégrer dans sa stratégie militaire. Elle a de plus, en parité de pouvoir d’achat, un niveau de dépenses militaires proche de celui des Etats-Unis.
Riposte défensive
Sentant le vent du boulet, les ÉtatsUnis restreignent progressivement l’accès de la Chine aux semi-conducteurs occidentaux. Dans un premier temps, certaines entreprises chinoises ont été placées sur une liste noire, leur interdisant l’accès direct et indirect aux technologies américaines. Dans un deuxième temps, les sanctions ont été élargies: ce sont les entreprises incorporant des technologies US qui se voient privées de ventes en Chine (ASML, Nvidia pour leurs produits les plus avancés). Quelle que soit la couleur de l’administration, au delà des discours plus ou moins agressifs, la stratégie est de ralentir la progression technologique de l’armée chinoise. Cela reste insuffisant: un sentiment d’urgence a commencé à se manifester depuis quelques années, renforcé par la guerre en Ukraine. Les méchants ne sont plus simplement des groupuscules terroristes mais des États armés jusqu’aux dents. Cette réalisation pousse l’armée des États-Unis à se moderniser, à introduire du logiciel pour exploiter au maximum ses capacités technologiques, bref à se réconcilier avec la Silicon Valley.
Le retour de la Silicon Valley
Rien n’est gagné tant la culture planificatrice et les intérêts de l’industrie de l’armement de garder le contrôle sur un budget de $800 milliards par an sont un frein à l’innovation. Cependant, il y a aujourd’hui une ouverture très nette liée aux craintes sur Taïwan et la politique de Xi Jinping. Quelques acteurs de la Silicon Valley se sont engouffrés dans la brèche pour essayer d’introduire du logiciel dans les budgets militaires, pour rendre l’équipement plus compétitif à moindre coût, selon la logique de l’effet d’échelle. Le potentiel est énorme, même si la tâche est herculéenne.
Palantir Technologies
Palantir a été fondé il y a 20 ans par Peter Thiel et Alex Karp notamment, deux entrepreneurs de la Silicon Valley. Dans les années 2000, le gouvernement américain a dû se rendre à l’évidence que la force brute (réaction après le 11 septembre) n’était pas adaptée à l’élimination de la menace terroriste et qu’il fallait renforcer sa capacité de détection et d’élimination de menaces diffuses, c’est à dire son service de renseignement. Dès lors le logiciel, dont l’armée manquait cruellement, était la seule voie possible pour contrer le logiciel ennemi. Pour convaincre le Département de La Défense, Peter Thiel a avancé le concept de l’intelligence artificielle augmentée par l’humain, seule capable de déjouer un logiciel espion ennemi, d’éviter le piratage. Il y avait là une certaine habileté car il était plus facile pour le Département de La Défense d’imaginer facturer de la main d’œuvre que du logiciel à valeur intangible.
Peter Thiel a adapté son logiciel de détection de la fraude, celui qui avait assuré l’avantage concurrentiel de PayPal (voir mon précédent article), aux besoins du renseignement. N’étant pas un bénéficiaire traditionnel des budgets militaires, il lui a fallu faire ses preuves, financer la R&D et le logiciel de récolte et d’exploitation des données, pour le vendre, ficelé avec une intervention humaine, aux administrations US comme la CIA, le FBI, les US Marine, etc. Suivant la tradition ancienne de la Silicon Valley qui est de travailler pour le civil et pour le militaire, Palantir a deux versions de son logiciel, Foundry pour le premier et Gotham pour le second.
Avec la menace croissante tant de la Russie que de la Chine, le Département de La Défense réalise que la coordination en temps réel de toutes ses forces en fonction du danger devient la priorité. En 2017, Palantir crée une plateforme logicielle capable d’intégrer toutes les données du Pentagone, d’où qu’elles viennent et les présenter sous standard commun pour analyse et action. Cette plateforme nommée Apollo est comme un OS sur lequel faire fonctionner Gotham et tout autre logiciel (IA générative par exemple), avec pour objectif de coordonner et automatiser l’action des armées.
Anduril Industries
Palantir introduit du logiciel pour plus d’intelligence et rééquilibre les poids respectifs de celui-ci et du matériel militaire existant. Il évite ainsi le conflit avec le complexe militaro-industriel qui ne le voit pas comme concurrent. Les fondateurs d’Anduril Industries, anciens de Palantir, ont une ambition plus poussée: introduire une nouvelle génération de matériel militaire bien moins cher que le matériel existant grâce à son couplage avec du logiciel et des puces de pointe. L’augmentation de la part logicielle fait en général baisser le prix du matériel qui peut alors être générique et non plus spécifique (le logiciel coordonné à des puces puissantes fait la majeure partie du travail). C’est ainsi que chez Tesla, le logiciel tient une place plus importante que dans une voiture à essence, les pièces sont moins nombreuses et la gestion de celles-ci plus centralisées avec des puces plus puissantes. La virtualisation du matériel informatique dans l’entreprise par exemple a permis de réduire les coûts liés à la spécialisation du matériel en remplaçant les serveurs de stockage, de calcul et de réseau par des serveurs génériques multifonctions. De même la virtualisation des réseaux téléphoniques permet de faire de nombreuses économies sur le matériel d‘inter-connexion. La logique de cette virtualisation, poussée à l’extrême est le cloud qui bénéficie d’un effet de mutualisation maximum.
Anduril, fondé en 2017, veut créer le cloud de l’industrie militaire, le système d’exploitation qui pourrait permettre de coordonner un matériel militaire de nouvelle génération autonome et intelligent, bien moins cher que les F35 à $100 millions ou les porte-avions à $10 milliards et qui pourrait donner un avantage décisif à l’armée américaine dans un conflit avec la Chine. Le fondateur estime que l’approche de Palantir est insuffisante, que le vieux matériel ne peut fonctionner sur un OS moderne. Brian Schrimpf, CEO fondateur d’Anduril:
Le matériel qui a été construit jusqu'à présent n'est pas conçu pour avoir les bonnes API logicielles, le bon contrôle, pour être capable de déployer des modèles modernes d'apprentissage automatique, ce n'est tout simplement pas comme ça que ça fonctionne. C'est très codé, c'est très mâché, c'est très conçu pour le contrôle manuel de ces choses, et donc quand vous voulez appliquer toutes ces techniques logicielles avancées, cela s'effondre. C'est pourquoi la conception d'un matériel ouvert et piloté par API dès le départ nous a permis d'être extrêmement efficaces dans la manière de relier ces éléments en une famille intéressante de systèmes.
Anduril propose son propre système d’exploitation, nommé Lattice, qui va infuser de l’intelligence artificielle sur du matériel militaire autonome d’abord défensif (plus facile à faire adopter quand il est entièrement robotisé) puis progressivement offensif. La société opère des acquisitions de fabricants de matériel pour les brancher sur Lattice, augmenter l’emprise de son OS et répandre son matériel bon marché dans toutes les sphères militaires.
Tous les efforts de Palantir et Anduril ne doivent pas obstruer la réalité d’un décalage culturel encore important entre la culture “matériel d’abord” du Pentagone et la culture “logiciel d’abord” de la Silicon Valley. Le tableau suivant montre les chiffres d’affaires respectifs de ces sociétés comparées aux autres sociétés d’armement:
Il y a encore beaucoup de chemin à faire pour changer les mentalités. L’ancrage physique peut être un plus comme vu dans mon article précédent mais aussi un frein important à l’innovation (cf IBM, BlackBerry et ses touches tactiles, enfin et surtout le Pentagone !)
“In medio stat virtu”.
Bonne fin de semaine,
Hervé