IA: la rébellion, part 2
Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
Suite de l’IA, une machine à centraliser, part 1
Pourquoi plus de centralisation ?
les MegaTech (soyons dans l’emphase) ont un contenu gratuit massif collecté depuis de nombreuses années -textes, photos, vidéo, profils - et qu’elles continuent à collecter (la matière première)
Elles ont des montagnes de serveurs (une puissance de calcul inégalable) capables de transformer par l’IA cette matière première de manière à captiver une audience se chiffrant en milliards parfaitement ciblée. Elles maîtrisent le contenu et la destination.
Les créateurs du contenu peuvent devenir une menace concurrentielle, prenant leur audience pour aller faire fortune ailleurs (exemple de Ninja quittant Twitch pour Mixer)
Les MegaTech ont ainsi les meilleures raisons du monde d’internaliser la création, IA aidant, tout en prêchant l’ouverture pour laisser le flot de contenu se déverser chez elles et le copier en cas de menace. Cette stratégie de l’ouverture intéressée est un classique de la Silicon Valley. Elle a déjà été utilisée par exemple par Microsoft pour se débarrasser de Netscape dans les années 90 et par Google pour marginaliser Yelp dans les années 2010. Dans les deux cas, cela a fonctionné, malgré les protestations des sociétés ainsi étrillées. Vox, le 3 juillet 2017:
Lorsque les autorités antitrust européennes ont annoncé une amende de 2,4 milliards d'euros (2,7 milliards de dollars) à l'encontre de Google fin juin, peu de personnes avaient plus de raisons de se réjouir que le PDG de Yelp, Jeremy Stoppelman…
M. Stoppelman soutient que Google a nui à Yelp en plaçant artificiellement les liens vers son propre concurrent Yelp - précédemment nommé Google Places et rebaptisé Google My Business en 2014 - avant ceux de Yelp dans les résultats de recherche de Google. Et il affirme que cela fait partie d'une tendance plus large, dans laquelle les géants de l'internet comme Google et Facebook ont utilisé leur pouvoir pour limiter la concurrence et empêcher l'émergence de nouveaux concurrents puissants.
Plus récemment, Microsoft a encore frappé avec Teams, pour contrer l’ascension fulgurante de Zoom. Cette fois, la stratégie pourrait être déployée à grande échelle, en intervenant encore plus en amont pour préempter les créations dérangeantes, quelle qu’elles soient.
Force et faiblesse des MegaTech
Force
Les MegaTech Tech partent d’une fonction clé qu’elles ont réussi à rendre populaire. Puis, faisant levier sur leur audience, elles s’étendent comme des pieuvres en assemblant cette fonction clé avec leur version de toute autre fonction qui pourrait les concurrencer. Cette version est souvent inférieure mais l’emporte. L’audience massive qui résulte de ce processus, malgré la qualité moyenne de l’ensemble, donne une impression d’invulnérabilité. Donnons quelques exemples:
Microsoft a réussi à étendre son empire sur internet (à ses débuts) en faisant sa copie de Netscape et l’assemblant avec Windows. Il refait le coup aujourd’hui en assemblant Teams avec Azure, puis avec Outlook, etc. Même si le produit est moins bon que Zoom ou Slack, la facilité de branchement fait adopter la solution. La fonction clé pour Microsoft dans les années 90 était Windows, elle est maintenant Azure.
La fonction clé d’Alphabet est le moteur de recherche Google. Elle lui a permis de créer sa propre version d’Android (incluant Google search puis le Play Store) et de l’imposer à l’ensemble des fabricants de smartphones (hors Apple).
Pour Apple, la pièce clé est l’IPhone. Le cours d’Apple a décollé à partir de 2007, année de sa sortie:
Apple crée tout un écosystème lié à l’iPhone à la fois de hardware (Watch, AirPods…) et software (Music, TV, Plans, pub…) qui vient contrer les menaces concurrentielles.
La pièce clé de Meta est le graphe social. Elle lui a permis de contrer Twitter avec les tendances et Snap en copiant les “stories”.
L’atout majeur de Netflix est son catalogue amorti sur d’avantage d’abonnés que ses concurrents. La société veut maintenant s’attaquer aux jeux vidéo qui attirent la jeunesse et sont donc une menace. Au crédit de Netflix, il faut inscrire leur volonté de ne pas copier mais changer le modèle économique des jeux (abonnement).
Amazon a trois piliers ( la place de marché, AWS et Prime) qui lui permettent de s’étendre en aval et de créer Amazon Basics, DynamoDB ou Amazon logistics par exemple. Sont visés les produits de la place de marché, MongoDB et UPS.
Faiblesse
Derrière l’audience, il y a la fonction clé, la pièce indispensable. C’est elle qui crée l’audience en premier lieu et en est le ferment. Mais il ne faut jamais oublier qu’avec l’internet, la concurrence pour l’audience n’est qu’à un clic. Si bien que si la MegaTech perd sa pièce clé, son audience peut partir à veau l’eau et l’édifice s’écrouler. Considérer l’audience comme la pièce clé (surestimer l’effet réseau) est une erreur car c’est oublier le moteur. L’internet a rendu Windows obsolète (malgré les efforts de Microsoft pour prolonger son caractère indispensable avec Explorer). La pièce clé était devenue le moteur de recherche permettant de trier une infinité de sites, le système d’exploitation était devenu secondaire. La mobilité n’a pas tué Google car il a su imposer son moteur (toujours indispensable en mobilité) sur tous les smartphones. Après avoir conquis Android, Il est prêt à payer Apple plus de $10 milliards par an pour ce faire ! Meta est aujourd’hui en risque de perdre son principal atout, le graphe social, rendu obsolète par TikTok. La société doit s’adapter, se transformer pour adopter le modèle TikTok avant qu’il ne soit trop tard et qu’elle ait perdu son audience. Plus généralement on assiste à une TikTok-isation des MegaTech qui cherchent à se rapprocher de leur audience en leur fournissant ce qu’ils veulent (par l’IA). Si bien que leurs pièces clés devient leur hardware propriétaire, produit à l’échelle, que ces MegaTech soient opérateurs cloud ou non, quels que soient les moyens employés pour monétiser cette puissance de calcul.
La pièce essentielle est le centre de données. Amazon produit ses propres CPUs (Graviton) et puces d’intelligence artificielle (Trainium). Alphabet conçoit ses TPUs, concurrents de Nvidia. Meta se fait construire des ASICs sur mesure par Broadcom ($1 milliard par an). Apple est connu maintenant pour l’excellence de ses puces Arm (générations M et A) qui différencient ces appareils. Enfin Microsoft a recruté un spécialiste des puces, ancien d’Apple, en vue de concevoir ses propres puces pour Azure. La puce est un élément, parmi d’autres du hardware propriétaire. C’est l’ensemble (CPU, GPUs, mémoires…) dans des centres de données mis en réseau qui devient la pièce essentielle.
A partir du moment où la pièce essentielle des Big Tech devient le hardware, leur fragilité se concentre et s’accroît. Les fabricants de hardware obsolète courent les rues (IBM, Compaq, HP…) Si l’histoire est un bon guide, les Big Tech sont alors menacés aussi bien par du hardware que du software. Et ce d’autant que l’insatisfaction monte chez les créateurs.
L’attaque par le hardware
Nvidia ne peut pas voit d’un bon œil la tendance des Big Tech à se renfermer sur elles-mêmes et à fabriquer leurs propres puces. Celles-ci, en plus d’être fabriquées à leurs spécificité sont moins cher que les puces Nvidia. Pendant la première phase de leur développement, les Big Tech ont toutes largement utilisé les GPU Nvidia et contribué à la croissance du leader des puces graphiques (courbe en noir)
La division la plus en vogue de Nvidia pourrait se retourner, comme s’est retournée celle des cartes graphiques (courbe en jaune). Voilà une belle motivation pour accompagner un mouvement de rébellion contre les MegaTech, pour faire triompher une nouvelle catégorie de matériel destiné à l’alliance anti MegaTech, celle des créateurs. Le projet fou de Nvidia est de créer son propre cloud, version 3D et IA, à partir de ses propres serveurs en réseau optimisant l’utilisation de puces Nvidia. Dans la conception de ses GPU, Nvidia a pris le parti de faciliter la programmation, même si c’est au prix d’une puce moins performante ou plus cher au départ. CUDA, la couche de programmation logicielle est devenu un standard qui facilite la vie des créateurs. Nvidia réitère aujourd’hui avec la technologie de conception de jeu Ray Tracing très consommatrice en énergie mais donnant automatiquement un très bon rendu pour les programmeurs. Nvidia veut maintenant créer son propre cloud 3 D, louer cette puissance et facilité de calcul aux programmeurs et damer le pion des MegaTech, encore focalisées sur un univers 2D. La vision de Jensen Huang, le CEO de Nvidia est de démocratiser au maximum la création en fournissant les blocs de lego 3D et IA, en temps réel, accessibles depuis son cloud en version haut de gamme. La vision constante de Jensen Huang est de fournir une solution intégrée permettant de faciliter le développement, de décentraliser la création, que ce soit par CUDA, par les puces RTX de dernière génération ou le cloud Omniverse. Une partie de plus en plus significative de la programmation est pré-construite dans l’outil Nvidia de manière à simplifier celle-ci et augmenter le nombre de programmeurs.
Il y a cependant un problème: le refrain entonné par Nvidia est le même que celui précédemment entonné par les MegaTech: leur objectif était de libérer la création des précédents oligopoles (presse, grande distribution, etc.). Finalement Nvidia propose de centraliser sur ses centres de données (hardware +software) pour contrer les centralisateurs. Un centralisateur de plus ? Est-ce cela dont les créateurs ont besoin ?
L’attaque par le software
IBM a l’époque de son monopole a été attaqué de tout côté: par le hardware certes (Apple, Compaq) mais c’est le software qui a eu raison de sa superbe (Microsoft). Nvidia attaque par le hardware tout en cherchant à libérer le software de l’emprise des MegaTech (leur cloud principalement). Il favorise par ses outils la multiplication du nombre de développeurs. Jensen Huang lors d’un récent interview par Ben Thompson:
Tout d'abord, si vous pensez aux premiers principes de l'intelligence artificielle, il s'agit d'un ordinateur qui écrit des logiciels par lui-même. La mesure dans laquelle l'informatique pourrait aider la société n'est pas limitée par le coût des ordinateurs, elle est limitée par le nombre de personnes qui savent programmer des ordinateurs, et donc le nombre de personnes qui peuvent maintenant programmer des ordinateurs a augmenté d'un facteur de plusieurs ordres de grandeur, et la raison en est que presque tout le monde sait comment enseigner à quelqu'un d'autre comment faire quelque chose, ou montrer à quelqu'un comment faire quelque chose correctement, mais très peu de personnes savent comment programmer C++. Je pense que pour l'intelligence artificielle, le concept que vous avez maintenant un informaticien à l'intérieur de votre ordinateur, c'est la première partie de la démocratisation.
Les MegaTech sont partis d’une pièce de software qu’ils ont rendu indispensable, que ce soit Google, Facebook, Amazon, Microsoft ou même Apple (Mac OS quand Apple tournait encore avec des puces Motorola). Ils ont maintenant consolidé leur avantage par le hardware mais restent vulnérables à une pièce de software qui ferait irruption soudainement dans leur territoire (à la TikTok). Instagram, la pièce maîtresse de Meta a commencé comme un outil de filtre photos, lesquelles étaient postées sur Twitter ! C’est un bon exemple de possibilité d’un simple outil logiciel sans effet réseau au départ. En multipliant les possibilités de concevoir du logiciel, au delà de la maîtrise de C++, on multiplie également les chances de voir les MegaTech repoussées dans leurs retranchements. La menace est invisible aujourd’hui mais elle croit en proportion du nombre de développeurs.
La question reste de savoir si les développeurs accepteront l’emprise de Nvidia, c’est à dire d’être soumis à un monopole encore pire que les précédents. Avant, on avait au moins 3 clouds!
L’attaque tous azimuts
Intel pense avoir la solution qui est de casser l’intégration proposée par Nvidia. Cette intégration rend les systèmes Nvidia très onéreux pour les clients opérateurs cloud ou entreprises. La centralisation a un coût. (Nvdia réalise des marges brutes de 65% ), ce qui pousse à des solutions alternatives. Intel a donc lancé un équivalent de CUDA en open source, appelé OpenVINO. A la différence de CUDA, openVINO peut répartir le programme sur le hardware le plus adapté disponible (CPU, GPU, ASIC) sans action particulière du développeur. La version openVINO d’Intel soutient le matériel d’intel, mais d’autres versions pourront soutenir d’autres fabricants. Intel a juste l’avantage d’être le premier, donc d’avoir plus d’effets d’échelle et plus de chances de devenir le standard. OpenVINO est à ce stade moins performant que CUDA associé aux dernières générations de GPUs Nvidia, mais il démocratise complètement l’utilisation de l’intelligence artificielle, la rendant accessible depuis un simple PC muni d’un CPU Intel.
Ainsi Stable Diffusion, un programme d’intelligence artificielle open source qui transforme du texte en images (voir part 1) tourne maintenant sur OpenVINO:
Source Stable Diffusion
Stable Diffusion donne un super pouvoir à tout créatif qui ne dessine pas forcément très bien, mais qui sait exprimer sa créativité en langage écrit (pas du C++). On peut imaginer comment les super pouvoirs conférés par Stable Diffusion vont s’élargir au cinéma, au droit, à la médecine, à l’écriture… en même temps qu’ils seront très accessibles même en dehors des MegaTech . Il va s’ensuivre probablement un déluge de création tous azimuts dont la grande majorité sera destinée à la poubelle mais dont une minorité sera d’extrême qualité. La création revient en force…Il faut noter que Stable Diffusion est une émanation de Stability AI, une start-up fondée en 2020 par Emad Mostaque, un ancien analyste employé de hedge funds. La société s’est développée en autofinancement (jusqu’à présent), sans faire appel à des fonds de capital risque. Stable Diffusion a été entrainé avec des images publiques trouvées sur l’internet (gratuites) et d’après Wikipedia:
Le modèle a été entraîné à l'aide de 256 GPU Nvidia A100 sur Amazon Web Services pour un total de 150 000 heures GPU, pour un coût de 600 000 dollars.
Une menace à $ 600 000 !
L’éternelle question du tri
Qui dit déluge de création, dont 99 % de mauvaise qualité, dit nécessité de trier le 1 % de qualité et de l’exposer à ceux qui pourraient être intéressés. C’est là où la puissance de calcul des MegaTech et la masse des données collectées sur leur audience est censée leur faire garder l’avantage. Progressivement les MegaTech ont fait dériver leur avantage concurrentiel: d’outil au départ (Google search, iPhone, filtre photos…), elles se transforment en machines à maximiser le temps passé dans leur univers. Même Apple avec sa priorité donnée aux services est dans la même cour. Les MegaTech se « TikTok-isent ». Le risque est que l’audience se lasse de toujours devoir passer d’un sujet à l’autre (la logique de la machine IA MegaTech) et privilégie l’impact au temps passé.
L’irruption de BeReal dans le top des applications les plus téléchargées est un indicateur de cette tendance. D’après Phone Arena, le 30 septembre 2022:
Si vous nous aviez demandé au début de l'année quelle était la plateforme de médias sociaux la plus populaire, nous aurions répondu TikTok. À l'époque, TikTok était l'application la plus installée sur l'App Store et le Google Play Store. Mais ces derniers mois, une application relativement nouvelle a gagné en popularité et est devenue le nouveau grand succès des jeunes. Oui, nous parlons bien de "BeReal".
En quelques mois seulement, l'application BeReal a vu son nombre de téléchargements monter en flèche et est devenue l'application la plus téléchargée sur l'App Store américain en août et septembre. Et le plus impressionnant, c'est qu'en ce moment, TikTok et Instagram travaillent tous deux sur des fonctionnalités similaires à ce que BeReal offre à ses utilisateurs. Nous pouvons donc affirmer que BeReal est en bonne voie pour se tailler une place sur la scène des médias sociaux.
Le fonctionnement de BeReal est le suivant: chaque jour à un moment choisi au hasard par l’application, le même pour tout le monde, l’utilisateur doit poster deux photos de ce qu’il fait: une qui montre ce qui se passe devant, une façon selfie. Il a deux minutes pour prendre les deux photos et n’a pas le droit d’utiliser de filtre. Ces deux photos seront montrées par défaut aux amis. Tous les amis sont ainsi connectés en temps quasi-réel, une fois par jour et savent ce que les autres font. BeReal est bien une antidote à TikTok:
l’utilisateur ne se met pas en scène, ne fait pas du cinéma pour captiver une audience
L’app se focalise sur 2 minutes de la journée, ne cherche pas à capter le temps de l’utilisateur.
Alors que TikTok dévalorise le temps pour mieux le capter, BeReal manifeste la valeur de l’instantané. Il cherche l’impact et apparemment ce contre-positionnement fonctionne ! Pour mieux comprendre, avec un peu d’humour …
Cette recherche de l’impact est une réponse aux tentatives d’emprise des MegaTech qui pourrait faire tâche d’huile. The Verge, blog technologique, a refondu récemment sa page d’accueil comme un réseau social interne: l’équipe de journalistes y partage le meilleur contenu interne et externe dans un fil d’actualité propriétaire, qui élimine tous les tweets à mettre à la poubelle. Nilay Patel, le fondateur, le 13 septembre 2022:
L'objectif de la refonte de The Verge était en fait de redéfinir la relation que nous entretenons avec vous, notre cher public. Il y a six ans, nous avons mis au point un système de conception destiné à voyager en toute confiance d'une plateforme à l'autre, à mesure que les médias se décomposaient en pages d'articles distribuées individuellement par les médias sociaux et les algorithmes de recherche. Ce n'est pas pour rien que nous avions des guillemets rose vif dans les articles et des lignes laser dans nos vidéos : nous voulions être distinctement The Verge, où que nous nous trouvions.
Mais publier sur les plates-formes d'autres personnes n'a qu'une portée limitée. Et plus nous vivions avec cette décision, plus nous étions convaincus que notre propre plateforme devait être un antidote aux flux d'informations algorithmiques, un produit éditorial créé par de vraies personnes avec une intention et une expertise. La page d'accueil de The Verge est la page la plus populaire de Vox Media, et elle devrait être une déclaration sur ce que l'internet peut être à son meilleur.
Nous nous sommes donc assis et avons réfléchi à ce qui était vraiment important pour nous et à la manière de rendre notre page d'accueil intéressante à chaque fois que vous l'ouvrez. Nous avons également réfléchi à nos origines et à la manière dont nous avons fait de The Verge ce qu'il est aujourd'hui. Et nous avons abouti à la conclusion suivante : <mot de Cambronne>, nous devons simplement bloguer davantage.
Nous sommes donc revenus aux fondamentaux avec ce que nous appelons le fil d'actualités Storystream, directement sur notre page d'accueil. Notre objectif est d'apporter le meilleur du blog à l'ancienne à un flux d'informations moderne et de faire en sorte que nos rédacteurs et reporters principaux mettent constamment à jour le site avec le meilleur de l'actualité technologique et scientifique du monde entier.
Et voilà The Verge concurrent de Twitter…avec du contenu moins pléthorique mais choisi par des humains auxquels vous faites confiance, non par une IA.
Niveler les créateurs, les mettre en concurrence ou les copier pour servir une audience captive dans un premier temps peut être extrêmement lucratif. Mais cela incite ces créateurs à s’adapter et trouver des solutions pour se faire valoir. On le voit avec The Verge qui imite le fil d’actualité de Twitter avec un plus que les MegaTech n’ont pas: la concentration du talent. On le voit aussi avec le New York Times qui, après une période de flottement a adopté un modèle d’abonnement en ligne en 2015, réduisant sa dépendance envers les MegaTech. Pour gagner des abonnés, le journal ne compte plus sur les réseaux sociaux, mais sur ses propres forces. Il a acheté en 2022 astucieusement un quiz nommé Wordle. Le jeu consiste à deviner un mot de cinq lettres tous les jours. Il est extrêmement addictif, et fédère une communauté de fidèles partageant leurs résultats sur divers réseaux sociaux (WhatsApp, Twitter, etc.) Wordle est un réseau social s’appuyant sur les réseaux sociaux. Il nivelle les réseaux sociaux, la réponse du berger à la bergère ! Wordle avait 300 000 joueurs début 2022, 3 millions en mai 2022, maintenant des dizaines de millions d’après le CEO du New York Times Meredith Kopit Levien.
La centralisation semble décidément être gouvernée par la troisième loi de Newton: lorsqu'un corps A exerce une force sur un corps B, le corps B exercera une force sur le corps A de même grandeur, mais dans le sens opposé.
Bonne semaine,
Hervé