Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
Au moment où les sociétés technologiques sont à la peine en bourse (c’est un euphémisme), la question mérite d’être posée: l’IA (intelligence artificielle) est-elle un écran de fumée, un artifice marketing utilisé pour justifier des modèles économiques douteux ? Le grand argument des pro IA (voir Ash Fontana dans son nouveau livre The AI-first Company) est que les sociétés à plus de $1 trillion sont toutes des entreprises reposant sur l’IA: Google, Apple, Amazon…Apple avec Siri ?
Considérons Amazon. La société a fait ses preuves. Elle capitalise $1,6 trillion en bourse, est le grand leader du cloud avec plus de $50 milliard de chiffre d’affaires annuel au travers d’AWS, devant Microsoft et Google. Et pourtant son système d’intelligence artificielle est pour le moins archaïque. Amazon ne sait pas reconnaître ce qu’il y a à l’intérieur d’un paquet, il ne retient que ses caractéristiques standard, si bien que le moteur de recherche est plutôt primaire. Il affiche les produits dont le libellé contient le terme recherché, ordonnés en fonction de critères comme le nombre de ventes ou d’avis positifs. Ma recherche sur le mot vaccin a donné ceci:
Si j’étais un anti-vaccin patenté, je pourrais interpréter que leur IA est remarquable, mais tel n’est pas le cas. J’en conclus qu’Amazon sert ce qui se vend le plus avec le mot vaccin dedans. La modération ne semble pas leur fort, encore un signe d’un niveau élémentaire d’IA. Benedict Evans l’analyse ainsi dans son article Amazon sait-il ce qu’il vend ?
Un vieux cliché veut que le commerce électronique dispose d'un nombre infini d'étagères, mais ce n'est pas tout à fait vrai pour Amazon. Il serait plus utile de dire qu'il dispose d'une seule étagère, d'une longueur infinie. Tout ce qu'il vend doit tenir sur la même étagère et être traité de la même manière - il faut que cela corresponde au même modèle de vente au détail et au même modèle logistique. C'est ainsi qu'Amazon peut s'adapter indéfiniment à de nouveaux produits et à de nouvelles catégories de produits - il n'a pas besoin de créer de nouvelles infrastructures et de nouveaux modes de distribution pour vendre de nouvelles choses (et c'est pourquoi l'épicerie, qui nécessite une chaîne logistique entièrement différente, est un tel écart). Au lieu de cela, il transforme les produits en paquets dans un réseau, et tout l'intérêt d'un réseau à commutation de paquets est que vous n'avez pas besoin de savoir quelle est la charge utile. Cela signifie qu'il n'a jamais vraiment eu la moindre idée de ce que sont ces SKU - ce sont des chiffres, une taille et un poids. Il peut dire "les personnes qui ont acheté X ont également acheté Y", mais il ne sait pas vraiment ce que sont X et Y. Et, bien sûr, cela est aggravé par Marketplace - 60% de ce qui est vendu sur Amazon n'est pas vendu par Amazon.
La priorité pour Amazon est la logistique qui exige de simplifier l’embarquement d’un maximum d’objets sur sa plate-forme. Introduire une « vision » sur les produits constituerait une friction nuisible à son modèle économique. Le point important est que malgré cette déficience en intelligence artificielle, Amazon capitalise d’avantage que le roi de l’IA Google. Google sert un contenu cohérent car il ne se contente pas de tirer des corrélations sur les liens, il lit à l’intérieur des textes (d’où les fameux snippets). Malgré cette infériorité en IA, Amazon développe un modèle publicitaire qui taille des croupières aux deux champions de l’étude des donnés (l’autre étant Facebook). Conclusion: il n’est nul besoin d’être un maître de l’IA pour être dans le club du $trillion.
Une autre manière de voir les choses est que le modèle économique d’Amazon, en l’empêchant de voir à l’intérieur des produits, peut constituer à terme un sérieux handicap. Un contre-positionnement audacieux, fondé sur la prévision de ce que les gens vont consommer, grâce à une IA qui voit les produits, pourrait le doubler en vitesse, stocker moins, plus près des consommateurs, anticiper leurs désirs. En étant le magasin à tout vendre aidé par le client qui sait ce qu’il recherche, Amazon peut se contenter d’un niveau minimal d’intelligence artificielle et ne pas remettre en cause son modèle. Pour combien de temps ?
L’expérience TikTok
TikTok a fait une irruption brutale dans le monde des réseaux sociaux bousculant en Chine WeChat et en Occident Facebook et YouTube. L’effet réseau des leaders n’a rien pu faire face à un algorithme d’intelligence artificielle remarquablement conçu. Ce qui tendrait à prouver que l’intelligence artificielle a vraiment une capacité disruptive. Revenons à TikTok. Il n’y a pas de raison de penser qu’il ait découvert un algorithme miracle, qu’il dispose d’une puissance de calcul ou d’une quantité de données supérieure à Facebook, YouTube et WeChat. Sa supériorité repose dans la pertinence des données collectées par rapport à l’objectif poursuivi. Autrement dit, l’algorithme de TikTok est remarquablement entrainé, grâce à une expérience utilisateur spécialement conçue pour l’intelligence artificielle. Eugène Wei dans Seeing like an algorithm:
L'écran entier est rempli d'une seule vidéo. Une seule. Elle est affichée en plein écran, en orientation verticale. Ce n'est pas un flux défilant. Il s'agit d'une pagination, en fait. La vidéo s'affiche automatiquement presque immédiatement (et les vidéos suivantes sont chargées en arrière-plan afin qu'elles puissent elles aussi être lues rapidement lorsque c'est leur tour sur scène).
Cette conception place l'utilisateur devant une question immédiate : que pensez-vous de cette courte vidéo et de cette courte vidéo seulement ?
Tout ce que vous faites à partir du moment où la vidéo commence à être lue est un signal quant à votre sentiment envers cette vidéo. Passez-vous à la vidéo suivante avant même qu'elle ne soit terminée ? C'est un signal implicite (bien qu'à la limite de l'explicite) de désintérêt.
L'avez-vous regardée plus d'une fois, en la laissant tourner en boucle plusieurs fois ? Il semble que quelque chose vous ait plu. Avez-vous partagé la vidéo via le volet de partage intégré ? Un autre indicateur fort du sentiment positif. Si vous appuyez sur l'icône LP en bas à droite et que vous regardez d'autres vidéos avec la même bande sonore, c'est un signal supplémentaire quant à vos goûts. Souvent, le signal musical est synonyme de mème, et TikTok dispose désormais d'un autre axe sur lequel il peut vous recommander des vidéos. Avez-vous consulté la page de profil du créateur de la vidéo ? Avez-vous regardé d'autres de ses vidéos, puis les avez-vous suivies ? En plus d'apprécier la vidéo, peut-être les appréciez-vous en particulier.
Mais revenons encore plus en arrière, avant même que vous ne regardiez la vidéo, et comprenons comment l'algorithme de TikTok "voit" la vidéo elle-même. Avant même que la vidéo ne soit envoyée sur votre téléphone par l'algorithme FYP, un humain de l'équipe opérationnelle de TikTok a déjà regardé la vidéo et ajouté de nombreux tags ou étiquettes pertinents.
La vidéo parle-t-elle de danse ? De la synchronisation labiale ? De jeux vidéo ? D'un chaton ? D'un tamia ? Est-elle comique ? Le sujet est-il un homme ou une femme ? Quel âge, en gros ? S'agit-il d'une vidéo de groupe ? Où se déroule-t-elle ? Quels filtres ou effets visuels sont utilisés ? S'il y a de la nourriture, quelle sorte de nourriture ? Et ainsi de suite. Toutes ces étiquettes deviennent des caractéristiques que l'algorithme peut maintenant voir.
L'IA de vision fait également un passage sur la vidéo et, dans la mesure où elle le peut, contribue à ce qu'elle voit. Certains des filtres de la caméra de TikTok sont conçus pour suivre les visages humains, les mains ou les gestes, de sorte que l'IA de vision est souvent invoquée encore plus tôt, au moment de la création.
L'algorithme peut également voir ce que TikTok sait déjà de vous. Quels types de vidéos avez-vous appréciés par le passé ? Quelles informations démographiques ou psychographiques sont connues à votre sujet ? Où regardez-vous la vidéo ? Quel type d'appareil possédez-vous ? Et ainsi de suite. Au-delà, quels sont les autres utilisateurs qui vous ressemblent ?
Revenons au moment où vous regardez cette vidéo sur votre téléphone dans TikTok. L'algorithme FYP peut maintenant fermer toutes les boucles de rétroaction. Il prend chacune des actions que vous effectuez sur la vidéo et peut deviner ce que vous, avec tous vos goûts, ressentez à propos de cette vidéo, avec tous ses attributs.
Par contraste, le expériences utilisateurs (UI) des réseaux sociaux comme Twitter ou Facebook, mais aussi de la plupart des médias en ligne, sont construites autour du fil d’actualité. L’objectif est de réduire les frictions, aussi l’utilisateur peut passer d’un tweet à l’autre, d’un post à l’autre, d’une vidéo à l’autre, en descendant le fil d’actualité et cliquer quand il le souhaite. L’expérience est très fluide pour l’utilisateur mais donne des signaux faibles pour l’IA. Ce post a -t-il été regardé ? apprécié ? La vidéo postée a-t-elle été taguée, comprise par une IA ? L’algorithme doit interpréter, ce qui augmente sa marge d’erreur et son côté frustrant pour l’utilisateur. L’IA fonctionne comme les intérêts composés: un petit avantage au départ crée une différence énorme au final
. Facebook et coincé dans son modèle économique, tout comme Amazon: la priorité donnée à la réduction des frictions, à l’abondance, à la fluidité de l’expérience utilisateur, nuit à la qualité des données collectées et à la prédiction de l’IA. TikTok procède une vidéo après l’autre, l’utilisateur contrôle moins, mais il a au final moins besoin de contrôler…et il apprécie.
L’intelligence artificielle est disruptive
L’exemple de TikTok montre que l’IA est disruptive, dans la mesure où:
un positionnement IA prioritaire est gênant pour les dominants, il les oblige à sortir de leur modèle économique pour le contrer. Facebook et Twitter peuvent ils renoncer au fil d’actualité sans dommage ?
sa dynamique de progression est nettement supérieure à ce que peuvent réaliser les dominants, en raison de la qualité des données et des feed-back. Au départ, TikTok n’était qu’une application de partage de vidéo courtes musicales mais petit à petit l’application s’est étendue à toutes autres sortes de vidéo pour maintenant se lancer dans le commerce.
Que ce soit de TikTok ou d’un autre, Amazon est également sous la menace d’un modèle économique qui construit son expérience utilisateur sur l’IA. Il est probablement plus difficile cependant d’obtenir des feed-back avec les achats de biens qu’avec des vidéos: l’acheteur mécontent doit renvoyer le paquet, ce qui est plus complexe à gérer qu’un refus de regarder une vidéo. Cela n’a pas découragé Stitch Fix, vendeur d’habillement en ligne, de centrer son modèle sur l’IA. Au premier contact avec ses potentiels clients, Stitch Fix définit leurs profils par un questionnaire, les met en contact avec un de ses 5 800 stylistes, choisi par algorithme, lequel styliste définira une première livraison en s’aidant d’un algorithme. Le client accepte tout ou partie de la livraison et renvoie le reste. Le service est défini au départ en fonction de l’IA avec les feed-back les plus directs possible. Évidemment, les frictions ne sont pas négligeables au départ, surtout si le client doit renvoyer les paquets non satisfaisants. Le coût de l’erreur est élevé ce qui protège pour l’instant le modèle traditionnel d’e-commerce. La société est vue avec suspicion mais avec le temps, son IA va devenir de plus en plus précise et laisser sur place le traditionnel: « les personnes qui ont acheté X ont aussi acheté Y ». Aujourd’hui vendeur de textiles, Stitch Fix a d’autres ambitions et pourrait devenir un vendeur généraliste en ligne centré IA, une menace potentielle pour Amazon.
Le point à retenir: les GAFA (agrégateurs), malgré leur supériorité en hardware, software et big data sont paradoxalement assez mal placés sur l’IA. Leur vision est d’apporter l’abondance en donnant le contrôle à leurs utilisateurs. C’est contradictoire avec une IA efficace, les signaux envoyés par les données étant trop vagues. Or le modèle actuel des agrégateurs a ses limites, celles posées par le paradoxe du choix:
On s'imagine qu'avoir l'embarras du choix est une garantie de liberté individuelle, donc de satisfaction. Analysant ce phénomène moderne, Barry Schwartz dresse ici un constat surprenant : le « trop de choix » se révèle néfaste pour notre bien-être - et, bien sûr, pour notre porte-monnaie.
Ce talon d’Achille pourrait bien être exploité par des entreprises centrées IA, acceptant les frictions comme un investissement pour construire leurs modèles.
Une nouvelle forme de disruption
Si même les GAFA avec leur puissance de calcul et montagnes de données peuvent être menacés par de nouveaux modèles économiques centrés IA, on peut imaginer ce qui pourrait arriver aux autres sociétés moins versées dans les algorithmes. Celles-ci doivent brusquement s’organiser pour parer la menace quel que soit le secteur d’activité. La disruption ne se loge plus seulement dans un matériel innovant (voiture électrique, smartphone) qui en s’améliorant petit à petit crée un avantage énorme par rapport à ce qui existait avant, gagne en échelle et domine son secteur. Elle atteint toute l’économie et repose sur la précision des prédictions. Celui qui construit la plus belle machine à prédire, celle qui apprend le plus vite, a toujours un coup d’avance. La différenciation est battue par la prédiction. Il faut voir l’IA comme un concentré d’expérience: l’IA a joué toutes les parties d’échec depuis la nuit des temps, a parcouru toutes les routes, connaît tous les mouvements de marché. L’algorithme bien entraîné n’a rien à voir avec le futur, il recèle 200 ans, voire 2000 d’histoire et d’expérience, c’est à dire beaucoup plus qu’un homme pourrait enmagasiner. Il peut avoir de plus ses propres perspectives grâce à des sens que ne possède pas l’homme (senseurs). Quand seule l’expérience suffît pour obtenir un degré élevé de précision dans ses prédictions, l’IA est imbattable par l’homme-trop d’experience-. Pour ce faire, son champ d’actions doit être le plus limité possible, afin d’éviter les surprises. L’IA a une capacité d’apprentissage exponentielle pourvu que les données envoient de l’information, c’est à dire un signal clair par rapport à l’objectif poursuivi. C’est ainsi que je peux définir l’âge de l’algorithme IA, son expérience cumulée, dictant la précision de la prédiction :
Toute entreprise doit maintenant se demander:
si une partie vitale de son business ne peut pas être remplacée ou fortement augmentée par une IA.
comment alors construire son offre de manière à donner la priorité à l’accumulation de données utiles.
Le risque est désormais qu’un concurrent fasse cette analyse avant et domine par la qualité de sa prédiction (n’oublions pas la fonction d’apprentissage exponentielle). Si on répond oui à la première question, les conséquences stratégique sont importantes: l’ingénieur IA doit être au coeur des grandes décisions, dans le comité de direction. Les GAFA sont concernés: compte tenu de la densité de leur offre, ils peuvent être attaqués de toute part. Ils n’ont jusqu’à présent pas conçu leur offre en fonction de l’IA (objectif simple, clarté du signal) mais en fonction des frictions (abondance, facilité d’accès). La différence est subtile mais explique le succès de TikTok par rapport à Facebook. Un ingénieur IA a t-il été impliqué et aux commandes lors de la mise en place du fil d’actualité qui est devenu la norme ? Rien n’est moins sûr; L’IA est considérée comme un sous-produit de l’abondance. La mise en avant de Siri et Alexa par Apple et Amazon est également un signe que l’IA reste pour ces groupes marginale. L’intelligence artificielle y est beaucoup trop générale, les signaux peu clairs (le feed-back oral de l’utilisateur est quasi-inexistant). Alexa et Siri ne sont pas des armes de combat, tout au mieux des stratagèmes marketing pour pousser à la consommation de musique payante.
Un domaine où l’intelligence artificielle pourrait faire la différence est le streaming vidéo. La spécificité y est que chaque programme est une donnée coûteuse à produire, à l’inverse des vidéo TikTok. Tout converge donc aujourd’hui pour une course à l’échelle: la réduction du coût des programmes par abonné et la mise en place d’une IA performante. La consolidation du secteur va continuer à un bon train. Après le rachat de Fox par Disney, celui de Sky par Comcast, on a maintenant la fusion de Warner Media et Discovery. Tous les acteurs mettent en avant leur application de streaming pour collecter les données (Disney +, Discovery +, Peacock...); cela ne suffira pas à construire une IA performante. Pour l’instant , la stratégie repose toujours sur la mise à disposition d’une offre la plus abondante possible qu’on trie par un moteur de recherche ou fil d’actualité. Les applications ne sont pas réellement structurées pour l’IA, on est encore dans l’internet version 1, ainsi présentée par Katrina Lake, fondatrice de Stitch Fix:
Eric Colson qui était Chief Algorithmic Officer chez Netflix a rejoint Stitch Fix en 2012 car il était fasciné par son algorithme de recommandation. D’après Katrina Lake:
Il était fasciné par ça, parce que chez Netflix, il disait : "J'ai toujours rêvé d'un moment où vous allumeriez votre télé et où Netflix commencerait à fonctionner. Nous saurions déjà ce que vous voulez voir et nous le diffuserions déjà." Et il était comme, "C'est un peu ce que vous faites." Donc, il était juste fasciné par cette idée. Maintenant, nous avons l'achat direct où les gens choisissent, mais pendant les huit premières années de l'entreprise, 100% de ce que nous avons vendu était par recommandation. Nous ne connaissons pas d'autres entreprises qui sont aussi fortement axées sur la recommandation. LinkedIn a un pourcentage élevé de connexions qui sont par recommandation. Netflix et Amazon, tous deux, je pense qu'une minorité de choses que les gens achètent sont par recommandation, et chez Stitch Fix, 100% de ce que vous achetiez était par recommandation.
Les principales sociétés de streaming (Disney, Comcast, Warner, Netflix) ont les données. Il leur fut maintenant trouver les données utiles, celles qui donnent un signal et cela demande un changement de paradigme par rapport à l’internet version 1. Qui saura remettre en question son modèle économique au plus vite ? La question est encore ouverte.
Le pouvoir disruptif de l’intelligence artificielle dépasse largement l’e-commerce et la recommandation. Toutes les entreprises dont l’activité répond au 1. vu plus haut sont menacées. Prenons le design de puces par exemple. Pendant longtemps l’enjeu a été de miniaturiser les transistors pour en embarquer le maximum au cm2. Désormais, on fabrique des systèmes sur la puce comprenant de nombreux éléments différents (CPU, GPU, mémoires…). L’art du design est celui de la combinatoire. L’intelligence artificielle pourrait être amenée à jouer un rôle central pour concevoir le mix idéal en fonction de l’objectif souhaité (usage/consommation d’énergie/puissance). Jim Keller ne serait plus alors le must have d’une société concevant des puces !
Le dernier exemple que je voudrais explorer est celui des voitures sans chauffeur. Pendant un temps, on a mis beaucoup d’espoir dans Waymo et les autres (Cruise par exemple). Puis les valorisations sont retombées sur terre (de $200 milliards à $30 milliards en moins de deux ans pour Waymo) en même temps que l’espoir de faire circuler ces voitures en conditions normales. On peut se demander si l’approche des constructeurs n’est pas trop anthropomorphique, centrée sur l’homme plutôt que sur les possibilités de l’IA. En effet les censeurs imaginés sur la voiture sont un prolongement de l’œil humain. Or l’IA peut emmagasiner une expérience bien supérieure en disposant des censeurs également sur les routes de manière à donner d’autres perspectives, notamment celles du piéton. Une approche centrée IA changerait la donne, augmentant considérablement l’expérience IA et peut être cette fois pourrait-on imaginer une voiture sans chauffeur sur les routes. Cette approche commence à faire son chemin, notamment en Chine où on construit encore des routes.
Bonne fin de semaine,
Hervé