ChatGPT et la super App
Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
le 06/12/2022:
Il y a deux groupes dominants qui peuvent aujourd’hui se permettre de fabriquer des apps spécialisées: Apple et Google. Les autres doivent se soumettre ou viser la super app. Avant Microsoft, Snap et Twitter (Elon Musk) ont évoqué cette année la possibilité d’en créer une. Explications:
Découverte: domination du duopole
Naviguer sur un smartphone exige de trouver l’information souhaitée rapidement. Pour accéder à une information, il y a deux méthodes: faire une demande dans la barre de recherche du smartphone ou cliquer sur une app. Dans le premier cas, il faut passer par Google (pour accéder au web), dans le deuxième cas, il faut passer par le magasin d’applications et l’OS du smartphone, en pratique par Apple ou Google (IOS ou Android). Ce sont eux qui définissent les règles du monde des apps et comment on les découvre. En mobilité tout particulièrement il faut aller très vite pour trouver la bonne information d’où l’importance de la fonction découverte: le clic est fastidieux, il faut l’économiser; Apple et Google rendent ce service précieux, grassement rémunéré, et ne souhaitent pas l’arrivée d’un tiers concurrent. Leur intérêt même est la multiplication des apps pour valoriser leur service de découverte. A cette aune, on comprend mieux la réforme IOS 14.5 sur la « transparence du suivi entre applications ». Le mot transparence cache souvent des vérités moins louables. En l’occurrence c’est très simple: Apple a pris ombrage de la puissance de l’app Facebook qui assurait la fonction découverte pour de nombreuses apps tierces, notamment de jeux grâce au partage de données: ce partage permettait à Facebook de tracer un utilisateur qui cliquait sur une publicité, se trouvait alors sur une application tierce et achetait ou se comportait de telle ou telle manière dans l’app tierce. Facebook était au courant. Dès lors, le portrait de l’utilisateur était facile à faire, et Facebook savait à quelle publicité cet utilisateur serait sensible. Facebook devenait rival de l’App Store pour la découverte des apps grâce à son usine à données extrêmement précise. Apple, sous couvert de transparence, oblige maintenant (depuis IOS 14.5) l’utilisateur d’une app à donner son autorisation pour le partage de données. La question est posée de telle manière que l’utilisateur réponde non, coupant ainsi tout lien de suivi entre apps. L’union faisait la force des apps, la séparation fait la force d’Apple. Le même raisonnement est applicable à Android et Google, lequel a annoncé sa propre version de la “transparence” en mars 2022.
Apple et Google ont été clairs: pas de troisième larron. Cela ne fait pas l’affaire ni de prétendants au trône comme Microsoft ou Meta par exemple, ni l’affaire d’apps plus modestes qui pâtissent de la position de force du duopole et doivent payer leur écho pour subsister.
L’exemple chinois
L’inspiration peut venir de Chine. J’ai demandé à ChatGPT de me décrire WeChat (Weixin en Chine)
WeChat/Weixin est l’application la plus utilisée en Chine et opère comme un véritable système d’exploitation à l’intérieur d’IOS ou Android. Par la messagerie, qui est la porte d’entrée (1,3 milliards d’utilisateurs dans le monde), on peut accéder à des jeux, de la musique, des actualités, des services vidéo, des livres, des paiements, un cloud, un navigateur internet…et enfin des apps, appelées mini programmes. La plate-forme de mini programmes connecte plusieurs millions de mini programmes à 600 millions d’utilisateurs quotidiens. Comme WeChat ne prélève rien sur les transactions effectuées dans ses mini programmes, Apple n’a droit à rien non plus, ce qui améliore la popularité de ces derniers auprès des développeurs. WeChat se rémunère en particulier sur le service de découverte, en mettant en avant tel ou tel service, tel ou tel mini programme. Il a donc réussi la prouesse de concurrencer Apple sur cette fonction essentielle qu’est la découverte. Il est important d’analyser le contexte de cette réussite afin de considérer si et comment une super App pourrait aussi s’imposer en occident:
Le concepteur de WeChat, Allen Zhang, souvent comparé à Steve Jobs, a l’art de créer des design minimalistes tranchant avec la luxuriance des réalisations habituelles chinoises. Il a fait mouche à chaque fois, d’abord avec un serveur mail qu’il crée en 1997, appelé Foxmail. Tencent acquiert Foxmail en 2005, Allen Zhang est vite repéré par Pony Ma qui le nomme responsable d’un produit stratégique : QQ Mail. Il le transforme et en fait le service mail le plus populaire de Chine. Hotmail notamment est battu, mais également toutes les alternatives chinoises. Il comprend alors parfaitement comment l’iPhone peut signer le déclin des services mail au profit de la messagerie instantanée et imagine WeChat en 2010, une application spécialement conçue pour les smartphones. WeChat utilise l’important graphe social de QQ et s’impose vite comme la principale messagerie instantanée grâce à des innovations et intégration avec des services toujours plus nombreux. La concurrence reste coite.
WeChat est certes une application de messagerie réussie mais a bénéficié largement de l’absence de concurrents occidentaux justement: Facebook/Instagram/Messenger/WhatsApp sont interdits en Chine. De plus l’iPhone est trop marginal en Chine (20 % de parts de marché environ) pour qu’i-Messages représente une menace sérieuse.
La culture chinoise est marquée par l’esprit de groupe, à l’inverse de la culture individualiste occidentale. Il est donc naturel qu’un réseau social soit un lieu de découverte (souvent collective), de jeux, de commerce, etc…donc une super App.
WeChat a pu devenir une place de découverte et donc une super App parce que le duopole Google/Apple n’existe pas en Chine: Google n’y est pas (Baidu est une pâle imitation) et Apple n’a que 20 % de parts de marché. L’environnement chinois est propice pour que des alternatives crédibles se développent sur la fonction découverte. WeChat en est une, Douyin (la version chinoise de TikTok) en est une autre. Douyin, créé en 2016, avec maintenant plus de 600 millions d’utilisateurs, a déjà acquis le statut de super App et rivalise avec WeChat.
Le contexte concurrentiel occidental est beaucoup moins propice au développement d’une super App. Pourtant la fonction découverte suscite des convoitises, et ce d’autant qu’Apple et Google abusent de leur pouvoir. Les challengers cherchent un angle d’attaque. Les procès sont un moyen qui en général ne fonctionne pas, l’innovation au contraire peut être redoutable. Ainsi, Microsoft n’a pas été atteint par son procès pour abus de position dominante de 1997 (Microsoft contre Netscape), mais par l’émergence de Google qui a défoncé MSN Search et marginalisé Windows. On peut se demander aujourd’hui si l’IA générative, une véritable innovation, ne va pas être prétexte à essayer de renverser le duopole…
L’alliance OpenAI/Microsoft
D’après Wikipedia:
En 2019, OpenAI est passée du statut de société à but non lucratif à celui de société à but lucratif "plafonnée", le plafond des bénéfices étant fixé à 100X sur tout investissement. L'entreprise a distribué des actions à ses employés et s'est associée à Microsoft Corporation, qui a annoncé une enveloppe d'investissement d'un milliard de dollars américains dans l'entreprise. OpenAI a ensuite annoncé son intention de commercialiser ses technologies sous licence, Microsoft étant son partenaire privilégié.
OpenAI crée des modèles d’intelligence artificielle transformant du texte (prompt) en texte, image ou vidéo. Le modèles de base aujourd’hui est GPT-3 (Generative Pre-trained Transformer) entrainé sur 175 milliards de paramètres. Il succède à GPT-2 entrainé sur 1,5 milliards de paramètres. C’est sur ce programme que sont conçus des produits d’IA spécifique comme Dall-E (texte à images) ou ChatGPT (bot de conversation). GPT-3 est une usine à produits d’intelligence artificielle spécifiques calibrés pour tel ou tel rendu. Pour en savoir plus, lire mon article sur l’IA générative. ChatGPT, le dernier né, a été ouvert au public gratuitement et rencontre un franc succès, ayant atteint 1 million d’utilisateurs en cinq jours, un record. Le principe est simple: vous faites une demande à ChatGPT, il vous répond sur le champ avec des phrases bien construites et un argumentaire, le cas échéant. A première vue, cela ressemble à Google dans la mesure où l’on fait une demande écrite dans un petit cadre. La différence est qu’on a la réponse directement rédigée en bon français au lieu de liens vers différents sites internet traitant du sujet. Prenons un exemple:
La réponse de ChatGPT est simple et directe. D’où la réaction primaire que l’on retrouve à de nombreuses reprises sur Twitter:
La réponse de ChatGPT est parfois bluffante, mais souvent complètement à côté de la plaque ou fausse. On dit que le bot hallucine.
Exemple de réponse intéressante:
Exemple d’hallucination:
La fiabilité par conséquent laisse à désirer, ce qui n’empêche pas le bot d’être sûr de lui. Cependant l’utilisateur apprend petit à petit sur quel type de questions ChatGPT est fiable et comment l’exploiter au mieux. Le système est conversationnel, donc on peut progresser avec lui, croiser les informations, jusqu’à trouver une réponse satisfaisante, voire très pertinente.
Évidemment si les réponses étaient sûres à 100%, on imagine que Google serait vite obsolète. Mais avec une chance sur deux de se tromper, et de manière péremptoire, ChatGPT risque vite d’être oublié…à moins que la prochaine génération fondée sur GPT-4, lui même entraîné sur 100 trillions de paramètres (x571), n’améliore considérablement sa fiabilité. On peut imaginer que c’est le pari de Microsoft, dont le moteur de recherche Bing avec 3% de part de marché n’est pas un rival pour Google. En revanche, un ChatGPT-2, pourrait être un point d’entrée très original pour une super App Microsoft. Il guiderait l’utilisateur à partir d’une simple question sur toute sorte de réponses intellectuelle, pratique, commerciale, etc. The Information, le 6 décembre 2022:
Microsoft a récemment envisagé de créer une "super application" qui pourrait combiner le shopping, la messagerie, la recherche sur Internet, les flux d'informations et d'autres services dans une seule et même application pour smartphone, dans ce qui serait une démarche ambitieuse du géant des logiciels pour se développer davantage dans les services aux consommateurs, selon des personnes ayant une connaissance directe des discussions. Les dirigeants de Microsoft souhaitent que l'application stimule l'activité publicitaire de la société, qui pèse plusieurs milliards de dollars, ainsi que la recherche Bing, et qu'elle attire davantage d'utilisateurs vers la messagerie Teams et d'autres services mobiles.
Contrairement à Apple et Google, Microsoft n'exploite pas de magasin d'applications mobiles pour les utilisateurs de smartphones. En créant une application tout-en-un que les utilisateurs n'ont pas besoin de quitter pour accéder à ses autres offres, Microsoft espère imiter une stratégie mobile qui a fonctionné pour Tencent. L'application WeChat de la société chinoise, qui combine la messagerie avec le shopping, les jeux en ligne, l'actualité et une variété de services, y compris la commande de produits alimentaires, est une source d'inspiration pour les cadres supérieurs de Microsoft, selon les personnes interrogées.
Google et le dilemme de l’innovateur
Si la menace Microsoft (via ChatGPT) se présente ainsi, que fait Google ? N’est-il pas victime du dilemme de l’innovateur, concept phare développé par le professeur de Harvard Clayton Christensen ?
Aujourd’hui Google a deux bonnes raisons de conserver son moteur de recherche tel qu’il existe:
Le coût d’une requête est infinitésimal. Chaque jour Google reçoit plusieurs milliards de requêtes, soit probablement plusieurs trillions par an. Pour la simplicité de l’argument mettons 3 trillions. Sur la base de $ 20 milliards de coûts, le coût par requête serait inférieur à 1 cent. Sam Altman dans un tweet a expliqué que le coût de chaque requête ChatGPT était de plusieurs cents. Aussi Google ne peut pas se permettre d’intégrer un équivalent de ChatGPT à chaque requête, ses bénéfices fondraient comme neige au soleil…
Le modèle économique de Google repose sur des liens publicitaires superposés aux résultats des requêtes. La publicité y est presque invisible, confondue avec les autres liens. Si le moteur de recherche ne donne qu’une seule réponse, comme ChatGPT, le modèle publicitaire si juteux de Google sera à repenser complètement, avec un aléa considérable.
Google a donc tout intérêt à court terme (pour plaire à Wall Street) à s’abriter derrière le manque de fiabilité de l’IA générative pour conserver son modèle. Celui-ci, s’il ne donne pas toujours la bonne réponse, au moins cite ses sources, comme le veut toute approche scientifique digne de ce nom. Cela expliquerait pourquoi Google qui a développé son propre bot LaMDA, apparemment au moins aussi puissant que ChatGPT, reste pour l’instant muet, face à l’offensive d’OpenAI/Microsoft. Il y a une autre explication, moins évidente à première vue.
Pourquoi Google reste muet
Il y a une petite nuance dans le dilemme de l’innovateur dont Chat GPT ne parle pas quand on lui pose la question. La société victime du dilemme de l’innovateur s’enferme progressivement sur un noyau de clientèle de plus en plus haut de gamme, avec n produit plus cher, n’acceptant pas les défauts de l’alternative. L’alternative peu à peu s’améliore, grignotant sur la clientèle haut de gamme jusqu’à la capter intégralement. Or ici, on a l’inverse: Google est gratuit alors que ChatGPT doit adopter un modèle payant (plus haut de gamme). Google a une approche scientifique fiable qui fait que les requêtes sont faciles à déterminer. Chat GPT a des hallucinations crédibles qui nécessitent un bon QI pour les éliminer et trouver la substantifique moelle de l’information grâce à des prompts habiles. Si ChatGPT avait été là avant Google, ce dernier serait le disrupteur !
Enfin la théorie de Clayton Christensen n’est pas une science exacte. Elle n’a pas fonctionné pour Apple qui a résisté à Android, contrairement à ce que la théorie aurait pu affirmer. Si Android a pris les parts de marché, Apple a pris les profits et cela dure depuis 2008 ! Plus même, l’iPhone gagne des parts de marché sur Android aux Etats-Unis avec plus de 50% en 2022. Pourquoi ? Parce que pour un smartphone, l’important est l’expérience utilisateur qui dépend de l’intégration des différentes parties plus que de la performance d’un seul élément (batterie, puce, système d’exploitation, etc.). Apple est maitre en intégration et donc quasiment imbattable. Un bon produit trompe le dilemme de l’innovateur.
On peut étendre la réflexion à Google. Pourquoi Google domine t-il le marché des moteurs de recherche ? Tout simplement parce qu’il donne une information de type scientifique (avec les sources) et ceci sans délai. Cela permet de progresser rapidement vers une information pertinente. ChatGPT est un causeur de salon brillant, impressionnant l’interlocuteur sans pour autant que ce dernier sache à la fin si le bot l’a induit en erreur. ChatGPT-2, entraîné sur 100 trillions de paramètres sera encore plus brillant, ce qui rendra encore moins détectable les erreurs.
La stratégie de Google
Le problème de ChatGPT est qu’il donne l’impression d’être une IA générale, alors qu’il n’en est pas une et ne le sera peut-être jamais. ChatGPT n’a pas de conscience et est incapable de réfléchir. Il faut apprendre à lui poser les bonnes questions sur ces points forts (oubliez les équations), là où il a été entraîné. Le produit est bon quand on sait demander, ce qui nécessite une expertise. ChatGPT risque d’être un assez mauvais point d’entrée pour une super App, du fait de ses erreurs frustrantes qu’il ne corrigera pas. Seuls les gens entraînés arriveront à en tirer le meilleur. Le coût d’entrée est trop important pour une super App, Microsoft risque d’en faire les frais. Google en revanche n’a pas besoin de super App puisqu’il est le point d’entrée. Alors pourquoi pas réaliser des produits d’intelligence artificielle spécialisés pour des spécialistes ? Ces IA joueront le rôle d’experts, imparfaits au départ mais pas chers et en constante amélioration. Métier par métier, il pourront faire subir le dilemme de l’innovateur aux experts reconnus. Google n’a pas besoin de changer sa stratégie mais juste d’ajouter à sa panoplie d’applications de nouvelles apps d’IA générative par domaine. Elles seront plus bluffantes qu’un simulacre d’IA générale…et moins risquées.
C’est dans cet esprit que DeepMind (Google) s’intéresse au code avec AlphaCode. C’est aussi dans cet esprit qu’il lance Dramaton pour les scénaristes
Mon intuition est que plus l’IA est spécialisée, plus le taux de réussite des requêtes sera important et donc moins il faudra être expert en prompts pour la faire fonctionner…et donc plus le pouvoir disruptif sera important vis à vis d’experts. Google veut faciliter la vie des gens, pas la compliquer.
La super App occidentale n’est pour demain. Tencent et Douyin ont pu bénéficier d’un contexte exceptionnel non reproductible. ChatGPT fait prendre conscience du potentiel énorme de l’IA générative, mais pointe peut être dans la mauvaise direction, celle de l’IA générale. N’oublions pas la devise d’OpenAI:
OpenAI est une société de recherche et de déploiement de l'IA. Notre mission est de faire en sorte que l'intelligence artificielle générale profite à l'ensemble de l'humanité.
Quand ?
Bonne semaine et joyeuse fête de Noël,
Hervé