Web zéro ou web poubelle ?
Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
L’épouvantail web zéro
La disparition potentielle du web est un thème récurrent depuis les années 2000. La crainte est que cet édifice démocratique précieux mais fragile, reposant sur une décentralisation anarchique, soit privatisé par quelque intervenant puissant cherchant à l’exploiter à son profit. Le web déchaine la concurrence: chacun peut se faire entendre aux confins du globe…à condition d’avoir le bon discours. Chacun peut trouver ce qui l’intéresse vraiment…C’est une incitation puissante à la créativité. Tout le monde peut théoriquement gagner le gros lot même si dans les faits, le principe de Pareto s’applique à la puissance 10.
Parallèlement, prélever un préciput sur cette créativité à l’échelle gratuite est une tentation permanente du secteur privé. Le web a cependant tenu bon jusqu’à présent.
Dès 1997, le magasine Wired se distinguait:
Au cours des années 2000, le sujet était la neutralité du net. Le terme avait été inventé par Tim Wu, professeur de droit, en 2003. À l’époque, il s’agissait d’empêcher les fournisseurs d’accès (sociétés de télécommunications principalement) de privilégier certains sites par rapport à d’autres sur la bande passante. Les juristes s’appuyaient sur le Telecommunication Act de 1996. Le diable est dans les détails: faut-il raisonner par bit ou par site ? Dans le cas de YouTube par exemple, l’une ou l’autre option ont des conséquences importantes: le site canalise une bonne part de la bande passante. Il s’est rapidement avéré que le principe était sain mais ingérable en pratique. Les sites à gros volumes ont trouvé des techniques pour transférer rapidement leurs données jusqu’à l’ordinateur du consommateur (caches, réseaux privés…). Pourtant l’Internet a survécu, même si la neutralité du net est restée un vœux pieu.
En 2010, on prédit la fin du web. Un célèbre article de Wired la proclame:
Cette fois, l’iPhone et ses applications sont censées remplacer les sites internet. D’après Wired (2010):
Au cours des dernières années, l'un des changements les plus importants dans le monde numérique a été le passage d'un Web largement ouvert à des plates-formes semi-fermées qui utilisent l'Internet pour le transport, mais pas le navigateur pour l'affichage. Cette évolution est principalement due à l'essor du modèle iPhone de l'informatique mobile, et c'est un monde que Google ne peut pas explorer, un monde où le langage HTML n'est pas roi. C'est le monde que les consommateurs choisissent de plus en plus, non pas parce qu'ils rejettent l'idée du web, mais parce que ces plates-formes dédiées fonctionnent souvent mieux ou s'intègrent mieux dans leur vie (l'écran vient à eux, ils n'ont pas besoin d'aller à l'écran).
Les menaces n’ont jamais cessé:
Depuis 2016, Google est censé avoir tué le web avec ses snippets (petite insertion donnant la réponse à une requête directement et reléguant les liens en second plan).
La suppression des cookies (d’abord Safari, ensuite Chrome) est supposée avoir un effet dévastateur sur la monétisation des sites, donc sur l’écosystème web.
Que dire de la pratique de SEO visant à se faire bien référencer dans Google avant de construire un site de qualité ? Elle aurait pu également détruire la qualité du web.
Le web n’est pas mort loin de là. On compte plus d’un milliard de sites internet dans le monde dont 10% actifs. 7 millions d’articles de blogs sont publiés tous les jours. WordPress, Shopify et Wix sont en plein essor. Google et Meta, qui gagnent leur vie en connectant leurs utilisateurs à des sites web engrangent des recettes publicitaires toujours plus importantes ($48 milliards pour Google search et $40 milliards pour Meta au quatrième trimestre 2023). C’est un signe fort que l’engagement sur les sites ne fait que croître. Enfin le nombre d’internautes ne cesse d’augmenter. D’après Statista:
Le web n’est pas mort pour une simple raison d’offre et de demande:
Offre: la possibilité de toucher un public intéressé par sa création dans le monde entier est une forte motivation à lancer un site internet même si le succès est loin d’être garanti. Dans le lot des créateurs, il y aura les meilleurs qui ne veulent pas payer une forte redevance à une Big Tech (30% pour l’Apple Store, environ 30% aussi pour les services d’Amazon, etc.). Même s’ils ne représentent que 1 % de l’offre, c’est suffisant pour attirer la demande selon le même principe que le loto.
Demande: plus de 5 milliards d’internautes utilisant Chrome, Safari, Firefox, Edge, etc. curieux de ce qui se fait dans le monde et pouvant trouver exactement ce qui les intéresse sur le web, snippet ou pas snippet….
Du web zéro au web poubelle…
L’intelligence artificielle pourrait-elle cette fois constituer une réelle menace ?
Offre: la facilité de créer des sites synthétiques par l’IA générative et/ou de déverser sur internet un contenu artificiel pourrait diluer le contenu “humain” et ruiner la qualité de l’offre. Il pourrait s’agir d’une submersion plus qu’une dilution, le contenu pouvant être créé à grande échelle. Le web deviendrait de plus en plus médiocre alimenté par les hallucinations. Les modèles étant entraînés sur le web deviendraient eux-même plus stupides, alimentant la dégradation de l’offre.
Demande: les internautes pourraient se contenter d’une réponse argumentée par ChatGPT plutôt que des liens sur des sites web. La facilité l’emportant, les liens seraient de moins en moins sollicités par les internautes.
Dans les deux cas, la menace perçue est celle de la paresse. Il y a là une question fondamentale: l’informatique rend-elle le monde plus paresseux ou plus productif ?
Offre
On peut constater d’ores et déjà un dynamisme fort sur la création de sites internet synthétiques. Voice of America, le 21 février 2024:
La multiplication des sites web conçus pour ressembler à des sites d'information, mais qui diffusent des informations de mauvaise qualité ou fausses, pourrait nuire davantage à la confiance des médias, selon certains experts.
L'organisme de surveillance des médias NewsGuard a constaté une augmentation du nombre de sites web contenant ce qu'il appelle du contenu généré par l'intelligence artificielle.
"Il s'agit de sites web qui utilisent l'intelligence artificielle pour générer parfois du contenu en masse, qui n'apparaît pas comme du contenu et qui ne semble pas faire l'objet d'une supervision éditoriale humaine", a déclaré Jack Brewster, rédacteur en chef de NewsGuard pour les entreprises. "Ils se font passer pour des sites d'information et servent d'appât à clics pour la publicité.
NewsGuard définit ces sites comme des sites d'information non fiables générés par l'IA, ou UAINS.
Lorsqu'elle a commencé à les identifier en mai 2023, elle en a trouvé 49. En février 2024, son AI Tracker en recensait plus de 700.
Les chiffres corroborent cet article:
Source: Originality.AI
La motivation peut être l’appât du gain: dans le cas des sites d’information, fabriquer un contenu synthétique imitant l’humain, bien référencé sur Google et se rémunérer grâce à la publicité, tout ceci à l’échelle. C’est une forme d’arbitrage classique, qui passe avec l’intelligence artificielle du statut artisanal à industriel. L’utilisation de l’IA peut être beaucoup plus nocive. Dans un rapport de 2023, Interpol met en garde contre la propagation des “deepfakes” et dresse une liste des utilisations dangereuses:
harceler ou humilier des individus en ligne ;
perpétrer des extorsions et des fraudes ;
faciliter la fraude documentaire ;
falsifier des identités en ligne et tromper les mécanismes de « connaissance du client » ;
pornographie non consensuelle ;
exploitation sexuelle d'enfants en ligne ;
falsifier ou manipuler des preuves électroniques pour les enquêtes de justice pénale ;
perturber les marchés financiers ;
distribuer de la désinformation et manipuler l'opinion publique ;
soutenir les récits de groupes extrémistes ou terroristes ;
attiser les troubles sociaux et la polarisation politique.
Il insiste particulièrement sur le déploiement en masse de pratiques dangereuses dans le cadre d’une offre de “deepfake as a service” disponible sur des places de marché.
Cependant, malgré cette masse de propos et sites synthétiques se déversant sur internet (90 % du total, 99 % du total d’ici quelques années…?), Il restera toujours une offre de qualité en quête d’un public dans le monde entier souhaitant payer au minimum les intermédiaires et voulant présenter leur création à sa façon. Plus la création est de qualité, plus elle aura tendance à vouloir coller parfaitement à son public sans format standard ou avec un format standard invisible. La différence par rapport au monde antérieur est qu’au lieu de représenter peut-être 1 % de l’offre, elle en représentera 0,1% ou 0,01 %. Cependant, Il faut voir le verre à moitié plein plutôt qu’à moitié vide: avec l’IA générative, les barrières à la création d’un site vont tomber, encourageant la créativité parmi ceux qui n’avaient jamais eu les connaissances pour construire un site. L’IA générative peut être utilisée comme un outil plutôt qu’en substitut de la production humaine. On note dès 2024, un dynamisme sur la création de sites grâce aux outils d’intelligence artificielle. En témoigne Wix, une société qui fournit les briques pour construire son propre site:
Ce trimestre, nous avons notamment lancé le très attendu AI Website Builder. Il s'agit de notre produit phare en matière d'IA. Il tire parti de notre expertise de plus de 10 ans en matière de création de sites web et de nos connaissances inégalées basées sur le comportement des utilisateurs par le biais d'une expérience de chat conventionnel et conversationnel de l'IA. Les utilisateurs décrivent leurs intentions et la technologie Growth AI crée alors un site web professionnel, unique et entièrement construit qui répond aux besoins de l'utilisateur.
Il est important de noter que le site généré par l'IA comprend toutes les pages pertinentes avec des thèmes de mise en page personnalisés, du texte, des images et des solutions commerciales telles que la planification, le commerce électronique et bien plus encore. Mieux encore, ce site est entièrement optimisé grâce à l'infrastructure fiable de Wix, y compris la sécurité et la performance, ainsi que les outils intégrés de marketing, de référencement, de gestion de la relation client et d'analyse. Il n'y a vraiment rien de tel sur le marché. Les réactions à l'AI Website Builder ont été incroyables. Quelques mois à peine après son lancement, des centaines de milliers de sites ont déjà été créés à l'aide de cet outil, tant par des auto-créateurs que par des partenaires.
Wix a vu sa croissance s’accélérer au premier trimestre 2024 par rapport à un quatrième trimestre 2023 en décélération. D’après la société, le momentum devrait continuer dans les trimestres à venir poussé par les outils d’IA générative. Ces sites seront-ils consultés ?
Demande
Une bifurcation s’opère entre les « disrupteurs » (OpenAI, Perplexity) et les dominants (Meta, Google, Microsoft). Les premiers considèrent que l’IA peut remplacer l’homme, les seconds que l’IA est un outil pour accélérer leur développement. C’est logique: les BigTech ont créé des plateformes mettant en relation des hommes (développeurs/utilisateurs, communautés, etc). Elles cherchent donc à approfondir ces interactions pour maximiser leur effet réseau. Les nouveaux partent de rien, seront toujours copiés par les dominants et défaits s’ils essaient de créer un effet réseau et préfèrent se positionner à l’inverse des BigTech pour les empêcher de les contrer. En voici deux illustrations :
OpenAI lance ChatGPT 4-o en mai 2024 pour remplacer ChatGPT-4. La principale innovation est que le bot peut s’engager dans une discussion comme s’il était un homme ou une femme. Il simule l’émotion et l’empathie. Il ne s’agit plus seulement de répondre à des questions mais d’y répondre par l’IA comme un interlocuteur en chair et en os le ferait…la vitesse de réaction remplace la précision de la réponse à modèle constant.
Perplexity a d’abord proposé un moteur de recherche qui ne cherche pas à mettre en relation avec des sites web mais à répondre à des questions par l’ia générative (les sources étant juste mentionnées mais pas mises en avant). L’IA remplace la réponse humaine avec vérification possible. Puis en mars 2024 il crée un podcast quotidien (Discover Daily) entièrement animé par intelligence artificielle, les voix étant fournies par Eleven Labs.
Les BigTech ont des stratégies radicalement différentes:
Meta met à disposition gratuitement son modèle Llama afin qu’un maximum de produits innovants puissent être créés et partagés sur les réseaux sociaux. Pour Mark Zuckerberg, faciliter l’accès à la technologie entraînera un engagement plus fort entre les hommes qu’il espère bien capter sur Facebook, Instagram ou WhatsApp.
Microsoft veut jouer le rôle d’une plateforme qui met en face des développeurs et des utilisateurs. Il l’a fait avec Windows dans les années 90, à cherché à le faire avec Teams depuis le Covid et maintenant avec Copilot: Copilot dans le cloud, Copilot sur le PC (intégré à Windows). Le rêve de Microsoft est qu’après avoir montré l’exemple avec Github Copilot, il soit suivi par les développeurs qui inventent de nouvelles applications Copilot. L’idée de Copilot est que l’homme reste toujours au centre pour piloter.
Google, comme Meta, est bien conscient que les recettes publicitaires dépendent de l’engagement, lequel est lié aux interactions humaines (directes et indirectes). Il n’est donc pas question pour lui de remplacer les liens par une réponse directe fournie par l’IA mais plutôt de présenter une réponse directe qui amène à creuser et à cliquer sur des liens, c’est à dire à approfondir le sujet. Il y a là une importante nuance par rapport à Perplexity ou Copilot (ex Bingchat). Le service correspondant de Google s’appelle AI Overviews. Le pitch est: « Google will do the Googling for you », manifestant que la réponse IA est un point d’entrée (optionnel) pour cliquer sur des liens.
Dans les trois cas ci-dessus, les interactions avec une création humaine sont privilégiées, creusant la fracture avec les sociétés IA nouvellement créés. Microsoft se trouve ainsi de plus en plus en porte-à-faux avec OpenAI. D’après The Capital, le 22 mai 2024:
Au cours d'une semaine marquée par le lancement par OpenAI d'un assistant personnel capable de rire, de chanter et de converser avec des voix différentes, le PDG de Microsoft Corp, Satya Nadella, a présenté un point de vue différent sur l'engagement de l'intelligence artificielle.
S'adressant à Bloomberg Television, M. Nadella a souligné ses réserves quant à l'anthropomorphisation de l'IA. "Je n'aime pas anthropomorphiser l'IA", a-t-il affirmé. "Je pense en quelque sorte que c'est un outil".
Les remarques de M. Nadella éclairent un débat en cours dans l'industrie technologique sur le degré d'humanisation de l'intelligence artificielle, d'autant plus qu'elle commence à afficher des comportements de plus en plus proches de ceux de l'homme.
La semaine dernière, un cadre de Google a déclaré à Bloomberg que si les outils d'intelligence artificielle peuvent "montrer des émotions", Google s'efforce de les rendre "super utiles". À l'inverse, la récente démonstration d'OpenAI mettait en scène un assistant vocal qui, semble-t-il, comprend et exprime des émotions.
La question pour l’avenir du web est de savoir qui a raison. Mon avis est que l’homme s’intéresse à des sujets où les autres hommes sont impliqués. C’est pourquoi les BigTech prennent la bonne direction, au détriment des OpenAI et Perplexity. Pour preuve, les snippets présents depuis une dizaine d’années dans les réponses Google ont amené beaucoup de traffic sur les sites web:
Contrairement aux craintes initiales, les snippets n’ont pas enfermé l’utilisateur dans des réponses formatées par l’IA: la curiosité a triomphé de la paresse . Kevin Scott, CTO de Microsoft résume bien la question dans un récent interview de Ben Thompson:
Et l'IA va-t-elle rester un outil, c'est clairement un outil aujourd'hui ?
KS : Oui, je pense que oui.
Pourquoi ? Pourquoi ne va-t-elle pas devenir plus autonome ?
KS : Oui, je ne vois pas vraiment...
Personne ne le sait.
KS : Oui, personne ne le sait, mais je pense que nous avons beaucoup d'indices sur ce que les humains vont vouloir. Il n'y a pas eu d'être humain depuis 1997, lorsque Deep Blue a battu Gary Kasparov aux échecs, mieux qu'un ordinateur, et pourtant les gens ne se soucient guère de voir deux ordinateurs s'affronter aux échecs, ce qui les intéresse, ce sont les gens qui s'affrontent aux échecs, et les échecs sont devenus un passe-temps plus important, comme un sport, et on en fait même des films. Les gens savent qui est Magnus Carlsen.
L'IA va peut-être prendre le dessus, mais nous ne nous en soucierons pas parce que nous ne nous soucierons que des autres humains ?
Je pense qu'elle va continuer à être un outil que nous utiliserons pour fabriquer des choses les uns pour les autres, pour nous servir les uns les autres, pour faire des choses utiles les uns pour les autres et je pense que nous serons extrêmement désintéressés par les choses où il n'y a pas d'humains dans la boucle.
Je pense que ce que nous recherchons tous, c'est le sens et la connexion, et que nous voulons faire des choses pour les autres, et je pense que nous avons une énorme opportunité avec ces outils de faire plus de toutes ces choses de manière légèrement différente. Mais je ne crains pas que nous perdions d'une manière ou d'une autre le sens de notre place ou de notre raison d'être.
L’avenir le dira. En attendant ce déversement de contenu de qualité médiocre pour la plupart va avoir un impact important pour l’écosystème; comment acquérir de la visibilité ?
Comment acquérir de la visibilité ?
Si l’on fait partie du 0,01% des sites intéressants (au lieu de 1% auparavant), il devient encore plus difficile d’être remarqué. Cela renforce incontestablement les BigTech qui sauront faire valoir le contenu intéressant dans une mer de médiocrité. C’est un défi important pour Google dont Sundar Pichai veut relever le gant (interview récent dans Décoder)
"Alors, premièrement, comment pouvons-nous distinguer la qualité supérieure de la qualité inférieure ? Je suis comme, je considère littéralement cela comme notre énoncé de mission.
C'est ce qui a défini la recherche pendant de très nombreuses années. Je pense que les gens sous-estiment le fait qu'à chaque fois qu'il y a des changements de plateforme perturbateurs, on passe par une phase comme celle-ci. J'ai constaté que les équipes investissent énormément, toutes nos équipes de qualité de recherche ont passé l'année dernière à améliorer nos systèmes de classement, et cetera, pour mieux cerner le contenu de haute qualité.
Je pense qu'au cours de la prochaine décennie, les personnes qui peuvent mieux faire cela, qui peuvent trier, gagneront. Je pense que vous avez raison de dire que les gens apprécieront les expériences créées par l'homme. J'espère que les données le confirmeront.
Les plateformes capables d’un tel travail étant peu nombreuses, le prix à payer pour les créateurs risque d’être également de plus en plus cher. C’est pourquoi ces derniers vont devoir chercher également des solutions alternatives (des plans B). La solution qui vient à l’esprit est de faire plus d’humain (à la fois en création et distribution) pour acquérir de la visibilité; de l’humain d’excellente qualité cependant !
Un parallèle peut être dressé avec la musique: la numérisation a entraîné l’abondance de morceaux à disposition d’abord aux travers de MP3/iPods puis par l’intermédiaire d’applications de streaming comme Spotify. Libérées du plastique, les ventes de morceaux pouvaient s’accélérer. Cependant l’industrie des concerts n’a aussi jamais été aussi florissante. Alors que les recettes de l’industrie musicales ont augmenté de 45% en 10 ans, celle des tournées musicales ont plus que doublé. Le numérique a tué l’analogique mais pas la présence physique, bien au contraire.
Il pourrait en être de même avec la prolifération de contenu IA. Une solution pour contourner la taxe BigTech peut être de construire une présence physique qui sert de moyen pour acquérir des clients, l’Internet servant à cultiver le lien, fidéliser lesdits clients et vendre d’avantage. L’exemple type d’une telle stratégie est Disney qui attire son public avec ses parcs de loisir et films grand public et tente de maintenir la flamme avec Disney +. Taylor Swift est un autre exemple. Pour qu’une telle stratégie fonctionne, il faut d’abord avoir quelque chose de différenciant à vendre et ensuite arriver à établir une passerelle solide entre la représentation physique et en ligne: Wal Mart utilise la vente de produits alimentaires dans ses hypermarchés pour faire de la publicité sur sa place de marché internet. Shopify propose d’unifier un certain nombre de services comme le paiement ou la comptabilité pour faciliter la stratégie en ligne/hors ligne: gagner ses clients hors ligne pour les fidéliser et faire consommer en ligne. C’est intéressant, mais la question est d’abord d’avoir du succès hors ligne avant de transformer en ligne: il ne suffit pas d’être sur une voie de passage pour rencontrer le succès. N’est pas Wal Mart ou Disney qui veut…
Cet ancrage physique présente un inconvénient par rapport au modèle économique tout en ligne, des hyper scalers notamment: le rêve d’une distribution à coût zéro s’éloigne.
L’Internet poubelle peut donc engendrer des répercussions significatives pour la diffusion de l’information et le commerce:
le renforcement des voies d’aiguillage internet (principalement hyper scalers) pour traiter et mettre en avant l’information pertinente.
La constitution d’un écosystème hybride en ligne/hors ligne autour de l’immobilier commercial, la marque et la pub tv internet; l’objectif étant d’éviter la dilution opérée par les mêmes hyper scalers.
Bonne fin de semaine,
Hervé