Zoom peut-il chambouler le cloud ?
Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.
Au début du XXeme siècle on imaginait la visio comme ceci:
Voilà où nous en sommes:
Ce tweet fait réfléchir: Zoom pourrait-il devenir un nouveau cloud supportant l’internet du direct ? Et pourquoi pas à terme une menace pour les opérateurs cloud traditionnels, si le direct devient la nouvelle fondation de l’internet ?
Comment Zoom en est arrivé là
Zoom a pris le marché de la visioconférence par surprise avec une tactique très classique, qui marche à chaque fois: l’ouverture. Un peu d’histoire: la visio a commencé avec des marchands de matériels téléphonique qui incluaient un software propriétaire. Pour établir un réseau, chacun devait s’équiper du même matériel. La visio était alors plutôt utilisée à l’intérieur d’une même entreprise. Les systèmes multi vendeurs fonctionnaient mal, l’interopérabilité était plutôt catastrophique. Ci-dessous, une salle de visioconférence Cisco:
Microsoft a été le premier à apporter une réponse à cette difficile interopérabilité, et la solution, comme toujours était Windows. A partir du moment où tous les PC étaient équipés de Windows, pourquoi ne pas proposer une petite extension qui permettrait de communiquer par visio, justement à partir de Windows. Le problème était la transmission entre deux systèmes Windows, pas la tasse de thé de Microsoft. Au début le PC était branché au système de visioconférence propriétaire et permettait de relayer la visioconférence sur l’écran du PC avec une qualité dégradée, grâce à une pièce de logiciel compatible Windows. Cela fonctionnait comme un VPN: les salariés de l’entreprise se connectaient depuis leur PC au système de visio central et pouvaient alors communiquer. Il fallait aller plus loin pour simplifier l’interopérabilité et accroître l’adoption de ce type de communication. Les PC devaient pouvoir communiquer directement. Des sociétés ont commencé à proposer des systèmes de visioconférence par internet, le principe étant d’intégrer une pièce de logiciel à chaque bout de la communication pour la capture, la compression puis le cryptage des données et inversement. Microsoft a acquis Skype en 2011 à cette fin, Cisco Webex en 2007 et Citrix racheté GoToMeeting. Ces systèmes avaient le mérite d’éliminer la contrainte du matériel et ont donc gagné en popularité malgré leur qualité moyenne. Ces sociétés utilisaient la stratégie type telle que décrite par Hamilton Helmer:
apporter un bénéfice par rapport à une manière de faire antérieure
créer une barrière à la sortie autour de cette nouvelle manière de faire pour la protéger.
Placer une pièce de son logiciel à chaque bout, affublé d’une inscription au service, créait un effet réseau et rendait plus difficile l’adoption d’une solution concurrente. Un équilibre des forces s’est établi autour de ces trois solutions, promues par des vendeurs bien installés dans le monde de l’entreprise. En même temps, un frein à l’adoption était l’impossibilité d’appeler qui l’on voulait: il fallait que la personne appelée soit abonnée au service. Cette tactique créait l’effet réseau: plus il y avait d’abonnés, plus le service de visioconférence avait de la valeur, incitant à d’autres abonnements. Le processus d’abonnement étant complexe, c’était aussi une barrière à la sortie. La complexité est toujours un problème dans le monde de l’internet: un des patrons de Webex, Éric Yuan, quitte l’entreprise en 2011 pour fonder Zoom. L’idée est toute simple: permettre à quiconque, même sans abonnement de participer à une conférence Zoom. Pour reprendre la terminologie d’Hamilton Helmer, la réduction des frictions était un bénéfice significatif par rapport à la manière de faire des Skype, GoToMeeting ou Webex. C’était en plus un moyen redoutablement efficace pour se faire connaître puis adopter. Zoom à donc conçu un système qui ne nécessitait pas une inscription au service de la part de ceux qui étaient invités à une visioconférence. Ils devaient juste charger une pièce de logiciel dans leur navigateur, une fois pour toute, mais sans avoir à s’abonner. En ouvrant la visioconférence à 15 personnes dès la première version en 2013, Zoom multipliait son effet de levier marketing: fin 2013, Zoom avait déjà 3 millions de participants. Le plus surprenant fut l’absence de réaction des autres promoteurs de visio, absence qui a créé un boulevard pour Zoom. Cela a permis à Zoom d’accumuler les utilisateurs jusqu’à ce que nombre explose avec le COVID-19: 300 millions. Sans compétiteur, il n’était nul besoin d’assurer ses arrières, d’établir des barrières à la sortie, d’introduire de la complexité pour créer un effet réseau.
Pourquoi cette absence de réaction ?
Les dominants cherchaient avant tout à protéger leur réseau bien étoffé. Alors que Zoom avait 3 millions de participants en 2013, Skype avait 70 millions d’utilisateurs enregistrés. La défense de l’effet réseau était la priorité, il n’était donc pas question d’ouvrir son système propriétaire. C’était le même combat pour Webex et GoToMeeting, très implantés dans le monde de l’entreprise. L’expérience du COVID-19 et du confinement montre à quel point il est difficile de se représenter à l’avance une courbe exponentielle, même en en étant conscient. Tant que les chiffres sont bas, on compare la maladie à une grippette et on la minimise. Ce n’est que quand l’épidémie est déjà bien installée qu’on commence à paniquer. Il en est exactement de même avec la visioconférence. On a vu tous les protagonistes paniquer avec la percée de Zoom pendant le confinement et proposer alors toutes sortes de produits gratuits et ouverts. Mais cette percée couvait. L’absence de réaction la plus étonnante est celle de Google. Comme souvent, Google avait la technologie qui permettait d’annihiler Zoom, n’avait pas de business à protéger et pourtant n’a rien fait...jusqu’à présent. Son absence de stratégie pensée est un cas d’école, eu égard à son approche technologique supérieure.
Google: technologie 1, stratégie 0
Eric Yuan est un stratège marketing certes, mais qu’en est-il de la technologie Zoom ? Le discours est persuasif:
Zoom peut prendre en charge une capacité de participation vidéo accrue sans dégradation de la qualité, car nous sommes le seul service de vidéo créé nativement. Dès le début, Zoom a été conçu pour être natif des nuages et optimisé pour la vidéo. Jusqu'à présent, d'autres approches ont tenté d'ajouter la vidéo à des outils de conférence téléphonique, de partage d'écran ou de chat vieillissants et préexistants.
La diffusion d'une vidéo fiable à l'échelle est complexe, et sa mise à niveau pour une solution existante se traduit par une expérience maladroite. Les fournisseurs qui ont décidé d'ajouter la vidéo après coup ont donc limité considérablement la fiabilité, les fonctionnalités et la qualité, et cela se voit clairement dans la performance de leurs réunions vidéo.
La spécificité de Zoom par rapport aux autres solutions est de faire transiter les vidéos par ses serveurs cloud qui font tout le travail (capture du flux vidéo, encodage, répartition des flux et récupération de ceux ci au plus près de chaque participant). La technologie Zoom a un gros défaut et un parti prix:
le défaut: la nécessité de télécharger une pièce logicielle quand on est invité la promo-ière fois à une visioconférence Zoom. Google a développé une technologie qu’il a mis en open source radicalement différente car 1/elle permet d’éviter cette étape.
le parti prix: le cloud est la meilleure solution pour délivrer de la vidéo.
Google a un autre parti prix ou priorité: dominer l’internet dans son ensemble et son outil de prédilection est Chrome. Ce navigateur, dont on parle finalement peu est un pion stratégique majeur pour Google. L’idée est toujours la même: prendre le contrôle d’une technologie qui réduit les frictions antérieures (Android, Chrome, Kubernetes, Tenser flow), la rendre open source pour en généraliser l’adoption, établir sa version améliorée propriétaire et peser sur les standards de place pour structurer le marché à sa convenance. Chrome est le cas d’école. Google a rendu open source le bloc navigateur Chromium, objet d’un de ses programmes de recherche, lequel a servi pour concevoir d’autres navigateurs (Opera, Firefox et maintenant Microsoft Edge, une reconnaissance de la défaite de Microsoft Explorer). Puis Google a rajouté à Chromium des fonctionnalités propriétaires (plug in) dans un navigateur qu’il a appelé Chrome. Ce dernier s’est montré supérieur à ses concurrents open source ou non:
Grâce à sa domination du marché des navigateurs, Google peut alors imposer plus facilement des standards, influençant le W3C (World Wide Web Consortium), et dominer ces standards par de nouveaux plug in. Les développeurs sont alors obligés d’intégrer ces plug in dans leur conception de programme. C’est ainsi que Chrome a travaillé avec le W3C pour inclure systématiquement le plug in de gestion des droits numériques dans le navigateur puis a proposé sa version, Widevine, qui est devenu le nouveau standard DRM dans tous les navigateurs (Widevine étant cette fois propriétaire). Google n’a pas forcément d’objectif immédiat de monétisation quand il promeut ainsi une technologie mais plutôt en contrôlant le développement de l’internet de se garder les bonnes options, quelle que soit la direction que prenne l’internet.
Dès 2010, Google a cherché à renforcer Chrome en lui adjoignant des capacités de transmission de données (messages, voix, vidéo). L’idée était de pouvoir créer un canal de transmission de données directement entre navigateurs, sans passer par un serveur. Cela pouvait à la fois réduire la latence (idéal pour le direct)…et renforcer Chrome. Google a donc acquis Global IP Solutions, une société qui avait développé des composants logiciels pour la visioconférence (systèmes de compression, etc.), puis rendu open source ces composants. Dans un deuxième temps Google s’est battu pour que le W3C en fasse des standards de communication entre navigateurs. C’est ainsi qu’est né WebRTC, un ensemble d’API de transmission de données entre navigateurs, qui capture par le navigateur la vidéo, l’audio ou le texte est l’envoie à un autre navigateur. Chrome l’a adopté puis progressivement tous les navigateurs. Avec WebRTC, il n’est plus nécessaire pour le participant à une visioconférence de télécharger une pièce logiciel pour s’y connecter. Google élimine une friction de Zoom et diminue la latence sans passer par le cloud ! Comme Chromium, WebRTC a été adopté progressivement par tous les promoteurs de visioconférence sauf un: Zoom.
Le plus impressionnant est que, malgré ce coup de génie, Google a raté le marché de la visioconférence. Le biais de Google est d’être d’abord un service de consommation à destination des particuliers. C’est ainsi que Google avec la plus performante infrastructure du marché a raté le cloud. C’est également ainsi que Google est passé à coté de la visioconférence, axant ses développements autour des particuliers: Google Hangout a été conçu au départ comme un sous-produit de Google + (un gros fiasco) puis séparé en 2013. La première application Google de WebRTC était une visio entre particuliers. Comme Google était très mauvais en réseau social, il était peu probable qu’Hangout puisse percer face à la menace WhatsApp, Facebook, FaceTime, etc. Le combat était perdu d’avance, quelle que soit la supériorité de la technologie. Dans les faits, les réseaux sociaux ont adopté WebRTC et continué à dominer…Pour réduire définitivement ses chances, Google a créé une deuxième application pour la vidéo entre smartphones: Google Duo lancé en 2016. Le message marketing était plutôt confus. Enfin, réalisant tardivement que le cloud et l’entreprise étaient des marchés stratégiques pour l’avenir, Google crée Google Meet en 2017, solution de visioconférence pour entreprise collée à G Suite. Là encore, Google a mésestimé le potentiel de la visioconférence, la rendant prisonnière d’un abonnement à la suite de productivité. Google a donc, comme Microsoft ou Cisco, laissé le marché à Zoom. Cependant, comme toujours, en dominant la technologie, Google s’est gardé des options et c’est maintenant que le combat va devenir intéressant…
Zoom doit changer de braquet
La faille de Zoom est de ne pas avoir créé de barrière à la sortie lorsque son service s’est répandu comme une trainée de poudre. C’était le moment. Une fois que le service est copié et soumis aux lois de la concurrence c’est beaucoup plus dur. Il est vrai qu’il est difficile pour une affaire qui promeut la simplicité de connexion de créer un mécanisme de lock-in. Google résout ce problème par la schizophrénie: jouer l’ouverture avec une petite pièce essentielle propriétaire. Zoom ne peut pas en rester là car du fait de son modèle économique, il n’a pas créé d’effet réseau. Les applications nombreuses développées sous protocole WebRTC proposent maintenant le même service (Meet, Teams, Webex, etc.), accessible sur simple invitation, sans télécharger d’applet et autorisant un nombre voisin de participants. Le Covid-19 en accélérant les participations aux conférences Zoom a enfin fait réagir ses compétiteurs. Ils ne lâcheront plus le morceau. De plus, de nombreuses applications de visioconférence spécialisées vont se créer en se branchant sur une API WebRTC proposée déjà par des acteurs comme Twilio. Pour moi, Zoom a deux options:
soit devenir une offre groupée de spécificités s’adressant à des utilisateurs tant super fans qu’amateurs occasionnels (voir notre article sur le sujet: La recette pour disputer la Silicon Valley). En effet, comme le mentionne le tweet du début, des applications de plus en plus spécialisées vont voir le jour en fonction des besoins: certaines demanderont moins de latence, par exemple chirurgie à distance, d’autres d’avantages de participants, par exemple spectacles à distance, etc. Zoom doit alors développer et proposer des options multiples pour satisfaire tous les publics. Le verrouillage des utilisateurs sera d’autant plus fort qu’ils utiliseront plusieurs options pour le même prix. Le risque est que l’offre groupée paraisse insuffisante par rapport à un choix à la carte, beaucoup plus vaste , développé à partir de WebRTC.
soit se transformer en plate-forme cloud dédiée d’applications de visioconférence et Leur permettre d’utiliser son infrastructure. Zoom aujourd’hui utilise ses 13 serveurs détenus en propre en plus de clouds publics (AWS est préféré car moins concurrentiel sur son métier)pour faire transiter ses flux. Je suis très septique sur cette possibilité. D‘une part, rien ne dit, à part Zoom, que sa technologie est meilleure que celle développée par WebRTC. L’API WebRTC, organisant la communication en direct entre navigateurs, couplée à des serveurs pour des fonctions spécifiques (pages web de l’application, connexion des utilisateurs, centralisation puis dispatch des flux vidéo à de multiples participants, enregistrement, etc.). D’autre part, WebRTC a une longueur d’avance comme plateforme et est vulgarisée à travers des API comme Daily.co ou Agora.io qui simplifient le développement: on peut créer ainsi une application Visio en plug and play en y ajoutant des spécificités. WebRTC devient le standard. De plus l’adoption de WebRTC risque d’être accélérée par d’autres applications possibles innovantes concernant la vidéo en direct (mini programmes WeChat, réalité augmentée, etc.). Pendant ce temps Zoom reste propriétaire, monolithique et concentré sur son application. Enfin, même si Zoom est de nationalité américaine, ses développeurs sont en majorité chinois, donc asservis au pouvoir chinois. Cela constituera un sérieux obstacle à l’acceptation d’une éventuelle plateforme Zoom.
Finalement, en créant WebRTC, Google a réussi son objectif, même si les premiers pas ont été un cafouillage. Bien que n’ayant pas encore consolidé son avantage par quelque plug in propriétaire supérieur, il a réussi en rendant WebRTC open source à déchaîner la créativité des développeurs d’applications visio et à les monter contre une menace potentielle réelle, Zoom et son architecture cloud. Parallèlement Google améliore sa version de WebRTC pour renforcer le monopole Chrome, par exemple en rendant les visio passant par Chrome plus claires avec plus de participants, moins consommatrices de CPU, etc. Chrome et WebRTC se soutiennent mutuellement et définissent les standards de la visio. Ainsi, les codecs les plus puissants chercheront la compatibilité WebRTC avant Zoom, le marché étant plus large.
On peut se demander si Zoom ne devra pas jeter l’éponge, adopter WebRTC et subir le sort du Frigidaire. Une marque générique pour un produit tombé dans l’oubli.
Bonne fin de semaine,
Hervé