Après l’iPhone ?

nov. 22, 2023

Les cimetières sont remplis de sociétés qui n’ont pas compris les règles du jeu.

Y aura-t-il un iPhone 35 ?

Wikipedia:

Location, Location, Location :
Un cliché utilisé par les experts immobiliers qui stipule que les trois facteurs les plus importants pour déterminer la désirabilité d'une propriété sont "l'emplacement, l'emplacement, l'emplacement". Cette formule est apparue dans la presse dès 1926, bien qu'elle soit souvent attribuée à tort au magnat de l'immobilier Harold Samuel.

Les ruptures technologiques informatiques peuvent être également caractérisées par une formule lapidaire: “accès, accès, accès”

-Le PC a pris le pas sur l’unité centrale. Pourquoi ? Accès: il est plus facile de travailler sur un PC à disposition à la maison ou au bureau que de réserver un créneau horaire pour travailler sur une grosse machine localisée loin de chez soi:

Microsoft a été la société emblématique de cette époque des années 80 à 2000 mais a coexisté avec une série de sociétés “secondaires” exploitant l’invention du PC et contribuant à son succès: Adobe, Oracle, Compaq, Sun Microsystems, Intel, Dell, Cisco, Google…

-Le smartphone a pris le pas sur le PC. Pourquoi ? Accès: il est plus facile d’utiliser un ordinateur à disposition dans sa poche que d’avoir à accéder à celui qui se situe dans son bureau ou sa maison. L’iPhone peut être considéré comme le premier ordinateur de poche. Apple et Google (Android) sont les sociétés emblématiques de cette époque (2010/2020), accompagnées de nombreuses de greffant sur la technologie: Facebook, Amazon, Twitter, Spotify, Uber…

Hiérarchie des innovations

Progresser de l’unité centrale (phase A) au PC (phase B) puis du PC au smartphone (phase C), a nécessité d’autres innovations: le microprocesseur par exemple qui a permis la miniaturisation du hardware ou l’Internet qui a permis la multiplication des options (information, communication, action…). Sans internet, le smartphone n’aurait pas eu beaucoup d’intérêt et n’aurait peut être jamais existé. Qui se souvient du Psion ? Cependant, dans chacune de ses trois phases, la clé a été de dominer l’accès. On peut schématiquement classer les innovations en deux: celles qui ont amélioré la capacité de l’ordinateur (ses options) et celles qui ont rapproché l’information de l’utilisateur. Dans les premières, on trouve les applicatifs de productivité (Excel, Word, Oracle, SAP, Adobe), les sociétés cloud, etc.; dans les secondes le matériel (Intel, Dell, Apple, Lenovo, Samsung…), les OS et solutions d’aiguillage. Les sociétés technologiques ont oeuvré dans les deux directions. Or ce sont celles qui ont maîtrisé le point d’accès à l’information (les secondes) qui ont finalement dominé et dirigé l’innovation, jusqu’à ce que ce point d’accès change pour se rapprocher encore plus de l’utilisateur dans le cadre d’une nouvelle rupture technologique. Le point d’accès repose sur:

Un hardware (avec lequel l’utilisateur communique), par exemple le PC.
Une interface software (qui donne accès à l’information ), par exemple un OS.

Le software a une structure de coûts fixes propice à créer un seul gagnant alors que le hardware pétri de coûts variables est plus facilement copiable. Le software a donc l’avantage pour dominer l’accès, soit avec une approche modulaire pour le hardware, soit avec une approche intégrée. On ne trouve pas de sociétés de hardware pur parmi les dominants (ni Dell, ni Compaq, ni Huawei…), sauf au début de l’ère informatique avec IBM.

En phase A, le software était une petite couche superposée au hardware gérée par de rares spécialistes: la machine était prédominante, le software sans effet d’échelle possible, c’est l’époque d’IBM.

En phase B, le software se démocratise et l’effet d’échelle joue alors à fond: Microsoft devient incontournable sur le PC, jusqu’à ce que Google vienne rivaliser avec son moteur de recherche. L’intelligence de l’ordinateur a en effet évolué avec internet: le traitement de l’information (blogs) se fait une place de choix face aux applications de productivité (Word/Excel). Windows est détrôné par Google et Chrome.

Enfin en phase C, Apple réconcilie productivité et information dans son propre OS en inventant le magasin d’apps sur iOS. En arrière plan, il y a le cloud. Apple simplifie l’accès à l’intelligence grâce a un OS adapté à la petite taille de l’iPhone. Il est vite copié par Google (Android) et les deux sociétés forment un duopole sur le smartphone. Microsoft, conditionné par le succès de Windows, Excel et Word sur PC a conçu Windows Mobile. D’après Wikipedia :

Ces systèmes d'exploitation (OS) permettent à des logiciels Microsoft tels que Microsoft Office ou Windows Live Messenger de fonctionner sur un téléphone.

L’accès (difficile car Excel n’est pas adapté à un petit écran) à une intelligence trop orientée sur la productivité, pas assez intégrée avec l’internet, n’était pas vendeur. Microsoft a alors perdu le marché du smartphone et a dû se retrancher (avec brio) sur le marché de l’entreprise, sa grande force.

Il est important de noter que les différentes phases mettent au centre un certain type de hardware, sans faire disparaître les hardwares précédents : le smartphone n’a pas supprimé le PC, lequel n’a pas supprimé le serveur. C’est pourquoi si une nouvelle phase se profile, il ne faut pas considérer qu’elle a vocation à remplacer le smartphone, mais simplement à le reléguer au second plan.

Quid maintenant de la phase D ? L’iPhone, à sa version 15, peut-il être détrôné ?

Intégration/accès

La grande réussite de Microsoft repose sur l’intégration: ses produits ne sont pas forcément les meilleurs, loin de là, mais ils s’imbriquent comme du lego. L’aspect pratique l’emporte sur la perfection du produit. Avec Windows comme point d’accès dominant dans les années 90, Microsoft pouvait ajouter des briques exclusives faciles à utiliser (Office, Explorer), compatibles dans le temps et bien mises en évidence. La compatibilité des différentes versions d’un même produit dans le temps pouvait rendre ce dernier un peu lourd, question de priorité. La concurrence était rendue très difficile même si elle était meilleure car reléguée en arrière plan et peu compatible avec les produits Microsoft.

Encore aujourd’hui, la grande force de Microsoft est l’intégration. Elle lui permet de résister aux attaques concurrentielles et garder la suprématie dans le monde de l’entreprise. Windows a simplement été remplacé par le cloud. Certes la compatibilité entre produits Microsoft et produits tiers est maintenant requise. Elle reste cependant plus facile à mettre en action entre deux produits Microsoft. C’est ainsi que Teams a pu l’emporter sur Slack et Zoom, deux produits supérieurs techniquement. La facilité d’accès est la vertu cardinale…Microsoft domine sur le monde de l’entreprise et de la productivité, en maitrisant l’accès…Sa capitalisation boursière est de $3,8 Trillions, la deuxième mondiale, après…Apple

Apple a bien compris également l’intérêt de l’intégration et l’a appliqué plus loin que Microsoft: du hardware (iPhone, iPad…) à iOS (combinant apps d’information, de productivité, de loisirs, etc.) et jusqu’à ses propres applications (Music, Plan, Apple TV…). Un tel niveau d’intégration rapproche considérablement l’utilisateur de son ordinateur, lui donnant accès à ce qu’il veut facilement. Apple a appliqué au consommateur (un marché potentiel de 8 milliards d’individus) la stratégie que Microsoft a depuis longtemps appliqué à l’entreprise (un marché potentiel de 330 millions de sociétés).

Google est beaucoup moins bon pour l’intégration. Culturellement il cherche des produits qui se différencient sur leurs seuls mérites (Google search, Google maps, Gmail, YouTube, Google Sheets, etc.). Il a cependant anticipé que le mobile allait s’imposer et réduire l’emprise de son moteur de recherche web. C’est pourquoi il a opportunément acquis Android en 2005, cette acquisition lui permettant dès 2008 de copier iOS, de grouper Android et Google search pour le proposer aux fabricants de mobiles. Google (Android) est ainsi devenu l’alternative de l’iPhone mais avec une intégration moins poussée. Apple en a profité pour pousser son avantage sur l’ensemble de son hardware, lequel est devenu parfaitement compatible avec l’iPhone. Google ne maîtrisant pas le hardware ne pouvait réaliser une telle prouesse. Or le consommateur final, à la différence de l’entreprise utilise de nombreux appareils différents (iPhone, iPad, Mac, Apple Watch, AirPods, AirTags, HomePod). C’est pourquoi l’intégration totale est si attractive pour le consommateur final (alors qu’elle l’est moins pour l’entreprise qui peut se contenter du PC/serveurs et des apps de productivité…) La conséquence est que Google est prêt à payer $20 milliards par an pour être facilement accessible sur l’iPhone: « Accès, accès, accès… »

C’est ainsi qu’Apple est devenu la plus importante capitalisation mondiale ($3 Trillion) et enfile les versions d’iPhone année après année sans pouvoir être dérangé.

La phase D

Écartons d’emblée Humane AI. Il veut remplacer l’iPhone par un pin, ce qui ne me semble pas la bonne stratégie pour au moins deux raisons:

L’histoire de l’informatique lui donne tord. On ne remplace pas un produit existant, on le rend juste secondaire. Or le pin d’Humane AI agit comme un véritable smartphone avec un abonnement 5G à T-Mobile. Il est privé d’écran, ce qui est effectivement une révolution, mais ne va pas dans le sens de l’histoire qui est d’avoir toujours plus d’écrans.
L’écosystème de l’iPhone particulièrement résistant le protège contre ce genre d’agressions.

Humane Ai va s’épuiser ainsi que ses investisseurs à gravir l’infranchissable.

Pourtant l’idée que l’intelligence artificielle puisse reléguer au second plan un système fondé sur des apps est intéressante à creuser. Peut on par ce biais rapprocher encore l’utilisateur de l’ordinateur ? Considérons les frictions encore existantes pour accéder au fonctions souhaitées avec un smartphone. Il faut

Sortir le smartphone de sa poche (son sac),
le déverrouiller,
trouver la bonne app,
ouvrir l’app
se déplacer dans l’app pour
cliquer sur les bonnes opérations à effectuer.

La prochaine “révolution” pourrait consister en:

un hardware plus léger et plus accessible que le smartphone (montre, lunettes…)
une interface permettant d’arriver plus facilement aux fonctions souhaitées.

Les leçons de l’Apple Watch

L’Apple Watch, sans remplacer l’iPhone, aurait pu devenir le centre de contrôle de tout l’écosystème Apple. Son intérêt principal est d’être plus accessible que l’iPhone avec des interactions plus immédiates dans des contextes plus nombreux (par exemple, en réunion, il est plus discret de jeter un coup d’œil à sa montre que sortir son smartphone). L’Apple Watch permet de lancer des apps directement, passer et recevoir des appels, écrire et recevoir des messages).

Malgré son succès, elle n’a pu reléguer l’iPhone au second plan. Ce dernier représente plus de 50% du chiffre d’affaires d’Apple, la Watch peut être 5% (les chiffres sont englobés dans une catégorie avec les AirPods et autres accessoires, le tout représentant 10% des recettes globales). La raison principale à mon sens est que l’écran est trop petit pour écrire et consulter des apps confortablement. Apple corrige le tir en augmentant la taille de l’écran avec l’Apple Watch Ultra mais cela reste insuffisant. Il y a de toute façon des limites à la taille d’une montre qui l’empêcheront de devenir le point d’accès.

La leçon est que pour imposer une rupture, l’innovateur devrait non seulement rapprocher l’ordinateur de son utilisateur mais aussi l’écran. Humane AI n’a pas d’écran et est voué à l’échec. La commande à la voix ne fonctionne pas car les options ne sont pas proposées comme avec un écran. Alexa n’a pas pris certes parce que son IA n’est pas bonne mais aussi parce qu’on demande toujours la même chose, faute d’écran pour guider l’action. De même l’Apple Watch a un écran mais trop petit: elle doit donc se spécialiser sur des fonctions qui ne sont pas assurées par l’iPhone comme le suivi de la santé par exemple ou l’appel main libre. D’après Exploding Topics, les internautes en moyenne dans le monde passent 44% de leur temps éveillé sur un écran, ce temps a tendance à augmenter année après année…Les internautes plébisciteront une interface écran et pour l’instant, il n’y a rien de mieux que le smartphone qui a établi le meilleur compromis entre taille de l’écran, capacités informatiques et accessibilité.

Une interface IA ?

Si le hardware du futur est encore nébuleux, Satya Nadella, conformément à la culture Microsoft, travaille résolument à créer une interface software intégrée qui permette d’accéder plus vite à l’information souhaitée. Après Windows et le cloud, son idée est que Copilot, son nouvel outil d’IA générative à base de GPT, devienne le point central de la galaxie de services Microsoft. Il a été très clair dans la récente Keynote de Microsoft:

Notre vision est assez simple. Nous sommes l'entreprise CoPilot. Nous croyons en un avenir où CoPilot sera CoPilot pour tout et pour tous. Le Microsoft CoPilot est cette expérience unique qui traversera toutes nos interfaces, comprenant votre contexte sur le web, sur votre appareil, et lorsque vous êtes au travail, apportant les compétences nécessaires quand vous en avez besoin. Tout comme, disons, aujourd'hui, vous démarrez un système d'exploitation pour accéder aux applications ou à un navigateur pour naviguer sur un site web, vous pouvez invoquer un CoPilot pour toutes ces activités. Et plus encore. Pour faire du shopping, pour analyser, pour apprendre, pour créer. Nous voulons que le CoPilot soit partout où vous êtes ."

Microsoft fait du Microsoft: l’intégration de tous ses produits (Office, Azure, Teams…) autour d’un noyau central: Copilot, à destination première de l’entreprise. Le hardware dans cette vision est secondaire: le poids de l’intégration logicielle est suffisant pour s’adapter à celui qui prédominera. Cela explique pourquoi la société a mis en sommeil sa division AR HoloLens.

Sam Altman a une vision différente: de même qu’Apple avec ses produits, il veut faire de ChatGPT avant tout un produit de consommation. Il n’a pas de suite Office à protéger, et peut donc brûler les étapes: par exemple, pourquoi utiliser Excel pour faire un graphique quand on peut se contenter d’une requête ChatGPT ? C’est l’important avantage de ChatGPT par rapport aux Big Techs: il n’a pas d’écosystème à prolonger et peut adopter une approche de rupture pour plus d’accessibilité. OpenAI (avec Altman) travaille dans deux directions dont le prolongement est une intégration hardware:

Le magasin de GPTs (programmables sans code) permet d’envisager une infinité de bots spécialisés. L’App Store, qui doit compter sur des développeurs en nombre forcément plus restreint est battu ! La difficulté pour ce magasin est l’accès: pour trouver son GPT, il faut sortir son smartphone, ouvrir l’app ChatGPT (web app) puis se balader dans l’app pour trouver le magasin. OpenAI est condamné à créer son propre hardware s’il veut proposer un accès direct, sans la taxe Apple ou Google, à son magasin de GPTs.
ChatGPT universel: l’idée est de sauter encore une étape, celle du choix du GPT spécialisé. ChatGPT décide pour l’utilisateur en fonction de la question posée quelle extension utiliser. Sam Altman a d’ores et déjà annoncé l’intégration dans ChatGPT du moteur de recherche, de Dall-e et de la fonction de codage. Il reste à voir si l’IA générative universelle est la bonne voie: elle pose un problème de modèle économique (comment rémunérer les contributeurs et les motiver), ce qui peut affaiblir sa pertinence. Un ChatGPT universel (simulacre d’une intelligence artificielle générale) devrait pouvoir être sollicité directement, sans étape préalable. Elle nécessiterait également un hardware ad hoc qui permettrait d’y accéder avec le moins de frictions possible.

Sam Altman et Jony Ive travaillent, en dehors d’OpenAI, sur un projet de hardware intégré à l’IA générative. Souhaitons à ce stade qu’il soit plus réussi que le pin d’Humane AI. Sam Altman étant un pragmatique, il est probable que l’écran ne sera pas négligé.

Quel que soit le dénouement de l’affaire OpenAI, le divorce à plus ou moins longue échéance entre Sam Altman et Microsoft me paraît inévitable:

Sam Altman a pour ambition de créer un produit grand public qui pourrait rivaliser avec les Big Tech, y compris Microsoft. C’est pourquoi il envisage la création d’une société de puces qui lui permettrait d’exercer un levier face à Microsoft. Il cherche peut être même à utiliser OpenAI (dont il n’est pas actionnaire) pour créer des sociétés lucratives qui y seraient intégrées (puces TPUs, hardware). Cela pourrait expliquer la réaction du conseil d’administration d’OpenAI à son égard.
Satya Nadella lui vise d’abord l’entreprise. Or il vient de réaliser que la précarité du modèle de gouvernance d’OpenAI était un sérieux handicap pour attirer des développeurs, lesquels ont besoin de visibilité. Il va donc lui falloir contrôler OpenAI ou développer ses propres modèles pour faire avancer sa stratégie tournée sur les entreprises et les développeurs. Dans les deux cas, il lui faut canaliser les ambitions de Sam Altman. Malgré les apparences, la division entre les deux hommes/modèles risque de devenir plus marquée. Au final, Microsoft détient l’infrastructure, donc le levier…

L’interface IA, qu’elle prenne la forme d’une intégration logicielle (façon Microsoft) ou d’une intégration logiciel/hardware (façon Sam Altman) présente un manque: un écran de rupture, seul capable de renverser l’ère de l’iPhone.

Convergence IA/VR

Récapitulons les caractéristiques essentielles d’un hardware de rupture par rapport à l’iPhone:

Être plus proche des sens de l’utilisateur (vue et ouïe)
Permettre d’accéder le plus facilement possible à une intelligence artificielle générative, par la voix mais pas seulement.
Intelligence qui voit ce que l’on voit et entend ce qu’on entend (requêtes plus faciles)
Comporter un écran offrant texte, photos et vidéo.
Comporter des hauts parleurs proches des oreilles
Le tout le plus léger possible.

Les lunettes sont le candidat idéal car elles peuvent offrir des améliorations radicales par rapport à l’iPhone: la taille de l’écran virtuel, sa résolution, la capacité de le placer où on veut dans son champ de vision, l’accès immédiat à l’IA par la voix. Il faut imaginer (on est encore à quelques années de là) un casque de type Vision Pro concentré dans des lunettes Meta Ray Ban.

Une telle innovation combinant intelligence artificielle et réalité virtuelle/augmentée nécessite des moyens considérables en puces et serveurs. Il est fort à parier qu’OpenAI sera disqualifié par manque de moyens au profit des habituels suspects.

Bonne semaine,

Hervé

Power game

Discussion à propos de ce post