mardi, janvier 31, 2017

Applications mobiles et conversations : la voie de la raison


1. Introduction


Les chatbots sont ces petits robots qui ont fait leur apparition sur les plateformes de messaging, de WeChat à Facebook. Ce serait peu dire que l’engouement pour les chatbots est un évènement marquant de l’année 2016. Il y a bien longtemps que le Cluetrain Manifesto annonçait que les marchés sont des conversations, mais avec l’arrivée des chatbot le concept du « commerce conversationnel » a pris un nouvel essor. Ceci conduit Forbes à écrire « Get ready for the chatbot revolution : they’re simple, cheap and about to be everywhere”, pour prendre un exemple parmi des centaines.

Au même moment, on constate à la fois un ralentissement dans l’augmentation de la pénétration des smartphones, et une concentration de l’usage des apps au profit des blockbusters et au détriment des nouveaux entrants. Il y a une vraie logique dans l’entrée d’une « phase plateau » des smartphones, puisque la technologie marque un temps d’arrêt, et que cela conduit à un ralentissement des renouvellements, tandis que la pénétration a atteint un niveau qui n’est pas loin de la saturation, à condition économique constante. Le ralentissement de la phase de croissance continue que nous avons connu depuis 10 ans se traduit logiquement dans le taux de chargement des applications.  Les places sur les écrans de nos smartphones sont chères, car elles sont liées à une place dans le « top of mind ». Les expériences qui « justifient une app », par leur fréquence d’usage et la valeur apportée restent rares. Dans la très grande majorité des cas, une approche de « Web app », produite sur le navigateur du mobile – dont les capacités ne font que progresser-, est amplement suffisante.

La combinaison de ces deux tendances fait qu’on voit apparaitre depuis plusieurs mois des articles annonçant la fin des applications mobiles. Les chatbots vont remplacer les apps parce qu’ils sont plus faciles à utiliser et ne nécessitent pas de téléchargement. La fin des apps mobiles n’est pas un thème nouveau, mais la compétition avec les chatbots devraient porter le coup de grâce, sans compter les progrès spectaculaires de la reconnaissance vocale, qui devraient faire du smartphone un objet auquel on parle.

L’objectif du billet de ce jour est d’essayer de trouver un compromis – la « voie de la raison » - entre l’enthousiasme justifié pour les chatbots en tant que nouveau canal d’interaction et le scepticisme raisonné face au « hype », et en particulier l’idée que cette approche signifierait la fin des applications mobile. Je partage cet enthousiasme, et les premières expérimentations auxquelles j’ai pu être associé confortent  mon intérêt, mais je suis absolument pas convaincu pas les arguments qui prévoient la fin des applications mobiles. Je pense qu’une révolution arrive, en terme d’interface homme-machine, mais qu’elle va s’ajouter au reste plus que le remplacer les autres techniques d’interaction (hormis les quelques cas dans lesquels le méthodes actuelles sont inefficaces).

Ce billet est organisé selon le plan suivant. La première partie va souligner l’importance de la conversation – sous forme écrite avec un chatbot ou vocale avec Siri ou Alexa – comme méthode d’interaction. Même s’il faudra du temps pour avoir des conversations réellement intelligentes avec les machines, une très grande partie de nos moments de vie se contentent très bien d’une conversation simple – ce que je qualifie de « dumb bots » - qui est à la portée de la technologie d’aujourd’hui et représente un vrai progrès par rapport aux alternatives – remplir un formulaire sur le Web par exemple. La seconde partie va rappeler quelques évidences sur le design d’interaction, pour redécouvrir que tout n’est pas réductible à une conversation. Nous avons 5 sens, et il faudra continuer d’en profiter, avec ou sans intelligence artificielle. La dernière partie va s’intéresser simplement à l’évolution des applications mobiles en co-évolution avec les chatbots. Les smartphones vont continuer – au moins dans les 10 ans à venir – à progresser en termes de capacité logicielles et matérielles via l’incorporation de senseurs. Les applications deviennent des systèmes, dont l’implémentation est distribuée (mobile et cloud et objets) et dont les interfaces sont également distribuées.


2. Une révolution se prépare : l’interaction conversationnelle 


L’utilisation des chatbots est un élément de différenciation du moment de la plupart des acteurs innovants, comme les startups. L’interaction à travers un “agent conversationnel” (chatbot) présente de nombreux avantages, même si le service reçu est simple. Au-delà du côté « naturel » du dialogue en langage naturel, le principe de la conversation est à la fois rassurant et simple. Les premiers retours des utilisateurs pour qui on remplace un formulaire web par un dialogue simple - qui demande les informations une par une - sont très positifs. Ce sont les « dumb bots » que je mentionnais plus haut : des chatbots limités dans leurs capacités et qui interviennent sur des domaines limités. La première étape de la révolution est maintenant parce que la technologie pour les dumbot est très facilement disponible et mature, et parce que les bénéfices clients sont déjà réels. Les plateformes actuelles permettent déjà des réaliser des dialogues plus conviviaux et plus robustes que l’état de l’art des formulaires web assortis d’assistants en Javascript. Plus on dispose de nombreux exemples de dialogues, plus il est possible d’entrainer le chatbot à donner des réponses pertinentes. Par un effet vertueux, un chatbot qui commence à bien fonctionner devient un collecteur de dialogues, ce qui permet de continuer à progresser (et c’est pour cela qu’il faut commencer).

Je peux citer ici à nouveau Norm Judah, le CTO de Microsoft, et reprendre ses arguments d’un billet précédent. Les bots permettent d’ouvrir les interactions avec les services digitaux à de nouvelles familles d’utilisateurs :

  • Ceux qui n’ont pas accès à un smartphone où ne sont pas familier avec l’utilisation des apps. Il faut se rappeler que même si la pénétration des smartphones frise la saturation, plus de la moitié des utilisateurs se contentent des apps pré-chargées et n’en ajoute pas d’autres.
  •  Les utilisateurs qui ne sont pas familiers avec la conceptualisation implicite de la plupart des interfaces utilisateurs du web. La navigation dans les menus, les listes déroulantes, les choix de catégorie qui reposent sur des abstractions, sont autant de barrières en fonction des origines socio-culturelles des utilisateurs.



Si l’état courant des plateformes de bots favorise le choix réaliste de domaines très précis de dialogue, les « dumb bots » vont devenir de plus en plus « smart » parce que la reconnaissance du langage va fortement progresser dans les années à venir. Je vous renvoie à la présentation que j’ai faire au MEDEF – lors de la journée co-organisée avec l’AFIA. Le chemin vers les assistants « vraiment intelligents » sera long. Même à la Singularity University, Ray Kurzweill pense qu’il faudra encore dix ans avant d’avoir des conversations convaincantes sur des domaines généraux. Pour l’instant, lorsqu’il faut traiter des demandes variées, la meilleure méthode est de combiner l’intelligence humaine et l’intelligence artificielle, à la façon de Wiidii ou de Facebook M. Mais il faut s’attendre à des progrès rapides et des étapes marquantes dans cette route vers les assistants « généraux ». Si vous voulez vous convaincre des progrès rapides dans ce domaine, je vous recommande la lecture de cet article, qui relate le fait que les robots de reconnaissance vocale battent les meilleurs humains en train de « texter » des messages. Lors d’une compétition organisée par Baidu, la reconnaissance vocale sur smartphone est 3 fois plus rapide et 20% plus précise que les meilleurs accros au mobile messaging. Ce n’est pas un hasard si Andrew Ng déclare : « 2017 will be the year of the conversational computer ».

Si l’on définit le concept de “test de Turing du chatbot intelligent”, il y a trois paramètres essentiels : le scope de la conversation, la durée de la conversation, et la sérendipité (est-ce que l’utilisateur pose une question ou est-ce qu’il s’agit d’apprendre quelque chose qu’on ne sait pas encore être intéressant). Sur une durée courte, avec un domaine défini et un mode requête, les techniques actuelles permettent déjà de faire illusion (i.e., « passer le test de Turing »), comme le témoigne l’exemple célèbre suivant. Un professeur a décidé de remplacer un de ses « assistants » pour répondre aux questions des élèves, et cela a très bien fonctionné. Les experts des chatbots insistent sur l’importance d’un domaine précis et bien délimité, car cela facilite grandement l’apprentissage supervisé, et permet d’obtenir une bien plus grande pertinence.


3. Design d’interaction 


Ce que nous venons de voir dans la section précédente ne signifie nullement que les chatbots sont une panacée en termes d’interactions. Rappelons-nous, suivant une formule célèbre, que le but du design est de minimiser les frictions et de maximiser le plaisir lors de l’utilisation d’un produit ou d’in service. Le domaine CMC (Computer Mediated Communication), auquel j’ai fait de nombreuses fois référence dans ce blog, est riche d’enseignement.  Chaque canal de communication se caractérise par sa densité, sa bande passante, sa capacité de feedback (entre autres). Le canal audio a ses forces et ses faiblesses, tout comme le canal textuel. L’utilisation de l’image et de la vue supporte une bien plus grande densité d’information. Il ne viendrait à personne l’idée de remplacer Google maps par un chatbot, même si certains « use cases » se prêtent au dialogue. De la même façon, le canal haptique, associé au toucher, permet un excellent niveau de feedback qui n’est pas accessible via le langage. Ici on peut penser aux applications de sketching ou de dessins, qui ne sont pas remplaçables par des dialogues. Au-delà de ces exemples caricaturaux (cf. "un dessin vaut mieux qu’un long discours"), les interfaces conversationnelles sont un des outils du design d’interaction, dans une large panoplie de solutions. Le fait que les progrès des techniques d’apprentissage viennent de faire un progrès spectaculaire et rendent les interactions conversationnelles robotisées faciles d’accès et beaucoup plus pertinentes ne modifie pas l’intérêt fondamental d’utiliser l’ensemble de nos sens pour faciliter le dialogue entre l’humain et la machine.

Sans rentrer dans trop de détail sur ce qui justifierait un billet séparé, voici quelques réflexions sur l’arrivée des chatbots dans la pratique du design d’interaction :

  • Le design d’interaction est au service de l’expérience, tournée vers le “job to be done” et le “unique value proposition” que le service doit apporter au client. Le choix du meilleur canal doit tenir compte du contexte d’utilisation. Par exemple le canal vocal respecte peu la «privacy » du client et produit une « nuisance sonore » (une externalité négative) qui le rende inadapté à de nombreux usages.
  • L’interaction homme-machine est une science, il existe beaucoup de principes et de méthodes fondées sur des expériences validées (clin d’œil à la data science des bots). Beaucoup d’expériences digitales abusent de la puissance des outils et de la richesse des écrans en fournissant beaucoup trop d’information (ce qui a permis à de nombreux acteurs de s’illustrer en prenant le contrepied). A l’inverse, les dialogues répétés et les pages multiples de certaines interfaces Web sont un retour arrière par rapport à la mise à disposition d’information complète.
  • Comme nous allons le développer dans la section suivante, il faut s’inspirer de la nature et favoriser la diversité des canaux d’interaction. Il y a des moments où la voix n’est pas adaptée mais il y a clairement des moments où c’est l’approche la plus naturelle, ce qui explique le succès d’Amazon Echo. Réduire l’effort nécessaire – cf. thinking, fast and slow - est un excellent principe de design biomimétique. La conversation est un mode plus confortable que la requête, mais avec un « cout de setup » et une énergie nécessaire supérieure (par exemple, à l’utilisation de Google dans la barre du navigateur).
  • Chaque année digitale vient avec ses modes, mais la « « mode précédente de l’environnement cliquable – pour reprendre une très belle formule de Joël de Rosnay – qui utilise les objets connectés comme des éléments du design d’interaction reste extrêmement pertinente. L’expérience favorise le design d’interactions simples, associées à un usage unique.  Un exemple simple est celui de la télécommande de la télévision (ou de la set-top box) qui résiste vaillamment à l’introduction de la reconnaissance vocale dans ces objets.



4. La fin des applications n’est pas encore en vue


Pour revenir à la question de l’introduction, le besoin de la richesse des modes d’interaction donne une première raison de penser que les chatbots ne vont pas signifier la fin des applications mobiles. Cette diversité va au contraire conduire à une vision étendue des applications, capables de se matérialiser sur plusieurs interfaces utilisateur. Je souscris à ce concept d’interface utilisateur à la demande « When I say On-Demand User Interfaces, I mean that the app only appears in a particular context when necessary and in the format which is most convenient for the user”. Cet article insiste fort justement sur la notion de produit. L’application est un produit qui se décline intelligemment sous plusieurs instanciations en fonction du contexte utilisateur, avec les interfaces adéquates.
                                                                              
Si l’on regarde ce que les gens font aujourd’hui avec leurs apps, on retrouve les categories best-sellers: la communications avec d’autres personnes, les news et le divertissement, les jeux. Dans la plupart des cas, le canal chatbot n’est pas le mieux adapté et il y a peu de chance que ces applications disparaissent. Si vous voulez vous en convaincre, regardez les applications des deux premiers écrans de votre smartphone et comptez celles qui pourraient être remplacé par un chatbot.  L’arrivée des applications vocales – on pense aux skills d’Alexa et leurs équivalents chez Google – vont donner lieu à des nouvelles plateformes, mais il s’agit de l’ajout d’un nouvel écosystème digital, pas de la fin du précédent.

De toutes façons, les chiffres ne supportent pas les analyses pessimistes que j’ai cités en introduction. Il y bien un léger tassement et une concentration en faveur des applications dominantes, mais la course technologique n’est pas terminée et il faut s’attendre à ce que les smartphones intègrent des nouvelles capacités, matérielles et logicielles, qui donneront lieux à des nouvelles applications. Sur le plan matériel, nous n’en sommes qu’au début de l’intégration des senseurs. Les domaines de la santé, de la prévention et du bien-être vont être bouleversés par l’arrivée de capteurs beaucoup plus sensibles et fiables de nos bio-mesures, depuis des choses élémentaires comme la température ou le rythme cardiaque jusque des mesures complexes de type ECG. Ces capacités nouvelles (en particulier par rapport au manque de précision/fiabilité des premières génération) vont donner lieu à des nouvelles applications. De la même façon, le machine learning et les réseaux neuronaux vont s’inviter sur les smartphones pour leur permettre d’analyser notre environnement (images et sons, mais aussi déplacements). Il faut s’attendre à voir apparaitre de multiples applications – y compris les évolutions de celles que nous connaissons déjà – qui vont exploiter ces capacités.

La notion d’application va également devenir de plus en plus polymorphe : des applications mobiles avec interfaces graphique – celles que nous connaissons aujourd’hui - , mais aussi des application mobiles en « tache de fond » qui s’exprimeront par d’autres canaux (e.g., messages ou notifications), des applications dans les plateformes (telles que les applications dans Facebook ou Wechat), des applications intégrées dans les navigateurs, ou des applications natives des OS (des « widgets » associés à des événements) ou des applications associées à des objets, tels que le bouton Nuimo que j’utilise avec plaisir depuis quelques mois. Tout ceci conduit à la notion d’application en tant que système, au lieu d’être une « destination », ce qui est très bien expliqué dans  l’article  « the end of the apps as we know them ». Voici un petit extrait pour vous donner envie de lire cet article : « Most of us building software are no longer designing destinations to drive people to. That was the dominant pattern for a version of the Internet that is disappearing fast. In a world of many different screens and devices, content needs to be broken down into atomic units so that it can work agnostic of the screen size or technology platform. For example, Facebook is not a website or an app. It is an eco-system of objects (people, photos, videos, comments, businesses, brands, etc.) that are aggregated in many different ways through people’s newsfeeds, timelines and pages, and delivered to a range of devices, some of which haven’t even been invented yet. So Facebook is not a set of webpages, or screens in an app. It’s a system of objects, and relationships between them ».  Cet article insiste sur l’importance des notifications et d’une approche orientée-évènement, un point sur lequel je ne peux être qu’en agrément.

Pour conclure, je reprendrai le titre de cet article de Techcrunch : « les nouvelles de la mort des apps ont été grandement exagérées », mais il n’en reste pas moins vrai que construire une application satisfaisante reste une aventure très difficile, comme l’explique très bien cet article sur la refonte d’Evernote.