1. Introduction
Les chatbots sont ces
petits robots qui ont fait leur apparition sur les plateformes de messaging, de
WeChat à Facebook. Ce serait peu dire que l’engouement
pour les chatbots est un évènement marquant de l’année 2016. Il y a bien
longtemps que le Cluetrain
Manifesto annonçait que les
marchés sont des conversations, mais avec l’arrivée des chatbot le concept du « commerce
conversationnel » a pris un nouvel essor. Ceci conduit Forbes à écrire
« Get ready for the chatbot
revolution : they’re simple, cheap and about to be everywhere”, pour prendre un exemple parmi des centaines.
Au même moment, on constate à la fois un ralentissement dans l’augmentation
de la pénétration des smartphones, et une concentration
de l’usage des apps au profit des blockbusters et au détriment des
nouveaux entrants. Il y a une vraie logique dans l’entrée d’une « phase
plateau » des smartphones, puisque la technologie marque
un temps d’arrêt, et que cela conduit à un ralentissement
des renouvellements, tandis que la pénétration a atteint un niveau qui
n’est pas loin de la saturation, à condition économique constante. Le
ralentissement de la phase de croissance continue que nous avons connu depuis
10 ans se traduit logiquement dans le taux
de chargement des applications. Les places sur les écrans de nos smartphones
sont chères, car elles sont liées à une place dans le « top of mind ». Les expériences qui
« justifient une app », par leur fréquence d’usage et la valeur
apportée restent rares. Dans la très grande majorité des cas, une approche de
« Web app », produite sur le navigateur du mobile – dont les
capacités ne font que progresser-, est amplement
suffisante.
La combinaison de ces deux tendances fait qu’on voit apparaitre
depuis plusieurs mois des articles annonçant la
fin des applications mobiles. Les chatbots vont remplacer les apps parce
qu’ils sont plus faciles à utiliser et ne nécessitent pas de téléchargement. La
fin des apps mobiles n’est pas
un thème nouveau, mais la compétition avec les chatbots devraient porter le
coup de grâce, sans compter les progrès spectaculaires de la reconnaissance
vocale, qui devraient faire du smartphone un objet auquel
on parle.
L’objectif du billet de ce jour est d’essayer de trouver un
compromis – la « voie de la raison » - entre l’enthousiasme justifié
pour les chatbots en tant que nouveau
canal d’interaction et le scepticisme raisonné face au « hype », et en particulier l’idée
que cette approche signifierait la fin des applications mobile. Je partage cet enthousiasme,
et les premières expérimentations auxquelles j’ai pu être associé
confortent mon intérêt, mais je suis
absolument pas convaincu pas les arguments qui prévoient la fin des
applications mobiles. Je pense qu’une révolution arrive, en terme d’interface
homme-machine, mais qu’elle va s’ajouter au reste plus que le remplacer les
autres techniques d’interaction (hormis les quelques cas dans lesquels le
méthodes actuelles sont inefficaces).
Ce billet est organisé selon le plan suivant. La première partie va souligner
l’importance de la conversation – sous forme écrite avec un chatbot ou vocale avec Siri ou Alexa –
comme méthode d’interaction. Même s’il faudra du temps pour avoir des
conversations réellement intelligentes avec les machines, une très grande
partie de nos moments de vie se contentent très bien d’une conversation simple
– ce que je qualifie de « dumb bots »
- qui est à la portée de la technologie d’aujourd’hui et représente un vrai
progrès par rapport aux alternatives – remplir un formulaire sur le Web par
exemple. La seconde partie va rappeler quelques évidences sur le design
d’interaction, pour redécouvrir que tout n’est pas réductible à une
conversation. Nous avons 5 sens, et il faudra continuer d’en profiter,
avec ou sans intelligence artificielle. La dernière partie va s’intéresser
simplement à l’évolution des applications mobiles en co-évolution avec les
chatbots. Les smartphones vont continuer – au moins dans les 10 ans à venir – à
progresser en termes de capacité logicielles et matérielles via l’incorporation
de senseurs. Les applications deviennent des systèmes, dont l’implémentation
est distribuée (mobile et cloud et objets) et dont les interfaces sont
également distribuées.
2. Une révolution se prépare : l’interaction conversationnelle
L’utilisation des chatbots
est un élément de différenciation du moment de la plupart des acteurs
innovants, comme les startups. L’interaction à travers un “agent conversationnel” (chatbot) présente de nombreux avantages,
même si le service reçu est simple. Au-delà du côté « naturel » du
dialogue en langage naturel, le principe de la conversation est à la fois
rassurant et simple. Les premiers retours des utilisateurs pour qui on remplace
un formulaire web par un dialogue simple - qui demande les informations une par
une - sont très positifs. Ce sont les « dumb bots » que je mentionnais plus haut : des chatbots limités dans leurs capacités et
qui interviennent sur des domaines limités. La première étape de la révolution
est maintenant parce que la technologie pour les dumbot est très facilement
disponible et mature, et parce que les bénéfices clients sont déjà réels. Les
plateformes actuelles permettent déjà des réaliser des dialogues plus
conviviaux et plus robustes que l’état de l’art des formulaires web assortis
d’assistants en Javascript. Plus on dispose de nombreux exemples de dialogues,
plus il est possible d’entrainer le chatbot
à donner des réponses pertinentes. Par un effet vertueux, un chatbot qui commence à bien fonctionner
devient un collecteur de dialogues, ce qui permet de continuer à progresser (et
c’est pour cela qu’il faut commencer).
Je peux citer ici à nouveau Norm Judah, le CTO de Microsoft, et
reprendre ses arguments d’un billet
précédent. Les bots permettent d’ouvrir les interactions avec
les services digitaux à de nouvelles familles d’utilisateurs :
- Ceux qui n’ont pas accès à un smartphone où ne sont pas familier avec l’utilisation des apps. Il faut se rappeler que même si la pénétration des smartphones frise la saturation, plus de la moitié des utilisateurs se contentent des apps pré-chargées et n’en ajoute pas d’autres.
- Les utilisateurs qui ne sont pas familiers avec la conceptualisation implicite de la plupart des interfaces utilisateurs du web. La navigation dans les menus, les listes déroulantes, les choix de catégorie qui reposent sur des abstractions, sont autant de barrières en fonction des origines socio-culturelles des utilisateurs.
Si l’état courant des plateformes de bots favorise le choix
réaliste de domaines très précis de dialogue, les « dumb bots » vont devenir de plus en plus « smart »
parce que la reconnaissance du langage va fortement progresser dans les années
à venir. Je vous renvoie à la présentation
que j’ai faire au MEDEF – lors de la journée
co-organisée avec l’AFIA. Le chemin vers les
assistants « vraiment intelligents » sera long. Même à la Singularity
University, Ray Kurzweill pense qu’il faudra encore dix ans avant d’avoir des
conversations convaincantes sur des domaines généraux. Pour l’instant,
lorsqu’il faut traiter des demandes variées, la meilleure méthode est de
combiner l’intelligence humaine et l’intelligence artificielle, à la façon de Wiidii ou de Facebook
M. Mais il faut s’attendre à des progrès rapides et des
étapes marquantes dans cette route vers les assistants « généraux ».
Si vous voulez vous convaincre des progrès rapides dans ce domaine, je vous
recommande la lecture de cet
article, qui relate le fait que les robots de reconnaissance
vocale battent les meilleurs humains en train de « texter » des
messages. Lors d’une compétition organisée par Baidu, la reconnaissance vocale
sur smartphone est 3 fois plus rapide et 20% plus précise que les meilleurs
accros au mobile messaging. Ce
n’est pas un hasard si Andrew Ng déclare : « 2017 will be the year of the conversational computer ».
Si l’on définit le concept de “test de Turing du chatbot
intelligent”, il y a trois paramètres essentiels : le scope de la conversation, la durée de la conversation, et la
sérendipité (est-ce que l’utilisateur pose une question ou est-ce qu’il s’agit
d’apprendre quelque chose qu’on ne sait pas encore être intéressant). Sur une
durée courte, avec un domaine défini et un mode requête, les techniques
actuelles permettent déjà de faire illusion (i.e., « passer le test de
Turing »), comme le témoigne l’exemple
célèbre suivant. Un professeur a décidé de remplacer un de ses
« assistants » pour répondre aux questions des élèves, et cela a très
bien fonctionné. Les experts des chatbots insistent sur l’importance d’un
domaine précis et bien délimité, car cela facilite grandement l’apprentissage
supervisé, et permet d’obtenir une bien plus grande pertinence.
3. Design d’interaction
Ce que nous venons de voir dans la section précédente ne signifie
nullement que les chatbots sont une panacée en termes d’interactions.
Rappelons-nous, suivant une formule célèbre, que le but du design est de minimiser
les frictions et de maximiser le plaisir lors de l’utilisation d’un
produit ou d’in service. Le domaine CMC (Computer
Mediated Communication), auquel j’ai fait de
nombreuses fois référence dans ce
blog, est riche d’enseignement. Chaque canal de communication se caractérise
par sa densité, sa bande passante, sa capacité de feedback (entre autres). Le canal audio a
ses forces et ses faiblesses, tout comme le canal textuel. L’utilisation de
l’image et de la vue supporte une bien plus grande densité d’information. Il ne
viendrait à personne l’idée de remplacer Google maps par un chatbot, même si
certains « use cases » se prêtent au dialogue. De la même façon, le
canal haptique, associé au toucher, permet un excellent niveau de feedback qui
n’est pas accessible via le langage. Ici on peut penser aux applications de
sketching ou de dessins, qui ne sont pas remplaçables par des dialogues.
Au-delà de ces exemples caricaturaux (cf. "un dessin vaut mieux qu’un long
discours"), les interfaces conversationnelles sont un des outils du design
d’interaction, dans une large panoplie de solutions. Le fait que les progrès
des techniques d’apprentissage viennent de faire un progrès spectaculaire et
rendent les interactions conversationnelles robotisées faciles d’accès et
beaucoup plus pertinentes ne modifie pas l’intérêt fondamental d’utiliser
l’ensemble de nos sens pour faciliter le dialogue entre l’humain et la machine.
Sans rentrer dans trop de détail sur ce qui justifierait un billet
séparé, voici quelques réflexions sur l’arrivée des chatbots dans la pratique
du design d’interaction :
- Le design d’interaction est au service de l’expérience, tournée vers le “job to be done” et le “unique value proposition” que le service doit apporter au client. Le choix du meilleur canal doit tenir compte du contexte d’utilisation. Par exemple le canal vocal respecte peu la «privacy » du client et produit une « nuisance sonore » (une externalité négative) qui le rende inadapté à de nombreux usages.
- L’interaction homme-machine est une science, il existe beaucoup de principes et de méthodes fondées sur des expériences validées (clin d’œil à la data science des bots). Beaucoup d’expériences digitales abusent de la puissance des outils et de la richesse des écrans en fournissant beaucoup trop d’information (ce qui a permis à de nombreux acteurs de s’illustrer en prenant le contrepied). A l’inverse, les dialogues répétés et les pages multiples de certaines interfaces Web sont un retour arrière par rapport à la mise à disposition d’information complète.
- Comme nous allons le développer dans la section suivante, il faut s’inspirer de la nature et favoriser la diversité des canaux d’interaction. Il y a des moments où la voix n’est pas adaptée mais il y a clairement des moments où c’est l’approche la plus naturelle, ce qui explique le succès d’Amazon Echo. Réduire l’effort nécessaire – cf. thinking, fast and slow - est un excellent principe de design biomimétique. La conversation est un mode plus confortable que la requête, mais avec un « cout de setup » et une énergie nécessaire supérieure (par exemple, à l’utilisation de Google dans la barre du navigateur).
- Chaque année digitale vient avec ses modes, mais la « « mode précédente de l’environnement cliquable – pour reprendre une très belle formule de Joël de Rosnay – qui utilise les objets connectés comme des éléments du design d’interaction reste extrêmement pertinente. L’expérience favorise le design d’interactions simples, associées à un usage unique. Un exemple simple est celui de la télécommande de la télévision (ou de la set-top box) qui résiste vaillamment à l’introduction de la reconnaissance vocale dans ces objets.
4. La fin des applications n’est pas encore en vue
Pour revenir à la question de l’introduction, le besoin de la
richesse des modes d’interaction donne une première raison de penser que les
chatbots ne vont pas signifier la fin des applications mobiles. Cette diversité
va au contraire conduire à une vision étendue des applications, capables de se
matérialiser sur plusieurs
interfaces utilisateur. Je souscris à ce concept d’interface
utilisateur à la demande « When I
say On-Demand User Interfaces, I mean that the app only appears in a particular
context when necessary and in the format which is most convenient for the user”.
Cet article insiste fort justement sur la notion de
produit. L’application est un produit qui se décline intelligemment sous
plusieurs instanciations en fonction du contexte utilisateur, avec les
interfaces adéquates.
Si
l’on regarde ce que les gens font aujourd’hui avec leurs apps, on retrouve les categories best-sellers: la communications avec
d’autres personnes, les news et le divertissement, les jeux. Dans la plupart
des cas, le canal chatbot n’est pas le mieux adapté et il y a peu de chance que
ces applications disparaissent. Si vous voulez vous en convaincre, regardez les
applications des deux premiers écrans de votre smartphone et comptez celles qui
pourraient être remplacé par un chatbot. L’arrivée des applications vocales – on pense
aux skills d’Alexa et leurs équivalents chez Google – vont donner lieu à des nouvelles
plateformes, mais il s’agit de l’ajout d’un nouvel écosystème
digital, pas de la fin du précédent.
De toutes façons, les chiffres
ne supportent pas les analyses pessimistes
que j’ai cités en introduction. Il y bien un léger tassement et une
concentration en faveur des applications dominantes, mais la course
technologique n’est pas terminée et il faut s’attendre à ce que les smartphones
intègrent des nouvelles capacités, matérielles et logicielles, qui donneront
lieux à des nouvelles applications. Sur le plan matériel, nous n’en sommes
qu’au début de l’intégration des senseurs. Les domaines de la santé, de la
prévention et du bien-être vont être bouleversés par l’arrivée de capteurs
beaucoup plus sensibles et fiables de nos bio-mesures, depuis des choses
élémentaires comme la température ou le rythme cardiaque jusque des mesures
complexes de type ECG. Ces capacités nouvelles (en particulier par rapport
au manque de précision/fiabilité des premières génération) vont
donner lieu à des nouvelles applications. De la même façon, le
machine learning et les réseaux neuronaux vont s’inviter sur les smartphones
pour leur permettre d’analyser notre environnement (images et sons, mais aussi
déplacements). Il faut s’attendre à voir apparaitre de multiples applications –
y compris les évolutions de celles que nous connaissons déjà – qui
vont exploiter ces capacités.
La notion d’application va également devenir de plus en plus
polymorphe : des applications mobiles avec interfaces graphique – celles que
nous connaissons aujourd’hui - , mais aussi des application mobiles en
« tache de fond » qui s’exprimeront par d’autres canaux (e.g.,
messages ou notifications), des applications dans les plateformes (telles que
les applications dans Facebook ou Wechat), des applications intégrées dans les
navigateurs, ou des applications natives des OS (des « widgets »
associés à des événements) ou des applications associées à des objets, tels que
le bouton
Nuimo que j’utilise avec plaisir depuis quelques mois. Tout
ceci conduit à la notion d’application en tant que système, au lieu d’être une
« destination », ce qui est très bien expliqué dans l’article « the
end of the apps as we know them ». Voici un
petit extrait pour vous donner envie de lire cet article : « Most of us building
software are no longer designing destinations to drive people to. That was the dominant pattern for a version of the Internet that is
disappearing fast. In a world of many different screens and devices, content
needs to be broken down into atomic units so that it can work agnostic of the
screen size or technology platform. For example, Facebook is not a website or
an app. It is an eco-system of objects (people, photos, videos, comments,
businesses, brands, etc.) that are aggregated in many different ways through
people’s newsfeeds, timelines and pages, and delivered to a range of devices,
some of which haven’t even been invented yet. So Facebook is not a set of
webpages, or screens in an app. It’s a system of objects, and relationships between them ». Cet article insiste sur l’importance des notifications et d’une
approche orientée-évènement, un point sur lequel je
ne peux être qu’en agrément.
Pour conclure, je reprendrai le titre de cet article de
Techcrunch : « les
nouvelles de la mort des apps ont été grandement exagérées », mais il
n’en reste pas moins vrai que construire une application satisfaisante reste
une aventure très difficile, comme l’explique très bien cet
article sur la refonte d’Evernote.