smart office

Com pots fer un assistent de veu per Google Home?

Omnichannel

A SEIDOR Opentrends no només escrivim codi o dissenyem per als usuaris. També estem preparats per parlar amb ells. En aquest sentit, les interfícies d'usuari amb veu (VUI) han revolucionat les interaccions de l'audiència amb els dispositius. Però, com es construeix un assistent de veu?

Hem creat un concepte per Google Home que reserva sales de reunions de manera senzilla. A continuació us mostrem un flux de treball real per conceptualitzar i construir una interfície d'usuari amb veu a través de la tecnologia.

A SEIDOR Opentrends hem creat un concepte amb l'aplicació Google Assistant per reservar una sala de reunions.

Procés

Abans de crear una aplicació d'assistent de Google és imprescindible complir uns requisits tècnics:

  • Un compte de Google per accedir a tots els serveis i eines.
  • Un Google Home o telèfon de Google amb l'assistent/emulador de Google per provar l'aplicació (Us ho passareu molt millor amb un Google Home quan feu tests).
  • Un servidor amb NodeJS on tindrem la lògica de negoci.

Amb aquests elements, vam començar a construir l'assistent de veu amb Google Home. Els passos que vam seguir a SEIDOR Opentrends van ser els següents:

  1. Conceptualització de l'Assistent
  2. Disseny del to de veu
  3. Disseny de l'arbre conversacional
  4. Configuració de l'entorn
  5. Construir amb Dialogflow
  6. Construir el servidor per gestionar la lògica de negoci (NodeJs)
  7. Proves
  8. Implementació
smart office google home
Diseny
  • Co-creació per escollir l'objectiu de l'assistent de veu 
    Amb la premissa de fer l'oficina més intel·ligent, 5 stakeholders d'Opentrends van participar en un exercici per trobar la millor solució al voltant d'aquest concepte. Finalment, vam detectar la necessitat de millorar la gestió per la reserva de les sales de reunions.
  • Definició de veu i to del bot
    En primer lloc, vam definir el to de veu del bot. A través d'un anàlisi ràpid del mercat, vam crear tres possibles personalitats a les quals els vam assignar trets específics de les seves parles: paraules clau i paraules crossa, entonació i ritme. D'aquesta manera, podíem humanitzar el bot i a la vegada, donar consistència per a futurs evolutius.
  • Disseny d'arbre conversacional
    Quines preguntes són essencials? Quin flux de conversa és més adient per a la usabilitat del servei? On podria encallar-se a l'hora de donar respostes adients? L'arbre conversacional preveu tots els punts de contacte entre l'usuari i el bot, així com les respostes a preguntes mal formulades o fins i tot a insults. D'aquesta manera, minimitzem al màxim els possibles errors durant l'ús de l'assistent de veu.

 

Si vols saber com definim la personalitat i to de veu d'un bot o com construïm arbres conversacionals, en aquest article trobaràs tots els detalls.

Tecnologia

En el procés d'analitzar el flux de conversa entre l'usuari i Google Home per reservar una sala de reunions, vam decidir crear 2 accions: els usuaris poden reservar una sala directament o preguntar quina sala de reunions estarà disponible. El flux comença quan l'usuari desperta l'aplicació mitjançant l'expressió "Ok Google, parlar amb reservar sales". Amb això, Dialogflow detecta que és una "welcome intent" i sol·licita al servidor la resposta correcta. Per la seva banda, l'assistent de Google és la part que detecta la veu i transcriu el missatge de veu a text i viceversa.

Quan dissenyem xatbots o VUIs, parlem d'"intents" i de "entities". L'"intent" és la intenció de l'usuari. Identificar l'"intent" vol dir esbrinar què és el que vol l'usuari quan interactua amb un bot. Una "entity" actua com una variable que modifica un "intent".

smart office

Fem servir DialogFlow per crear l'aplicació que rebrà el missatge i esbrinar l'intent i amb això, la millor resposta a l'usuari. DialogFlow es comunicarà amb un servidor NodeJs que és el que fa que l'aplicació sigui intel·ligent: el servidor retornarà el missatge correcte depenent de l'hora, els missatges anteriors i la disponibilitat de les sales de reunions.

El procés de DialogFlow és el següent:

  1. Dialog Flow rep el text i determina a quin agent enviar-lo.
  2. L'agent de Dialogflow identifica l'intent de l'usuari i els passa a l'intent de DialogFlow correcte.
  3. L'intent de Dialogflow fa servir entities per emmagatzemar valors de paràmetres.
  4. L'intent de Dialogflow passa la sol·licitud juntament amb les entities a Fulfilment.
  5. Fulfilment utilitza webhook per cridar al servidor.
smart office

Vam crear un servidor amb NodeJS on tenim la lògica de negoci. El servidor rep el missatge de l'usuari, algunes paraules clau i l'acció (reservar o demanar informació). Amb aquesta informació i el context de la conversa, es connecta al magatzem de dades i extreu dades rellevants.

La part final del projecte va ser provar i capacitar la IA dins DialogFlow. A tal fi, vam demanar la col·laboració de diferents companys de SEIDOR Opentrends i els vam unir al programa de prova. Els nostres companys van dedicar un temps a parlar amb Google Home (dispositiu, telèfon o entorn de prova). Nosaltres treballàvem en DialogFlow, el qual disposa d'una secció de capacitació on podíem veure l'historial de les converses. Va ser molt positiu saber com les persones parlen amb la interfície, ja que aquestes expressaven coses que no podíem imaginar quan definíem el flux! Això ens va permetre enriquir i afegir aquestes noves formes de preguntar o reservar sala a l'aplicació.

Si t'ha agradat aquest article, i estàs interessat en conèixer més sobre la nostra oferta de serveis omnichannel, consulta aquest enllaç.