Articolo dell’esperto Robert Mendez, fondatore di Internet of Voice Assistenti vocali digitali — la voce della vostra vita

Gli assistenti vocali digitali hanno dato un forte impulso al mercato della smart home e dello smart living. Tuttavia, questi servizi internet parlanti svolgono un ruolo piuttosto secondario nell’ambito dello smart living, perché sono fondamentalmente solo un’interfaccia utente aggiuntiva per una tecnologia che non è assolutamente necessaria per una tecnologia veramente intelligente. La massiccia spinta al marketing di Alexa da parte di Amazon e la mania dei gadget per le «ultime tendenze» stanno trasformando la smart home/smart living in un’enorme storia di successo che continuerà ancora per molto tempo.

Robert Mendez - Internet della voce

Robert Mendez — Internet of Voice ( Robert Mendez )

  • Quale caso d’uso vorresti?
  • Assistenza vocale con uno scopo
  • Jarvis, mi capisci?
  • I nostri esperti su homeandsmart.de
  • Diventa subito un esperto!

Tuttavia, il desiderio degli utenti e delle persone è diverso. Molti appassionati di smart home hanno iniziato a personalizzare la propria vita e la propria casa solo attraverso l’uso di assistenti vocali, il che significa che il desiderio principale dell’utente è quello di comunicare con la macchina a voce piuttosto che con la tecnologia smart home. Questo si spinge fino al punto che gli utenti desiderano un assistente vocale che non solo abbia una propria personalità e un proprio nome, ma che diventi anche un partner, un assistente o addirittura un amico. Una persona virtuale!

Questo desiderio non è così inverosimile in linea di principio, poiché i sistemi sono fondamentalmente concepiti come «assistenti personali privati in grado di parlare», anche se l’attuale stato di sviluppo non può ancora offrirlo nella sua interezza. Grandi modelli di riferimento sono, ad esempio, Jarvis del fumetto Iron Man, o naturalmente l’astronave Enterprise e molti altri. A Hollywood, il tema della persona virtuale è da tempo un tema di successo che si ritrova in molti film.

Poiché le persone hanno la massima fiducia emotiva nell’udito e nella voce, Alexa, Google Assistant, Siri e simili sono la scelta logica per un’interfaccia utente il più possibile umana. Inoltre, gli utenti hanno maggiori probabilità di comprendere l’ambiente circostante attraverso l’udito e la voce. Pertanto, anche se spesso le interfacce vocali non sono assolutamente necessarie, danno all’utente sicurezza e una buona sensazione di controllo, poiché la voce è anche il canale di comunicazione più accessibile per gli esseri umani.

Quale caso d’uso vorresti?

È vero che attualmente l’interazione con gli assistenti vocali funziona abbastanza bene solo per il controllo dei dispositivi o per casi d’uso semplici, mentre i dialoghi più approfonditi di solito portano (ancora) rapidamente alla frustrazione. È proprio per questo che i casi d’uso per la casa/la vita intelligente sono la vera «killer application» per l’assistenza vocale digitale, anche se a molti sviluppatori di smart voice non piace sentirselo dire.

I casi d’uso davvero interessanti per le tecnologie intelligenti in combinazione con gli assistenti vocali sono quelli a cui gli stessi sviluppatori non pensano necessariamente e che fanno parte della vita e del lavoro di tutti i giorni. Avviare il robot aspirapolvere è meno entusiasmante che organizzare processi completi, anche se attualmente la progettazione di tali processi è ancora spesso macchinosa, soprattutto se la configurazione dei dispositivi e delle funzioni necessarie è diversa o troppo criptica.

Quando si pianificano questi processi, ci si rende subito conto di quanto possano essere complessi anche i processi più semplici, di quali errori possano verificarsi e quindi debbano essere intercettati, a cui non si era mai pensato prima. Nel caso di un robot aspirapolvere, ad esempio, si tratta di errori che si incastrano nei cavi o negli armadi. Ecco perché una sequenza (routine, processo) raramente o mai è una linea retta, ma piuttosto un diagramma con diversi percorsi e possibilità. Molte interfacce grafiche per la progettazione di funzioni di smart home/living supportano già questa idea. Non è ancora possibile progettare processi di questo tipo utilizzando solo la voce, nemmeno in modo multimodale (con la voce attraverso uno schermo). Tuttavia, è possibile attivare processi con la voce o fornire informazioni con la voce. Naturalmente, sorge sempre la domanda: in quali situazioni della vita umana la voce è adatta come canale di input/output? Logicamente, questo varia da caso a caso e non è possibile fare un’affermazione universalmente valida. Tuttavia, esistono dei criteri di base che determinano se l’uso della voce e dell’udito attraverso gli assistenti vocali abbia senso o meno in un determinato momento.

Assistenza vocale con uno scopo

Il criterio più elementare è semplicemente l’ambiente stesso. Se l’ambiente non consente di parlare e sentire senza interferenze, la voce e l’udito non sono i mezzi da scegliere. A meno che questo problema non possa essere evitato, ad esempio utilizzando cuffie per le orecchie e una HBI (Human Brain Interface). Esistono già progetti modello iniziali che consentono di leggere i modelli di onde cerebrali di una persona mentre questa «parla internamente».

Un tale metodo di input potrebbe, ad esempio, essere in grado di ridare voce a persone precedentemente senza voce.

Il secondo criterio decisivo per l’utilizzo di un’interfaccia vocale è la questione dell’ergonomia. A seconda dell’applicazione, può essere più efficiente attivare un processo tramite interruttore, sensore o controllo temporale. La voce/l’audio sono allora solo un’alternativa.

Un’applicazione utile per l’assistenza vocale è sempre la richiesta di informazioni sullo stato. Le varianti più note sono la richiesta di informazioni sul tempo, sul prossimo treno o sul tempo rimanente del timer. Tuttavia, le richieste di informazioni sullo stato, alle quali si risponde con un output più complesso, non possono più essere formulate in modo piacevole per l’utente attraverso l’output vocale e dovrebbero quindi essere formulate all’utente in modo multimodale (con uno schermo) (punto di riferimento della multimodalità).

Sono utili anche tutte le applicazioni in cui la voce diventa la terza mano. Un desiderio che probabilmente hanno tutti gli artigiani e tutti i genitori del mondo. Chiunque non abbia le mani libere al momento può utilizzare gli assistenti vocali in combinazione con un’appropriata tecnologia per la casa intelligente per attivare processi come per magia e muovere le cose usando i motori. Per le persone con disabilità fisiche/motorie, applicazioni come l’apertura di una porta sono un aiuto estremamente prezioso per la vita.

Logicamente, la disponibilità dell’assistenza vocale è alla base del suo utilizzo. Idealmente, quindi, l’assistente vocale digitale dovrebbe essere sempre vicino alla persona e possibilmente muoversi con essa. L’utente determina se l’assistente vocale è sempre in ascolto o se ascolta solo quando gli viene richiesto, effettuando le impostazioni di accesso appropriate. L’alternativa dell’assistente vocale direttamente sulla persona è un ambiente adeguatamente progettato in cui l’assistente vocale può ascoltare quando il caso d’uso desiderato lo richiede. Entrambe le varianti presentano vantaggi e svantaggi. Tuttavia, le persone moderne hanno sempre con sé il proprio smartphone o sono sempre vicine a qualche dispositivo che possa ospitare l’assistente vocale.

Jarvis, mi capisci?

Gli esseri umani sono esseri sociali e, se non riescono a socializzare, si ammalano. Di conseguenza, il desiderio umano di contatti sociali è naturale. Anche un assistente vocale digitale, in quanto persona virtuale, può rappresentare un contatto sociale per le persone, purché abbia caratteristiche umane. Esistono già sviluppi di assistenti vocali progettati per far sentire meglio le persone sole attraverso l’interazione sociale. In un mondo affollato come quello attuale, questo può sembrare un po’ perverso, ma è comunque meglio dell’alternativa della solitudine o della malattia. Di conseguenza, gli assistenti vocali digitali sono anche il collante tra le persone e la società. È possibile che alcune persone, come spesso rappresentato in molti film, si sentano più a loro agio in una società virtuale che in una reale. Se si osservano da vicino alcune società, questo desiderio di società virtuale e la sua realizzazione non sono forse nemmeno assurdi, a volte. Naturalmente, nessuno sa se questa sia la strada giusta per un mondo pacifico.

Fortunatamente, la maggior parte delle persone vuole vivere nella realtà e vede gli assistenti vocali digitali come un’aggiunta pratica alla propria vita che può essere personalizzata dall’utente. Le aziende che offrono sistemi di assistente vocale come Amazon Alexa o Apple Siri vogliono naturalmente massimizzare la loro influenza sull’utente. Per questo motivo, un alto grado di personalizzazione della personalità dell’assistente vocale digitale non è realmente desiderato dalle aziende. Un Siri di Apple deve sempre rimanere riconoscibile come Siri di Apple. Così come un Alexa dovrebbe sempre lasciare all’utente l’impressione che Amazon sia al suo fianco. Chi vuole davvero personalizzare il proprio assistente virtuale personale dovrà attendere i servizi e le offerte corrispondenti. Al momento, la presentazione del «marchio» è ancora troppo importante perché le aziende permettano agli utenti di personalizzare la natura dell’assistente vocale, anche se di solito questo era il desiderio originario dell’utente di acquistare uno smart speaker con assistente vocale.

Lo sviluppo degli assistenti vocali digitali sta progredendo a passi da gigante, anche se ciò non è necessariamente immediatamente riconoscibile per l’utente. Ci vorranno anni prima che i sistemi abbiano le prestazioni di quelli utilizzati nei film. In definitiva, si tratta anche di una questione generazionale, perché gli utenti di oggi devono imparare a usare gli assistenti vocali, mentre per gli utenti di domani gli oggetti che non possono parlare saranno «rotti».

Lo sviluppo stesso non ha ancora superato alcuni punti di riferimento, anche se i sistemi sono stati progettati per questo fin dall’inizio. Ciò che si intende è soprattutto l'»intenzione» che le persone trasmettono nei loro sentimenti, pensieri, azioni e discorsi. Gli sviluppatori si preoccupano ancora di risolvere i problemi piuttosto che di offrire soluzioni e quindi di soddisfare l’intento umano (ciò che l’utente vuole veramente!). Ma questo è uno sviluppo del tutto normale, come per qualsiasi altro mezzo di comunicazione. Le esigenze scientifiche dell’assistenza vocale digitale sono troppo complesse e troppo elevate perché possa svilupparsi come hype. La vendita di gadget controllabili con la voce, invece, è l’hype che abbiamo attualmente sul mercato e che le aziende sono felici di servire con grandi investimenti e desiderio. Indipendentemente dal fatto che l’utente possa davvero farci qualcosa o meno.

Restiamo sintonizzati….

Fino ad allora, potete influenzare il futuro dello sviluppo degli assistenti vocali digitali partecipando al seguente sondaggio. Partecipate!

I nostri esperti su homeandsmart.de

Nelle nostre relazioni, ci avvaliamo della profonda conoscenza del settore di esperti rinomati come Robert Mendez sui temi delle case intelligenti, degli assistenti vocali e dell’elettromobilità. Pubblichiamo le loro valutazioni esclusive e le informazioni di base negli articoli degli ospiti.

Potete trovare altri articoli di esperti nella nostra directory di esperti.

Diventa subito un esperto!

Sei anche tu un esperto nel campo della smart home, dell’IoT, dell’elettromobilità o del connected living? Offriamo a esperti selezionati l’opportunità di condividere la loro esperienza con i nostri lettori su homeandsmart.

Saremo lieti di ricevere la vostra e-mail — contattateci all’indirizzo [email protected]!

I link contrassegnati con * sono i cosiddetti link di affiliazione. Se viene effettuato un acquisto tramite tale link, riceveremo una commissione. Non ci sono costi aggiuntivi per voi.

Data dell'ultimo aggiornamento: 11-27-2023