Per chi si è lanciato, in questo scorso Natale, sui regali di tipo elettronico sa che è stato l’anno dello speaker intelligente.

Le nostre case saranno piene di dispositivi come Google Assistant e Alexa, assistenti virtuali che sempre presenti e in ascolto saranno costantemente pronti ad aiutarci se connessi alla domotica dell’appartamento per il controllo dell’illuminazione e del riscaldamento o comunque capaci di assecondare le nostre richieste in fatto di musica, prenotazioni e shopping on line.

L’idea che un cervello di silicio potesse pensare, ragionare, sentire come quello di un uomo circola da decenni. L’elenco è lunghissimo: da AI di Spielberg a Lei di Spike Jonze e per la letteratura moderna con Samuel Butler, Asimov e William Gibson. Un tema ricco di implicazioni sociali ed etiche visto che una caratteristica fondamentale dell’intelligenza artificiale è quella di crescere e svilupparsi autonomamente.

Storicamente gli esseri umani sono stati costretti ad adottare protocolli di comunicazione che i computer possono comprendere, dalla riga di comando alla tastiera alla barra di ricerca. Una svolta nella conversazione al computer significherebbe che la tecnologia si sta adattando per servirci parlando la nostra lingua e non viceversa. Potrebbe anche significare che la singolarità è vicina, quando le nostre menti potranno vivere per sempre fondendosi con le macchine.

Una delle più grandi sfide tecniche è la capacità di dedurre il significato in una conversazione. Una caratteristica umana che è molto difficile da programmare.

Un assistente virtuale (V.a. Virtual assistant in termini anglosassoni) è un personaggio conversazionale generato dal computer che simula un dialogo per fornire informazioni vocali o testuali a un utente tramite un interfaccia. Un Va incorpora l’elaborazione in linguaggio naturale, il controllo del dialogo, la conoscenza dell’utente e un aspetto comportamentale che cambia in base al contenuto e al contesto del dialogo. I principali metodi di interazione sono text-to-text, text-to-speech, speech-to-text e speech-to-speech.

Gli assistenti virtuali vocali sono forse l’inizio di un’evoluzione dell’intelligenza artificiale?

Per i creatori di questi dispositivi la risposta non può che essere sì.

Durante la conferenza di presentazione di Google Duplex, l’assistente virtuale ha prenotato un viaggio senza che l’impiegato dall’altra parte del telefono sospettasse minimamente di aver a che fare con un computer, e tutti noi aprendo una chat di un helpdesk, siamo quasi in dubbio se dall’altra parte ci sia un individuo e non un bot istruito per rispondere a ogni nostra domanda.

Sono passati quasi 70 anni dall’invenzione del “Test di Turing” nato per rispondere a una domanda: “Quando si può affermare che una macchina è pensante?”. Il test di Turing si basa sul gioco dell’imitazione e consiste nel presentare a un “giudice” due diversi individui a cui può far domande (originariamente per indovinare il sesso dei concorrenti). Il test mette al posto di uno dei due individui una macchina e il gioco si trasforma dell’indovinare chi fra i due concorrenti (quello umano che cerca di dissimulare la sua “umanità”) è quello umano.

Sembra che il test sia stato già superato in più di un’occasione ma si basa esclusivamente su una interazione uomo-macchina di tipo testuale. I detrattori del test di Turing non credono infatti che “vincere” il gioco d’imitazione sia sufficiente. Manca infatti la caratteristica fondamentale che definisce l’intelligenza umana: il linguaggio. Ma siamo al punto di svolta… abbiamo gli assistenti virtuali.

Riusciremo in futuro a capire se conversiamo con un computer piuttosto che con un altro essere umano?

Se lo sono chiesti John McCoy e Tomer Ullman due ricercatori del prestigioso Mit, una delle università più importanti al mondo nel campo della ricerca. Proviamo a immaginare questa situazione, per quanto possa sembrarci assurda. Davanti a noi c’è un giudice, imparziale e intelligente, il cui compito è stabilire chi, tra noi e la persona che ci sta accanto, è un essere umano e chi invece è un robot molto evoluto.

Però, essendo una questione di vita o di morte (nei giochi lo è sempre!), per provare che gli esseri umani siamo noi abbiamo a disposizione una sola parola. Quale parola useremo? Messi davanti a questa premessa, i due ricercatori del Mit hanno intervistato un migliaio di persone, selezionando dalle risposte (son venute fuori ben 428 parole), e riproponendo quelle con più riscontro fino a ottenere la parola che noi avremmo detto al giudice per affermare la nostra fiera umanità.

Molti degli intervistati hanno ovviamente scelto parole che hanno a che vedere con la sfera emotiva dell’essere umano, come “gioia”, “dolore”, “memoria” e “moralità”. Il termine più comune è stato però il classico: “amore”.

Con così tante parole però i ricercatori dovevano restringere e focalizzare il risultato, ecco perché come seconda fase a un altro migliaio di persone è stato chiesto di entrare nella parte del giudice e pronunciare la sentenza se avessero sentito 2 tra le parole scelte tra le 428.

Quale parola è pronunciata dall’essere umano e quale dal robot?

La parola che è emersa come la più votata dai giudici per identificare l’essere umano non è stata “amore”, compassione, umano, ma “cacca”.

Insomma, a prescindere dalla scientificità o dalla concretezza dei risultati, questo esperimento è utile per comprendere il modo in cui gli esseri umani si differenziano rispetto alle macchine… ovvero nella cacca.

Approfondimento su HWReload