2012-2022: 10 anni insieme!
Tempo per la lettura: 13 minuti
L’interazione con agenti intelligenti
omid-armin-AGRtDoZlpYw-unsplash(1)

Teoria della Mente

Quando parliamo della teoria della mente parliamo della teoria della mente altrui. Quindi tutti quei momenti in cui “penso che tu pensi a un concetto, a un’azione”. Tutti quei momenti in cui formuliamo delle ipotesi sul pensiero altrui. Cosa starà pensando in questo momento la persona con la quale sto parlando. Quale intenzione di agire nel mondo avrà. Per capire meglio la teoria della mente dobbiamo andare a toccare i precursori della teoria della mente stessa, quelli che sono quei fenomeni, quelle capacità sulle quali la teoria della mente si basa.

Vediamo una definizione importante: la teoria della mente è “la capacità di capire e prevedere il comportamento sulla base della comprensione degli stati mentali (intenzioni, emozioni, desideri e credenze) propri e altrui”. Si parla in letteratura di reading minds e mind blindness, quindi la capacità di leggere la mente altrui piuttosto che la cecità nel leggere la mente altrui. Quando questa capacità nella persona non è sviluppata si parla di cecità. Questo percorso parte dagli studi di Premack, Wodruff (1978), Wimmer e Perner (1983) e Baron-Choen (1985) che è uno dei principali esperti degli studi su gli infanti e anche su gli scenari che riguardano l’autismo e i disturbi dello spettro autistico proprio perché ciò che caratterizza il disturbo dello spettro autistico è un deficit in questa capacità, la capacità di leggere la mente altrui e di prevedere il comportamento.

Il compito della falsa credenza

Entriamo nella teoria della mente attraverso un compito, il compito di falsa credenza. È il false belief task. In questo compito al soggetto sperimentale si chiede di prevedere come il protagonista di una storia agirà tenendo conto della falsa credenza di questo e non del dato di realtà noto soltanto a lui e allo sperimentatore. Vediamo adesso in cosa consiste. Questo è un compito di natura elementare, basica, ma che ci fa capire quanto siamo in grado di attribuire questo pensiero a delle identità, a dei soggetti. Lo facciamo attraverso questo fumetto che descrive proprio il compito di falsa credenza. Abbiamo due personaggi, abbiamo Sally con il vestito rosso e Anna con il vestito blu. Sally inserisce una palla dentro al cestino e lo fa davanti ad Anne che assiste a questa scena. Cosa succede. Sally, dopo aver inserito il pallone dentro al cestino, se ne va. In assenza di Sally, Anna sposta questa palla dal cestino in una scatola. Il compito si conclude con il ritorno di Sally e con questa domanda al soggetto sperimentale “dov’è cercherà Sally la sua palla?”. Ecco che il soggetto in questo caso è chiamato a leggere ciò che succede nella mente di Sally. In quest’ultima scena Sally è sola, ha due contenitori chiusi e si chiede dove cercherà la palla. Naturalmente avendo la possibilità di leggere la mente di Sally, si risponde che la cercherà nel suo cestino giallo e questo perché naturalmente si potrà interpretare anche quelle che sono le credenze e le convinzioni che stanno nella mente di Sally. Quando non si possiede, invece, questa capacità di legge dentro il nostro personaggio, i soggetti che non hanno questa capacità o non hanno sviluppato completamente questa capacità sostengono che Sally andrà a cercare nella scatola di Anne. Questo compito basico è stato interpretato in letteratura con tanti strumenti diagnostici diversi. Ci serve in questo momento per capire esattamente il tipo di attribuzione di pensiero e di mente di cui stiamo parlando.

Precursori della teoria della mente

Andiamo però a vedere cosa sta dietro lo sviluppo di questa capacità della teoria della mente. Quali sono i precursori. L’attenzione condivisa che è la capacità di condividere con gli altri l’attenzione su oggetti ed eventi nell’ambiente condiviso e come si realizza. Attraverso la condivisione dello sguardo oppure attraverso dei gesti referenziali. Significa che alla base della nostra attribuzione degli stati mentali altrui abbiamo questa possibilità, questa capacità di condividere l’attenzione, il focus attentivo su un target. Siamo in una stanza con i nostri colleghi di lavoro e siamo in grado di condividere l’attenzione su un documento che sarà oggetto del nostro scambio relazionale.

Un altro precursore molto importante della teoria della mente è l’imitazione, la capacità di imitare e di ripetere le azioni svolte da altri a distanza di tempo. La capacità di imitare le azioni altrui costruisce un altro tassello fondamentale, un’altra competenza fondamentale che ci consente di capire partendo dalla riproduzione di un’azione esteriore quello che c’è dietro l’azione; quindi, quello che è il pensiero della persona con la quale siamo in relazione, del nostro interlocutore. Il terzo precursore della teoria della mente è la competenza rispetto al gioco di finzione e il gioco di finzione che emerge nei bambini intorno ai 3 anni implica la capacità disvincolare la rappresentazione della realtà dal suo referente naturale. Nel gioco di finzione si parte da elementi presenti nell’ambiente, ad esempio un gioco, un pupazzo, per costruire sopra questo una realtà altra quindi il giocare con il proprio pupazzo a fare il maestro e lo studente. Ecco che il maestro lo studente è il gioco di finzione che si sgancia dalla realtà come si propone ai nostri sensi per incominciare una realtà fittizia dove al pupazzo vengono attribuiti degli stati mentali, dei pensieri e quindi una mente e così come pure al al soggetto che poi instaura il gioco stesso.

Agency

Parola inglese non direttamente traducibile in italiano, è quel concetto che ci fa riconoscere l’altro come dotato di una propria individualità, ma soprattutto una propria capacità di agire nel mondo. Vediamo adesso questo costrutto. Fin dai primi anni di vita impariamo a leggere la mente altrui e attribuire degli stati mentali all’entità in grado di agire nel mondo: gli agenti. Ecco che quello che abbiamo descritto fino adesso sulla teoria della mente ci è utile per capire qual è la definizione di agente, di quell’entità che ha la capacità di agire nel mondo, ma di cui si possono anche interpretare gli stati mentali, quindi vedere l’azione del mondo, ma anche soprattutto capire quali sono le intenzioni e le motivazioni dietro a quell’azione.

È una proprietà degli esseri animati di agire autonomamente causando a propria volta degli effetti su altri oggetti o su altri agenti e questa è un’ulteriore qualità della agentività, non soltanto la capacità di agire nel mondo, ma anche di provocare delle conseguenze sullo stato del mondo, sullo stato degli oggetti, ma anche su altri agenti; quindi, è un’azione che ha uno scopo legato a un impatto, l’azione che è finalizzata a raggiungere un obiettivo.

La agency costituisce la base per la distinzione tra l’essere animato e inanimato e per comprendere l’intenzione e quindi il comportamento dell’altro concepito come un essere autonomo. Attraverso la comprensione della agentività, noi riusciamo a discriminare il mondo animato il mondo inanimato. Ad esempio, tra i giocattoli possiamo distinguere quegli oggetti che hanno una loro personalità, ma soprattutto una loro capacità di azione autonoma piuttosto che quelli inermi, quelli animati e quelli inanimati.

Computer area social actors (CASA)

L’agentività ci porta a introdurre un dominio, quello del Computer area social actors (CASA) che è un dominio che studia, nell’ambito delle Experience designer e della Human computer interaction, tutti gli scenari nei quali il computer e le tecnologie vengono percepiti come attori sociali, quindi scenari nei quali non soltanto percepiamo il computer come attori sociali, ma li trattiamo come entità sociali di rilievo come se fossero essere umani.

Ad esempio, quando diciamo grazie al nostro computer o piuttosto che quando ci arrabbiamo con esso e imprechiamo perché non ha funzionato o non ha funzionato come ci aspettavamo. Quando il computer mostra dei social cues, degli indizi di socialità che hanno una similarità con quelle mostrate dall’uomo nelle relazioni interpersonali.

Ecco i computer come attori sociali si realizzano quando da parte nostra c’è una predisposizione, una capacità naturale di attribuire degli stati di agentività alla macchina stessa, ma soprattutto quando la macchina inizia a esibire alcuni comportamenti, ci fornisce alcuni indizi di socialità e di interpersonalità.

Entriamo ancora di più nel merito di questo dominio e facendo riferimento al ruolo dell’antropomorfismo e a quelli che sono i principali indizi di socialità (social cues).

1. l’attribuzione di genere
2. l’indizio di fallibilità
3. la capacità di interazione
4. l’indizio di sensibilità

Perché antropomorfismo e social cues?

Il rapporto tra la forma e la funzione, tra l’apparenza e il comportamento e anche parlando degli agenti intelligenti, degli agenti sociali, andiamo a coniugare l’apparenza antropomorfa di un agente e quegli indizi di socialità, quegli indizi legati al comportamento.

Attribuzione di genere

Quando si parla di attribuzione di genere ci si riferisce alla propensione naturale che abbiamo a interpretare la sembianza di un agente virandola verso un genere, maschile o femminile o anche verso una neutralità di generi.

Questo avviene spontaneamente perché utilizziamo le stesse categorie che utilizziamo per conoscere la realtà sociale che ci circonda. Quando si realizza questo si inizia a entrare in questa relazione che ha una caratteristica di socialità perché usiamo le categorie che riguardano la socialità umana.

L’indizio di fallibilità

Quando noi interagiamo con una macchina abbiamo l’aspettativa che questa macchina si comporti con regolarità, che esibisca sempre la stessa risposta a una data richiesta, ma nell’interazione con gli agenti sociali questo aspetto si modifica, questa nostra aspettativa si modifica. Siamo noi che in qualche modo cerchiamo degli indizi di fallibilità proprio per riconoscere che stiamo interagendo con un agente che ha più caratteristiche di somiglianza con l’umano o il vivente e molto meno con la artificiale e la macchina e ci aspettiamo che inciampi in qualche modo, che sia fattibile, che non sempre risponda in maniera perfetta, efficace o efficiente.
Questi due aspetti, l’attribuzione di genere e l’indizio di fallibilità, naturalmente sono legati a una capacità più estesa di entrare in una interazione, di interagire o in maniera reattiva o in maniera proattiva, quindi ci aspettiamo che l’agente intelligente, l’agente che può entrare in relazione di socialità con noi possa stimolare lui stesso l’interazione, ma anche reagire a una stimolazione.

L’indizio di sensibilità

L’indizio di sensibilità ha a che fare con le risposte emotive. Ci aspettiamo che possa rispondere a tono emotivamente parlando, quindi mi aspetto che se l’interazione per me ha un connotato di irritazione, può suscitare una risposta che o asseconda questa mia irritazione oppure la modella, prova a modificarla.

Questi aspetti ci servono per capire la complessità dello scenario dell’interazione sociale e ci consentono anche di andare a vedere alcuni esempi legati all’antropomorfismo che è sfruttato nell’industrial design relativamente a tutti gli oggetti che ci circondano proprio come invito a questa interazione più interpersonale con gli oggetti.

Partiamo da alcune interazioni preterintenzionali che non vogliono, né nel caso del binocolo né nel caso dell’idrante, indurre nessuna relazione di socialità vera a e propria, ma a riconoscere più direttamente un oggetto perché sebbene non abbia bisogno di entrarci in relazione posso identificarlo. Siamo in quello che avviene nella preterintenzionalità, quindi prima che io formuli delle intenzioni di relazione sociale.

Questa caratteristica di raffigurazione antropomorfa è stata sfruttata nel mondo del product design ampiamente. Qui abbiamo un esempio del radiofonografo rr126 del 1965. Gli indizi di design antropomorfo, con le manopole che sono disposte in un equilibrio dell’interfaccia del radiofonografo come se fossero i due occhi di un agente e gli altri comandi come se fossero la parte di naso e bocca di un volto umano. Qui abbiamo l’uso di indizi antropomorfi per andare a stimolare un’interazione, un riconoscimento di questo prodotto.

Animacy

Andiamo ancora un passo oltre, parlando dell’animacy, la capacità dell’agente di rappresentare un comportamento animato naturalmente auto diretto quindi è lui stesso, l’agente, che può animarsi. Quando parliamo di animacy, animatezza in italiano, parliamo delle proprietà dinamiche e cinetiche tanto in ambito figurale cromatico quanto in ambito statico e dinamico e quelle caratteristiche che promuovano la sensazione di animatezza. Quindi non è un soltanto un piano di dinamicità dell’oggetto ma anche di estetica e di apparenza formale.

L’animacy ci giustifica tutti gli eventi dotati di movimenti irregolari, non ripetitivi, ma che sono percepiti come animati perché danno l’impressione di un’attività autoriferita quindi che non nasce, ad esempio, su una palla perché la palla è stata conferita una forza, una spinta, un calcio e quindi si muove, non perché animata, ma perché spinta fisicamente, quanto piuttosto a quegli eventi il movimento non è dettato dalla regolarità delle leggi della fisica, ma dalla regolarità e in questa irregolarità andiamo a rintracciare delle intenzioni di agentività e di comportamento animato.

Un esempio molto celebre di questo concetto è l’animazione di due triangoli e un disco, il celebre esperimento di Heider e Simmel del 1944 dove i due triangoli e il disco vengono animati in questa sequenza di comportamenti sullo schermo a raccontare una sequenza di interazioni che i due sperimentatori utilizzano per supportare il racconto di una storia, di uno scenario quindi in questo protocollo i due sperimentatori propongono il video e poi chiedono ai soggetti di a raccontare cosa è successo nel movimento tra i due triangoli e il cerchio. Lo storytelling che nasce è sempre di riconoscere queste forme geometriche come degli agenti. In una celebre resoconto di Heider e Simmel i soggetti raccontavano questo movimento come la storia dei due amanti in un mondo dimensionale, proprio perché il cerchio il cerchio piccolo e la palla hanno questa relazione di confidenza, di intimità.

Questi aspetti di viaggio intimità sono ancora di più resi visibili da quegli scenari di interazione uomo-robot dove, come in questo caso il progetto con la foca robot PARO del 2004 sviluppato in una collaborazione tra l’Università di Siena e l’AIST (un istituto di ricerca in Giappone) abbiamo potuto sperimentare con i colleghi il ruolo di un agente sociale, di un mediatore sociale, in attività di riabilitazione psicomotoria. Quindi l’agente di cui stiamo parlando è una foca robot che è stato sperimentato dal 2004 al 2015 in tanti contesti con il ruolo di mediare la relazione sociale sfruttando le qualità materiali, naturalmente la sua consistenza fisica materiale di robot, e anche le qualità espressive. Il robot che è in grado di battere gli occhi piuttosto che di emettere suoni e muovere le zampe. Il robot si è pensato proprio per stimolare situazioni di accudimento come quella raffigurata nell’immagine. Accudimento, relazione su canali di emotività e anche focus di uno scambio triadico, quindi l’oggetto che media anche la relazione tra le persone che lo toccano, che entrano in contatto con lui.

Progettare l’interazione con gli agenti intelligenti

Andiamo adesso a sviluppare e ad approfondire quegli elementi oggetto del design dell’esperienza con gli agenti intelligenti. E quali indizi definire per una attribuzione di agenzia.

1. I visual cues, gli indizi di natura visuale, l’apparenza e la figura del nostro agente, quale deve essere il look and feel che andiamo a definire per conferire un’identità di agente, un’identità che possa permetterci di strutturare tutta la conversazione con l’agente stesso.

2. Identity cues. Il nome, il ruolo, le eventuali metafore. Quando ci accingiamo alla progettazione di un agente, di un’entità relazionale, è fondamentale andare a definirne l’identità in termini anche di nomi, quando andiamo a battezzare il nostro agente, piuttosto che di ruolo che è un aspetto fondamentale. Il nostro agente sarà un mediatore di relazioni sociali, oppure avrà il ruolo di un assistente oppure avrà il ruolo di un suggeritore oppure avrà il ruolo di un insegnante e quindi di una figura, di un’entità che è stata progettato per supportare un percorso di apprendimento. La scelta del ruolo e dell’identità deve riflettersi su tanti aspetti come pure quello del nome. Il nome suggerisce un carattere, suggerisce un’identità anche di genere, conferisce al mio agente lo status, ad esempio, di animale perché ho usato un nome che viene utilizzato prevalentemente per gli animali domestici piuttosto che uno status più vicino a un essere umano perché ho usato un nome proprio di persona.

3. Conversational cues. Parliamo di tutti quegli indizi che supportano la conversazione e che costruiscono la mimica di un linguaggio non necessariamente come nel caso del robot PARO, il linguaggio di cui parliamo è verbale, ma parliamo sicuramente di una conversazione che si instaura, della capacità del nostro agente di costruire, stimolare uno scambio conversazionale su canali non verbali, verbali o espressivi dell’agente stesso.
Proseguendo con un’analisi più di natura tassonomica, possiamo proporre questa tassonomia di tutti quegli indizi di socialità degli agenti conversazionali dove abbiamo naturalmente nella parte alta quegli aspetti più legati al comportamento verbale, il contenuto o lo stile, andando a controllare, nella conversazione, ad esempio, l’uso e la forza di un linguaggio piuttosto che la varietà del lessico.
Accanto agli indizi verbali e agli indizi visuali possiamo toccare aspetti di emozione, espressività emotiva, di apparenza, di prossemica e di cinetica con la prospettiva di andare a controllare una serie di movimenti del nostro agente. Ad esempio, i movimenti del volto e l’espressione facciale, la gestualità. A fianco a questi due aspetti, quello verbale e quello visuale, abbiamo anche gli aspetti legati al canale uditivo o quegli indizi che invece sono meno legati agli aspetti immediatamente visibili, ma che hanno a che fare con la reattività di un agente chronemics oppure con l’esperienza tattile, la haptics, quindi quelle informazioni che l’agente mi suggerisce non tanto attraverso il verbale, ma ad esempio, attraverso la temperatura. Quando abbiamo sperimentato il robot PARO era in grado anche di comunicare deipropri stati interni attraverso la vibrazione oppure un leggero cambiamento di temperatura interna. Quindi parliamo di suoni, vocalizzi, tempi di risposta. Questi aspetti sono quelli che devono essere armonizzati nel design.
Cosa succede quando partiamo da aspetti singoli per arrivare a una conversazione? Lo vediamo con le parole di Hall e Maeda “a good conversation is more than an exchange of phrases; it begins with an unspoken agreement and success with cooperation towards a goal”. I due autori ci propongono una visione olistica della conversazione con un agente che non è tanto uno scambio informativo, ma che porta la relazione verso un accordo tra i due soggetti per il raggiungimento di uno scopo.

Come avviene la progettazione di questa conversazione con gli agenti?

Ponendo attenzione all’esperienza, diversi momenti dell’esperienza della persona corrispondono a diversi compiti che l’agente deve raggiungere. In buona sostanza, qual è l’obiettivo per il quale stiamo progettando il nostro agente intelligente.

Qual è l’esperienza che il nostro agente intelligente deve andare a costruire. Sarà pensato per gestire i reclami di un acquirente su un sito di eCommerce, sarà pensato per mediare la relazione tra terapeuta è un paziente? Diversi scopi saranno posti in relazione a diverse esperienze.

È necessario individuare questi momenti per capire le qualità della agente da progettare, viene prima lo scopo, la finalità dell’esperienza che si vuole costruire e poi la qualità intrinseca della gente stesso.

L’importanza dei ruoli

I ruoli sono necessari per fornire il supporto più appropriato agli utenti nel momento giusto della loro esperienza. Un agente che sia ricco nel supportare l’esperienza di interazione, di relazionalità, è un’agente che sa giocare ruoli diversi e che può supportare l’utente, può consigliare l’utente oppure può metterlo in allerta, ma deve farlo nei momenti giusti di un’esperienza, quindi supportarlo, ma quando l’utente deve ad esempio effettuare una scelta in un catalogo oppure in allerta, ad esempio quando una transazione non è andata a buon fine perché la carta utilizzata, il metodo utilizzato, può presentare delle criticità. Ecco il ruolo è in relazione all’esperienza e ai diversi momenti dell’esperienza stessa.

Lo stile di comunicazione fornisce poi una guida da seguire per creare esperienze di conversazioni significative con gli agenti e progettare il loro comportamento di conseguenza. Abbiamo detto dell’identità, del ruolo, ma è importante anche lo stile di comunicazione nella nostra relazione con l’agente che ha il ruolo di assistente, di concierge, di docente. Questo ruolo dovrà essere supportato, corroborato, da uno stile che sia corrispondente. Se è il docente dovrà interagire con uno stile che è di rassicurazione, di spiegazione, di guida. Questo è fondamentale per noi per riconoscere un’identità stabile e coerente.

Le risorse visive: visual cues

Naturalmente la progettazione delle risorse visive, visual cues, ma le identità degli agenti devono essere comunicate facendo leva anche sulle componenti visive. Se sto pensando a un docente dovrò conferire anche una apparenza e delle qualità visive che possano far riconoscere al mio utilizzatore quell’agente come un docente, conferendogli un’autorevolezza, una struttura legata a quel ruolo e a quello scopo.

I robot antropomorfi hanno delle forme geometriche, il design del look and feel, dell’apparenza del nostro character, può ampliare la nostra anche sull’ambito artistico. Sembianze antropomorfe legate a un ruolo, piuttosto che legate a una fiction, ciascun character di questi ha una sua storia da raccontare, ha una sua identità, un suo stile potenziale di interazione.

Le caratteristiche di look and feel, gli indizi visuali ci consentono di vedere una entità con la quale riprodurre esattamente gli stessi canoni della socialità umana proprio perché abbiamo davanti nell’apparenza, ma anche nel comportamento, una integrazione sapiente di tutti gli indizi per costruire una conversazione ricca.

Per riepilogare

Se dovessimo immaginare un modello di interaction design per l’agente artificiale, l’elemento principale da cui partire sicuramente sarebbe la funzione degli obiettivi per i quali costruiamo il nostro agente e dei servizi che dovrà fornire. Sia che possano essere servizi di socialità, di aiuto, servizi informativi o di correzione di un comportamento. Gli obiettivi ci consentiranno di focalizzarci sul ciclo dell’esperienza e il journey del nostro utilizzatore finale, in quali fasi il nostro agente dovrà interagire con gli utenti finali.In queste diverse fasi, quali ruoli dovrà ricoprire.

Rispetto ai ruoli da ricoprire si adatteranno e si modelleranno gli stili di comunicazione. Potremmo avere uno stile assertivo, di correzione di un comportamento, o uno stile di rassicurazione. In accoppiata alla progettazione degli stili di comunicazione, naturalmente le qualità visuali ed espressive del nostro agente.

In copertina Foto di Omid Armin su Unsplash

fonte uninettuno

Pubblicato
29 Marzo 2023
Matteo Mannucci
Matteo Mannucci
Owner MaMaStudiOs
Digital Designer, Full Stack Web Developer,
Dr. Informatica umanistica, Dr. Discipline Psicosociali, Poeta
Adoro la montagna dove mi piace trascorrere il mio tempo libero, facendo passeggiate
o correndo nei boschi, per seguire o tracciare nuovi percorsi

Potrebbe interessarti

Inizia la chat
1
Bisogno di aiuto?
Benvenuto in MaMaStudiOs
Ciao e benvenuto!
Posso esserti di aiuto?