L’ambito dell’intelligenza artificiale o meglio gli strumenti LLM (Large Language Model – Modello Linguistico Avanzato) generativi, sta diventando pervasivo nelle discussioni sulla tecnologia attuale.
I modelli Linguistici avanzati
Questi strumenti se opportunamente “istruiti” riescono ad elaborare e generare risposte contestuali simili alle risposte che darebbe una persona (con le opportune distinzioni), sta di fatto che con l’avvento di tecnologie come ChatGpt, per citare la più famosa, i campi d applicazioni stanno sconfinando in tutti i territori che riguardano e riguarderanno la vita di tutti.
Oggigiorno la capacita dell’AI di generare testo su argomenti ormai vastissimi e viene combinata con la possibilità di istruire questo strumento per riprodurre la propria voce.
Esistono diversi strumenti per eseguire questa operazione basta visitare ad esempio www.resemble.ai.
Rendere semplice ciò che in realtà è complicato
Anche la formula di istruzione è molto semplice.
Attraverso l’utilizzo di questa tecnologia è possibile tramite un percorso guidato ripetere alcune frasi obbligatorie per fare “imparare” la propria tonalità di voce alla macchina LLM, più grande sarà l’istruzione maggiore aderenza e fedeltà avrà la successiva riproduzione vocale del testo con una voce simile a quella utilizzata.
Il fine etico La banca della voce “Voice for purpose”
È stato recentemente presentato in Italia un progetto per la sanità che rende possibile creare una vera e propria banca della voce.
La banca della voce per la sanità
Da una idea di Pino Insegno, attore e doppiatore, il progetto ha come obbiettivo quello di creare la Banca della Voce con un duplice scopo: il primo è dare a chi la voce l’ha persa e di poter utilizzare la voce donata da altri scegliendone una che è conforme alla propria; il secondo scopo è quello di “salvare” la propria voce che per poterla successivamente utilizzarla a scopi comunicativi in quanto affetti da patologie degenerative che prevedono la perdita progressiva di funzioni fisiche tra le quali anche la voce, come nei casi di persone affette da SLA.
Queste voci, integrate con gli strumenti di comunicazione adottati per questo tipo di patologie, porteranno sicuramene ad un miglioramento della qualità della vita per le persone affette da queste malattie.
Il fine di business
Le applicazioni nel campo degli affari e del lavoro sono ovviamente enormi, pensiamo solamente ai produttori di videoblog come YouTube o di podcast a tema che possono utilizzare queste tecnologie semplicemente scrivendo gli interventi riproducendoli con la propria voce o abbinati a traduttori simultanei che traducano in tempo reale in diverse lingue ma con la voce “originale”.
Spazio alla Fantasia
C’è solamente lo spazio delimitato dalla nostra fantasia per creare situazioni dove l’impiego combinato di questi nuovi componenti tecnologici possano essere impiegati.
Anche più semplicemente utilizzarle come risponditori istruiti che possano svolgere in maniera vocale quello che attualmente viene già fatto dagli ultimi ChatBot per informazioni al pubblico in diverse lingue.
Un aspetto macabro ma possibile
Supponiamo di catalogare la nostra voce per i posteri, siano essi parenti amici o chiunque altro; prendiamo questa “nostra” voce e integriamola con una LLM che abbia assimilato la nostra personalità (questo è già possibile – vedi articolo sulla Fidanzata Virtuale), diamogli in pasto tutti i nostri scritti, appunti notizie sui social, tesi, relazioni documentali, alberi genealogici, fotografie e magari quadri dipinti da noi o creazioni di qualsiasi genere e traduciamo il tutto in una enorme massa di dati a disposizione di un unico strumento che possa parlare, creare immagini e sostenere conversazioni con persone secondo quanto gli è stato dato in pasto.
Cosa otterremo alla fine?
Una copia digitale di noi stessi.
Niente di creativo o senziente che possa generare nuove cose (per il momento) ma che riproduce i nostri atteggiamenti, la nostra voce e in parte anche i nostri comportamenti usuali, insomma una mistificazione di noi stessi ma che permetterebbe ai nostri pronipoti di cogliere un brandello della nostra esistenza semplicemente interagendo con un “Pappagallo Statistico Elettronico”.
Ma tanto loro che ne sanno?
Immagine generata con OpeAI prompt – open mouth splash painting