"Voice Engine" è in grado di replicare voci umane.

E, poco sorprendentemente, OpenAI ne ha limitato l'accesso. Specie in questo periodo di elezioni.

Michele Torbidoni

apr 02, 2024

Voce narrante per articolo

0:00

-5:03

OpenAI ha presentato una nuova frontiera nella tecnologia vocale chiamata "Voice Engine", una soluzione all'avanguardia che trasforma brevi campioni audio in discorsi naturali, ricalcando la voce di una persona specifica. Questo avanzamento apre porte a possibilità entusiasmanti, ma porta con sé anche un set di interrogativi etici non trascurabili. Per ora, OpenAI ha scelto di procedere con cautela, limitando l'accesso a questa tecnologia al fine di valutare attentamente i rischi di un suo possibile utilizzo improprio.

media.licdn.com

Cos’è in grado di fare?

Con appena 15 secondi di audio, "Voice Engine" può creare una copia vocale quasi indistinguibile dall'originale. È in grado di mantenere accenti e inflessioni anche traducendo in lingue differenti.

Le possibilità sono vaste, da assistenti vocali personalizzati che leggono libri ai bambini, alla preservazione dell'accento in traduzioni multilingue, fino a supporti terapeutici per chi ha perso la capacità di parlare. Ecco alcuni esempi:

1) Creazione di un nuovo discorso a partire da un campione audio.

a) Parlato originale di 15 secondi:

0:00

-0:15

b) Audio generato da Voice Engine:

0:00

-0:16

B) Ricostruzione della voce per chi ha perso l’abilità di farsi comprendere per cause neurali o oncologiche.

a) Parlato del paziente

0:00

-0:30

b) Voce del paziente prima registrata prima del problema medico

0:00

-0:15

c) Parlato originale ricostruito in modo intellegibile

0:00

-0:16

Ok, abbiamo anche una chiara questione etica, no?

OpenAI ha introdotto misure come il watermarking per identificare l'origine degli audio generati e monitora attivamente come viene utilizzata la tecnologia, chiedendo agli utenti di rispettare linee guida etiche precise.

La capacità di replicare fedelmente una voce umana solleva preoccupazioni significative su come potrebbe essere sfruttata per scopi fraudolenti o dannosi. OpenAI è pienamente consapevole di questi rischi, soprattutto considerando contesti delicati come le elezioni, e si sta muovendo con prudenza.

Di fronte a queste sfide etiche, OpenAI ha optato per un approccio cauto, concedendo l'accesso alla tecnologia solo a un ristretto numero di sviluppatori e partner selezionati. Questa decisione riflette l'impegno dell'azienda verso lo sviluppo responsabile dell'IA.

Che reazioni fino ad ora?

La presentazione di "Voice Engine" ha stimolato un ampio dibattito sulla clonazione vocale e sulla necessità di regolamentazioni per prevenire abusi. Sebbene molti vedano questa tecnologia come un punto di svolta per la sintesi vocale e le sue applicazioni, la cautela e l'uso responsabile sono fondamentali per navigare in queste acque inesplorate.

In sintesi, "Voice Engine" di OpenAI segna un progresso significativo nella tecnologia di clonazione vocale, promettendo innovazioni in vari campi. Tuttavia, la decisione di OpenAI di limitarne la diffusione evidenzia il paesaggio etico complesso nello sviluppo dell'IA, dove l'innovazione deve essere equilibrata con la consapevolezza e la prevenzione dei rischi di abuso.

Brevi Accelerazioni

Il Museo della Seconda Guerra Mondiale di New Orleans ha lanciato un progetto innovativo che utilizza l'intelligenza artificiale (AI) per consentire ai visitatori di partecipare a conversazioni virtuali con i veterani della Seconda Guerra Mondiale. Questa iniziativa, nota come "Voices From the Front", mira a preservare le storie e le esperienze dei veterani e dei lavoratori del fronte interno risalenti al periodo bellico, molti dei quali sono già deceduti o non sono più in grado di condividere le loro storie di persona a causa dell'età avanzata o di problemi di salute.

La città di New York ha annunciato l'avvio di un programma pilota per testare sistemi di rilevamento delle armi basati sull'intelligenza artificiale nella sua metropolitana. Questa decisione arriva in risposta a una serie di incidenti violenti, tra cui sparatorie e accoltellamenti, che hanno sollevato preoccupazioni sulla sicurezza pubblica nella metropolitana.

Discussione su questo Post

Nessun post

Assolutamente, procediamo.

#nojs-banner { position: fixed; bottom: 0; left: 0; padding: 16px 16px 16px 32px; width: 100%; box-sizing: border-box; background: red; color: white; font-family: -apple-system, "Segoe UI", Roboto, Helvetica, Arial, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol"; font-size: 13px; line-height: 13px; } #nojs-banner a { color: inherit; text-decoration: underline; } This site requires JavaScript to run correctly. Please turn on JavaScript or unblock scripts