OpenAI sta già affrontando la sua prima grande controversia dopo l’annuncio di GPT-4o. Il modello linguistico avanzato, la cui principale attrattiva è l’uso del parlato e della conversazione fluente, ha appena la sua voce più popolare dopo essere stato accusato di aver copiato la voce di Scarlett Johansson. L’attrice non si è pronunciata, ma ci sono già che dicono che la mossa dell’azienda arriva sulla scia di una possibile denuncia da parte della Hollywood.
La controversia ruota attorno a Sky, la voce che secondo molti assomiglia in modo inquietante al tono dell’attrice. Al momento si tratta solo di speculazioni e di affermazioni degli utenti, ma OpenAI ha già confermato sui propri social media che stanno eliminando questa opzione vocale dal modello linguistico..
In realtà, l’azienda ha cercato di lavarsi le mani dalla questione rivelando come ha selezionato il voci di GPT-4o e ha chiarito che Sky non imita la voce dell’attrice. Infatti, secondo OpenAI, le voci appartengono a persone reali.
Riteniamo che le voci dell’IA non debbano imitare deliberatamente la voce distintiva di una celebrità: La voce di Sky non è un’imitazione di Scarlett Johansson.ma appartiene a un’altra attrice professionista che usa la propria voce naturale.
Blog OpenAI
Le voci di ChatGPT sono reali
Dopo aver confermato che non si tratta di una copia, OpenAI ha rivelato come sono state selezionate le voci. La cosa più importante è che non sono mai state create con un programma di intelligenza artificiale.. Per rendere ChatGPT e GPT-4o naturali, hanno reclutato pluripremiati direttori di casting e produttori al fine di ottenere un criterio di qualità per la scelta delle voci dei modelli.
Vale la pena di notare che questo team ha lanciato un bando di casting nel maggio 2023 e ha studiato oltre 400 voci di doppiatori professionisti e attori cinematografici.. La selezione finale è stata di 5 voci che attualmente danno vita al sistema vocale del GPT-4o. Tra queste scelte c’erano Cielola copia controversa.
Pochi mesi dopo questa selezione, queste persone sono volate a San Francisco per per realizzare le sessioni di registrazione ed esplorare con il team le possibilità del modello linguistico. OpenAI ha confermato che il processo è durato circa 5 mesi e che gli operatori hanno applicato tariffe ben superiori a quelle stabilite nell’industria del doppiaggio.
Pertanto, tutto lascia pensare che Sky, il abbia presumibilmente copiato la voce di Scarlett JohanssonLa voce di Scarlett Johansson, tuttavia, appartiene a una persona reale e nessun sistema basato sull’intelligenza artificiale ha selezionato i toni giusti per stabilire un collegamento diretto. Tuttavia, non è possibile sapere se OpenAI l’abbia scelta per via della sua somiglianza con l’attrice.
L’azienda ha rifiutato di rivelare l’identità della persona che ha dato voce a Sky per preservare la sua privacy, quindi la polemica rimane nell’aria e le parole di OpenAI, anche se molto interessanti, non possono essere contrastate.
OpenAI uccide Sky e rimane a 4 voci
Tutta questa storia non sembra aver aiutato OpenAI, che ha rimosso la voce Sky fino a nuovo avviso e senza dare troppe spiegazioni. Ma naturalmente la domanda rimane: perché rimuovere una voce che ha richiesto mesi di lavoro e di registrazione se appartiene a una persona reale che non ha nulla a che fare con Scarlett Johansson?
Quando OpenAI lancerà il suo servizio vocale agli utenti di ChatGPT Plus, lo farà con quattro e non cinque opzioni. Ovvero: Breeze, Cove, Ember e Juniper. Al momento non è possibile utilizzare la nuova funzione, quindi dovremo aspettare e vedere se la comunità proporrà sfumature simili per le altre opzioni disponibili.