ChatGPT sta per cambiare per sempre. OpenAI ha annunciato l’aggiornamento del suo chatbot ad intelligenza artificiale, che d’ora in poi sarà sarà in grado di parlare e tenere conversazioni ad alta voce con gli utenti. Un’evoluzione drastica che porterà la piattaforma a un altro livello, poiché non sarà più limitata alle interazioni testuali.
Il supporto audio arriverà su ChatGPT attraverso le sue applicazioni per iOS e Android. Chi accede alla nuova versione avrà la possibilità di dialogare direttamente con il chatbot AI, e potranno selezionare la voce che vorranno dargli tra 5 diverse opzioni.
Come spiegato da OpenAI, questa caratteristica di ChatGPT si basa su un nuovo modello di conversione text-to-speech che consente di generare risposte vocali a partire da un campione audio di pochi secondi. Questo, insieme alla collaborazione con doppiatori professionisti, rende più umane le interazioni con l’intelligenza artificiale.
Gli sviluppatori hanno inoltre spiegato che la nuova versione di ChatGPT utilizza il sistema di riconoscimento vocale Sussurro per convertire le domande degli utenti da audio a testo. Nel seguente post su X (Twitter) è possibile vedere come funziona una conversazione parlata con il chatbot.
È importante sottolineare che le opzioni vocali di ChatGPT non saranno abilitate per impostazione predefinita. Coloro che desiderano conversare con il chatbot tramite la voce dovranno abilitarla manualmente in Impostazioni > Nuove funzionalità. Una volta fatto questo, sarà possibile selezionare il tipo di voce che si vuole dare al chatbot.
ChatGPT ora è in grado di vedere, sentire e parlare
Si noti che l’aggiunta delle funzioni vocali avverrà gradualmente. Ciò significa che non tutti gli utenti delle applicazioni mobili ChatGPT saranno in grado di utilizzarle fin dal primo giorno. OpenAI assicura che questa nuova funzionalità sarà attivata gradualmente e sarà disponibile prima per gli abbonati a ChatGPT Plus e Enterprise.. Questo avverrà nel corso delle prossime due settimane.
L’azienda ha dichiarato che limiterà questa tecnologia alle conversazioni con i chatbot all’interno delle app per evitare usi dannosi. “La nuova tecnologia, in grado di creare voci sintetiche realistiche a partire da pochi secondi di voce reale, apre le porte a molte applicazioni creative e orientate all’accessibilità. Tuttavia, queste capacità presentano anche nuovi rischi, come la possibilità che attori malintenzionati impersonino personaggi pubblici o commettano frodi”, ha dichiarato il team di Sam Altman.
Vale la pena ricordare che, con questo aggiornamento, ChatGPT non può solo ascoltare e parlare, , ma anche vedere. Ciò significa che gli utenti delle applicazioni per iOS e Android potranno interagire con il chatbot utilizzando fotografie. Ad esempio, potranno scattare una foto e chiedere all’intelligenza artificiale di aiutarli a completare un particolare compito.
Un fatto interessante è che, oltre a catturare la foto stessa, sarà possibile “disegnare” su una sezione in modo che l’intelligenza artificiale possa metterla a fuoco.. Secondo OpenAI, questa nuova funzione è alimentata da una piattaforma multimodale che si basa sia su GPT-3.5 che su GPT-4.
“Come altre funzioni di ChatGPT, la visione serve ad aiutare l’utente nella vita quotidiana. Lo fa al meglio quando può vedere ciò che voi vedete”, affermano gli sviluppatori. Tuttavia, la startup ha anche applicato delle limitazioni a questa funzione basata sulle immagini. Ciò significa che, ad esempio, non funzionerà quando le foto sono di persone. “Il ChatGPT non è sempre accurato e questi sistemi devono rispettare la privacy delle persone”, ha spiegato OpenAI.