Google può ora inserire watermark in testi e video generati dall’intelligenza artificiale

Google è da tempo impegnata nello sviluppo di strumenti per identificare e rilevare i contenuti realizzati con l’intelligenza artificiale. Nel 2023, l’azienda ha introdotto SynthIDun’utility in grado di incorporare filigrane impercettibili all’uomo in immagini e canzoni create con l’intelligenza artificiale. E ora sta espandendo questa tecnologia in altri due campi cruciali: generazione di testi e video.

Nell’ambito di I/O 2024, Google DeepMind ha annunciato che SynthID è ora in grado di inserire watermark nel testo creato utilizzando il chatbot Gemini e le esperienze web integrate con l’omonima intelligenza artificiale. Nel caso dei video, questa funzione è disponibile su Vedoil nuovo modello text-to-video che compete con Sora (OpenAI).

Google chiarisce che SynthID non è infallibile, ma che è fondamentale per lo sviluppo di strumenti che consentano di rilevare se determinati contenuti provengono o meno da un’intelligenza artificiale. In un’epoca in cui deepfakes dove è più facile che mai ingannare l’occhio o l’orecchio umano, l’inserimento di watermark si presenta come l’opzione più potabile per certificare la legittimità di alcuni tipi di file e documenti.

L’aspetto interessante è che Google ha promesso di rendere open source la versione di SynthID per applicare filigrane al testo generato dall’intelligenza artificiale. Ciò consentirà agli sviluppatori di altri modelli di utilizzare la stessa tecnologia già disponibile oggi in Gemini.

Come funziona il nuovo watermarking di testo e video di SynthID

Come funzionano i nuovi watermark di testo e video di SynthID | Google

Come funzionano i nuovi watermark per testo e video di SynthID | Google

Nel caso dei video creati con Veo, Google afferma che sono tutti filigranati con un watermark SynthID. Per introdurli, l’azienda ha preso la tecnologia utilizzata nella generazione di immagini fisse e l’ha portata a un altro livello. Sebbene Mountain View non abbia fornito dettagli molto specifici, ha indicato che il marchio identificativo è “impresso” sui pixel di ogni fotogramma del video generato dall’intelligenza artificiale..

LEGGI Chi è CrowdStrike, l'azienda che ha bloccato mezzo mondo con un guasto ai sistemi?

Google insiste sul fatto che i watermark SynthID sono impossibili da rilevare a occhio nudo, ma possono essere individuati rapidamente con un software di identificazione. Nel caso del testo creato dall’intelligenza artificiale, il processo è un po’ più complesso.

I chatbot e i modelli di generazione del testo utilizzano token e un sistema di previsione per generare frasi o interi paragrafi. L’intelligenza artificiale assegna a ogni token un punteggio che rappresenta la percentuale di probabilità che sia corretto nel formulare una risposta coerente alla domanda. prompt inserito dall’utente.

Con SynthID, Google ha sviluppato un metodo che permette di generare la filigrana non appena il testo viene creato. Ecco come lo spiegano i ricercatori di DeepMind:

“SynthID è progettato per incorporare watermark impercettibili direttamente nel processo di generazione del testo. Lo fa introducendo informazioni aggiuntive nella distribuzione dei token al momento della generazione, modulando la probabilità di generazione dei token – il tutto senza compromettere la qualità, l’accuratezza, la creatività o la velocità della generazione del testo.

Il modello finale di punteggi per le scelte di parole del modello, combinato con i punteggi di probabilità aggiustati, è considerato la filigrana. Questo schema di punteggi viene confrontato con lo schema di punteggi previsto per il testo filigranato e non filigranato, il che aiuta SynthID a rilevare se il testo è stato generato da uno strumento di intelligenza artificiale o se potrebbe provenire da altre fonti.”

Google DeepMind.

Google afferma che il watermarking del testo di SynthID funziona al meglio quando gli utenti richiedono la generazione di testi lunghi o con variazioni. Ad esempio, quando qualcuno chiede a Gemini di generare un saggio o diverse versioni dello stesso testo da inviare via e-mail. Il segno di identificazione continua a funzionare anche quando il testo subisce delle modifiche.

LEGGI La truffa del "sì" quando si risponde a una telefonata: cos'è e come evitare le truffe telefoniche

Tuttavia, l’azienda è consapevole che lo strumento è ancora soggetto a limitazioni. Gli algoritmi di identificazione potrebbero non trovare il watermark se il testo viene riscritto o tradotto in un’altra lingua, ad esempio. Si tratta comunque di un passo avanti molto interessante. Nei prossimi mesi, i californiani apriranno questo strumento e ne spiegheremo il funzionamento in modo più dettagliato.