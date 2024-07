Secondo il team di ricercatori dell’azienda, lo strumento VALL-E 2 è ora in grado di riprodurre le voci delle persone in modo abbastanza convincente e ha raggiunto la “parità umana”.

Nel 2023, Microsoft sviluppo la Valleun sistema di intelligenza artificiale in grado di imitare qualsiasi voce umana entro soli 3 secondi dalla registrazione, e di captare anche il tono emotivo di chi parla.

L’azienda non è rimasta soddisfatta di questo grande progresso, quindi ha deciso di svilupparsiS Val-E2È un modello migliorato che raggiunge la “parità umana”. Per eseguirlo, usi questo strumento LibriSpeech E VCTK Per mappare il testo sull’audio, imitando pronuncia, intonazione e ritmo. Dopo aver ascoltato un breve clip e ricevuto l’input di testo, Val-E2 Produce un suono sintetico identico all’originale.

Nonostante il suo straordinario potenziale, Microsoft È considerato Val-E2 Un progetto di ricerca, che non prevede di essere reso pubblico a causa dei rischi di phishing. Il team suggerisce che potrebbe essere utile nell’istruzione e nell’intrattenimento, ma riconosce questioni etiche e lavorative, come l’imitazione senza consenso e la sostituzione dei doppiatori.

Microsoft mette in guardia contro gli abusi Val-E2, mentre altri sistemi di intelligenza artificiale per la riproduzione vocale, sebbene meno accurati, sono già utilizzati dai criminali informatici. In Spagna una donna è stata truffata con la chiamata vocale clonata del marito. È fondamentale che le persone siano informate di questi sviluppi per prevenire crimini e frodi.