OpenAI, creatorul ChatGPT, a prezentat în ultima săptămână un instrument numit Voice Engine/Voice Generation, care poate reproduce vocea oricui. Instrumentul a fost testat la scară redusă și are nevoie doar de o înregistrare de 15 secunde a vocii respective.
Tehnologia se bazează pe un API text to speech al companiei și se află în dezvoltare din 2022. O serie de mostre, care arată capacitatea sa, sunt publicate pe site-ul companiei. OpenAI vede următoarele scenarii de utilizare: asistența la citire, traducerea limbajului, dar și asistarea celor cu afecțiuni neurologice degenerative, care afectează vorbirea.
OpenAI oferă acces limitat la platforma text to voice de generare a vocii Voice Engine. Cu ea poți crea o voce sintetică bazându-te pe un clip de 15 secunde cu vocea cuiva. Vocea generată de AI poate citi comenzi text la comandă în aceeași limbă ca vorbitorul sau chiar în alte limbi. Personal văd asta o problemă uriașă pentru actorii sau muzicienii sau celebritățile care citeau audiobook-uri.
Ba chiar și pentru MC și DJ de la radio, pe viitor, ale căror joburi vor fi în pericol. Detalii aveți pe site-ul OpenAI. Mi se pare un pericol și pentru zona de deep fake și apeluri telefonice false de la rude și prieteni solicitând bani spre exemplu, după un „accident”.