Det er et besnærende konsept; med en kjempekort lydprøve kan Metas siste robot generere klar og overbevisende tale på seks forskjellige språk med den samme stemmen.
Potensiale for misbruk
Selv sier Meta at «potensielle risikoer for misbruk» gjør at de ikke vil gjøre modellen eller koden offentlig tilgjengelig «på dette tidspunktet.»
— Selv om vi synes det er viktig å dele forskningen vår for å videreutvikle kunstig intelligens, er det også viktig å finne den rette balansen mellom åpenhet og ansvarlighet, skriver de.
Finnes kanskje «snille» bruksområder
Voicebox kan gjøre det enklere for for eksempel blinde å høre tekstmeldinger i stemmen til venner, eller gjøre det mulig å «snakke» i forskjellige språk i din egen stemme.
Roboten kan også gjøre enkle redigeringer av lydfiler, som å fjerne hundebjeffing eller bilhorn fra opptak.
Kan brukes til å etterligne
Det er derimot lett å forestille seg potensialet for mulig svindel og etterligninger av kjendiser — eller at noen kan ringe deg opp med stemmen til nære relasjoner og føre en samtale med deg.
Planen er at stemmegeneratorer som dette kan gi deg mer naturlige virtuelle assistenter, men det kan lett bli litt skummelt å høre kjente stemmer «snakke» til deg med datagenerert innhold.
Har laget detektor for modellen
Derfor sier Meta ganske enkelt at de ikke vil slippe ut denne teknologien til offentligheten; den er for farlig.
Samtidig som de lanserer en forskningsrapport som beskriver modellen og publiserer lydklipp generert av den, sier de at de også har bygget en høyeffektiv modell som kan skille mellom ekte tale og den som er generert av Voicebox — som kan være vel så viktig hvis dette noen gang blir offentliggjort.
Les mer: Oversikt fra Meta, Mer detaljert med lydklipp fra Meta, Forskningsrapporten fra Meta.