ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Maďarsko musí urychlit reformy, aby získalo zmrazené fondy EU, uvedla šéfka EK

Maďarsko potřebuje urychleně pracovat na reformách, které jsou potřeba k uvolnění zmrazených unijních fondů. Po telefonátu s maďarským opozičním lídrem a vítězem nedělních voleb Péterem Magyarem to dnes uvedla předsedkyně Evropské komise Ursula von der Leyen. Maďarsko se podle ní po volbách vrátilo do samého srdce Evropy, kam vždy patřilo.

Taylor Swift získala nejvíc nominací na American Music Awards 2026

American Music Awards letos znovu ukazují, kdo právě kraluje hudební scéně. Nejvíc nominací získala Taylor Swift, ale těsně za ní se drží i další velká jména a nováčci, kteří letos patří k nejvýraznějším objevům.

Bývalý student na střední škole v Turecku začal střílet po žácích, šestnáct lidí zranil

Střelec na střední škole v jihovýchodním Turecku zahájil palbu po žácích. Útočník, přibližně osmnáctiletý muž, zranil nejméně šestnáct lidí, pak obrátil zbraň proti sobě a zastřelil se.

Ropovod Družba bude opět funkční do konce dubna, řekl Zelenskyj

Ropovod Družba bude opět funkční do konce dubna. Na tiskové konferenci po jednání s německým kancléřem Friedrichem Merzem to dnes v Berlíně řekl ukrajinský prezident Volodymyr Zelenskyj. V lednu ropovod na západě Ukrajiny poškodil ruský dronový útok. Maďarsko a Slovensko, do kterých ropovod přepravoval ruskou ropu, obviňovaly Kyjev, že s jeho opravou schválně otálí.

Meloni: Itálie pozastavuje obrannou dohodu s Izraelem

Italská vláda pozastavila automatické prodlužování dohody o spolupráci v oblasti obrany s Izraelem kvůli současné situaci na Blízkém východě a několika konkrétním incidentům. V úterý to oznámila premiérka Giorgia Meloni.

Ruské drony útočily na ukrajinský přístav Izmajil, poškodily panamskou loď

Ruské drony v noci na dnešek zaútočily na přístav Izmajil v Oděské oblasti na jihu Ukrajiny a poškodily loď plující pod panamskou vlajkou. Další dron zasáhl civilní obchodní plavidlo plující pod vlajkou Libérie; při útoku nebyl nikdo zraněn. Informoval o tom ukrajinský vicepremiér Oleksij Kuleba, kterého citovala agentura Reuters.

Japonská centrální banka podpořila růst bitcoinu

Bitcoin se v pondělí dostal nad 74 tisíc dolarů a jedním z důvodů byla i změna tónu z Japonska. Guvernér tamní centrální banky Kazuo Ueda naznačil, že na zasedání 28. dubna nejspíš nepřijde další zvýšení sazeb. Pro riziková aktiva je to důležitý signál, protože část trhu dál stojí na levném financování v jenech.

Ceny ropy klesají. Naději na dohodu s Íránem tlumí obavy z další eskalace

Ceny ropy v úterý klesly, přestože napětí na Blízkém východě zůstává vysoké. Trhy reagují na kombinaci dvou protichůdných faktorů. Na jedné straně zohledňují eskalaci v podobě americké blokády íránských přístavů, na straně druhé opatrnou naději, že Washington a Teherán by mohly pokračovat v jednáních.

V Baltském moři umírá keporkak, úřady ukončily záchranu

Desetimetrový samec keporkaka, který se před několika týdny dostal do mělkých vod u severního pobřeží Německa, zřejmě nepřežije. Poté, co opakovaně uvízl v mělčinách, nyní leží v malé zátoce poblíž ostrova Poel a záchranné týmy otevřeně přiznávají, že jeho záchrana není možná. Úřady a odborníci proto vyzývají veřejnost, aby nechala zvíře v klidu prožít jeho zbývající dny.

Zakladatel Evergrande se přiznal k podvodu

Zakladatel čínské developerské společnosti Evergrande, Sü Ťia-jin, se u soudu přiznal k několika trestným činům včetně podvodů při získávání financí a úplatkářství. Případ uzavírá pád jednoho z nejvýraznějších podnikatelů, který symbolizoval vzestup i krizi čínského realitního trhu.

Vance: USA dosáhly v rozhovorech s Íránem pokroku, Teherán nyní musí jednat

Spojené státy v rozhovorech s Íránem dosáhly značného pokroku. V rozhovoru se stanicí Fox News to v noci na dnešek prohlásil americký viceprezident J. D. Vance, který jednání v pákistánské metropoli Islámábádu za americkou stranu vedl. Rozhovory skončily v neděli bez dohody, podle Vanceho je nyní na Teheránu, aby jednal.

Skandál v USA: Vlivný demokrat rezignuje kvůli obviněním ze sexuálního napadení

Americký kongresman Eric Swalwell oznámil, že rezignuje na svůj mandát ve Sněmovně reprezentantů. Rozhodnutí přichází po sérii závažných obvinění ze sexuálního obtěžování a v době, kdy se proti deokratovi rozbíhá etické vyšetřování i trestní prověrky.

Španělský premiér Sánchez jednal s čínským prezidentem Siem o užších vztazích

Španělský premiér Pedro Sánchez dnes pokračuje v návštěvě Číny, kde se setkal s prezidentem Si Ťin-pchingem. Oba představitelé slíbili, že prohloubí vzájemné vztahy obou zemí, a zároveň se zavázali chránit globální mír v době, kdy se světový řád podle slov Si Ťin-pchinga "rozpadá", napsala agentura Reuters.

Magyar chce pozastavit zprávy veřejnoprávních médií, dokud nebudou nestranné

Vítěz nedělních parlamentních voleb v Maďarsku Péter Magyar a jeho strana Tisza chtějí pozastavit zpravodajství veřejnoprávních médií, dokud nebudou moci zajistit nestranné zpravodajství. Magyar to dnes řekl podle agentury Reuters.

Zlatí orli se mohou vrátit do Anglie po více než 150 letech

Zlatí orli by se mohli znovu objevit na anglickém nebi. Po více než 150 letech absence se rýsuje plán na jejich návrat. Vláda už uvolnila milion liber na program obnovy a první mláďata by mohla být vypuštěna už příští rok.
Reklama
Reklama
Reklama
Reklama