ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

USA zvažují snížení počtu vojáků v Německu, uvedl Trump

Spojené státy zvažují možnost omezit počet amerických jednotek působících v Německu. Uvedl to ve středu americký prezident Donald Trump, podle něhož rozhodnutí padne ve velmi krátké době. Trump v úterý kritizoval německého kancléře Friedricha Merze za údajnou německou neochotu podpořit USA ve válce proti Íránu.

Fed nechal sazby beze změny. Je nejrozpolcenější od roku 1992

Americký Federální rezervní systém (Fed) je nejrozpolcenější od roku 1992. Rada guvernérů většinově hlasovala pro ponechání sazeb beze změny, čtyři její členové ale z různých důvodů hlasovali proti. Zatímco trh práce zůstává stabilní, obavy vzbuzuje rostoucí inflace kvůli válce v Íránu.

Svoboda médií ve světě je nejnižší za 25 let, uvedli Reportéři bez hranic

Svoboda médií ve světě je nejnižší za posledních 25 let, uvedla dnes v pravidelné zprávě mezinárodní nevládní organizace Reportéři bez hranic (RSF). Ve více než polovině ze 180 sledovaných zemí je podle ní situace médií obtížná nebo velmi vážná, zejména vlivem rozšiřování restriktivních zákonů. Česko si v žebříčku proti loňsku o jedno místo pohoršilo na 11. příčku.

Ruské drony zasáhly v noci na dnešek ukrajinskou Oděsu, zranily 18 lidí

Nejméně 18 zraněných si v noci na dnešek vyžádal útok ruských dronů na jihoukrajinské město Oděsa. Útok poškodil obytné budovy, informovala agentura Reuters s odvoláním na oficiální činitele. Byl to druhý ruský útok na Oděsu za tento týden.

Republikáni překreslují volební mapy. Ve hře jsou výsledky voleb

Republikáni se usilovně snaží překreslit mapy volebních obvodů ve svůj prospěch. Floridští zákonodárci schválili nový plán volebních obvodů pro nadcházející volby do Kongresu, které se uskuteční letos v listopadu, a Nejvyšší soud zrušil v Louisianě klíčové ustanovení zákona o volebních právech.

Izrael u Řecka zasáhl proti flotile plující do Gazy, zadržel asi 175 lidí

Izraelské ozbrojené síly zastavily flotilu s humanitární pomocí plující do Pásma Gazy a na palubě více než 20 lodí zadržely asi 175 lidí, které nyní odvážejí do Izraele. S odvoláním na vyjádření izraelského ministerstva zahraničí to píše agentura AFP.

Indické svátky sklizně čelí tlaku klimatu

Jaro v Indii tradičně hýří barvami, hudbou a tancem. Vesnice ožívají slavnostmi spojenými se sklizní. Letos se ale do radosti míchá nejistota. Počasí se mění a zemědělci to cítí na vlastní kůži.

Cena ropy vyskočila nejvýš od roku 2022

Cena ropy prudce roste a světové trhy začínají naplno počítat s tím, že konflikt kolem Íránu jen tak neskončí. Severomořská ropa Brent se dostala nad 122 dolarů za barel, tedy na nejvyšší úroveň od roku 2022. Důvodem je patová situace mezi Spojenými státy a Íránem a téměř uzavřený Hormuzský průliv, kterým běžně proudí významná část světové ropy.

Muž s nožem útočil v Londýně na členy židovské komunity, dva zranil

Útočník v severním Londýně pobodal dva členy židovské komunity, policie jej zadržela. Incident přišel po sérii žhářských útoků na židovské objekty v této oblasti.

Trump tlačí na Írán kvůli dohodě, zvažuje další možnosti

Americký prezident Donald Trump zvažuje další postup v oblasti Hormuzského průlivu, přičemž vyzval Írán k uzavření dohody. Pokračující blokáda ochromuje globální obchodní trasy i energetické trhy už dva měsíce.

Spojené arabské emiráty opouštějí ropný kartel OPEC

Spojené arabské emiráty po téměř šedesáti letech opouštějí OPEC. Rozhodnutí má začít platit 1. května a znamená citelnou ránu pro organizaci, která se dlouhodobě snaží ovlivňovat světové ceny ropy pomocí těžebních limitů. SAE byly jedním z jejích největších producentů.

KOMENTÁŘ: Rozpadá se ropný kartel? Takto trh ovlivní, že Emiráty opouštějí OPEC

Spojené arabské emiráty už v pátek oficiálně vystoupí z Organizace zemí vyvážejících ropu (OPEC). Překvapivé rozhodnutí může vést k větším cenovým výkyvům komodity a také ke snížení vlivu celé organizace. Proč?

William a Kate slaví 15 let manželství. Pár zveřejnil nový snímek s dětmi

Už je to 15 let, co si britský princ William vzal Kate Middleton. Obřad tehdy sledoval celý svět. U příležitosti křišťálové svatby manželé na sociálních sítích zveřejnili novou rodinnou fotografii z velikonočního pobytu v anglickém Cornwallu, na níž jsou se svými třemi dětmi.

Oteplování dělá z aljašských štik hladovější predátory

Oteplování řek na jihu centrální Aljašky mění chování štiky obecné. Nepůvodní dravec v teplejší vodě loví víc ryb a může dál zvyšovat tlak na lososy, jejichž populace už v regionu slábnou.

Bývalý ředitel FBI Comey je obviněn z vyhrožování Trumpovi smrtí

Bývalý ředitel FBI James Comey čelí obvinění z vyhrožování smrtí americkému prezidentovi Donaldu Trumpovi. Toho se měl dopustit na fotografii, kterou krátce zveřejnil na sociálních sítích.
Reklama
Reklama
Reklama
Reklama