ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Nejméně dvě lodě se v Hormuzském průlivu dostaly pod palbu

Nejméně dvě obchodní lodě se dostaly pod palbu, když se pokusily proplout Hormuzským průlivem. S odkazem na bezpečnostní zdroje o tom dnes informuje agentura Reuters. Kapitán jednoho tankeru oznámil, že na plavidlo bez varování zahájily palbu čluny íránských revolučních gard.

Uvízlá velryba znovu upozornila na stav oceánů

U německého ostrova Poel už týdny bojuje o život keporkak, který uvízl v mělké vodě Baltského moře. Případ znovu otevírá otázku, jak silně člověk zasahuje do života velryb, ať už lodní dopravou, rybolovem, hlukem pod hladinou nebo proměnou mořského prostředí.

Obří televizní fúze dostala stopku

Americký soud dočasně zastavil spojení dvou velkých televizních společností Nexstar a Tegna. Jde o obchod za zhruba šest miliard dolarů, který by výrazně proměnil trh s místními televizními stanicemi ve Spojených státech.

Jak vznikl spor mezi Trumpem a papežem Lvem

Americký prezident Donald Trump se v posledních dnech ostře pustil do papeže Lva XIV. Spor odstartovaly rozdílné postoje k válce s Íránem a později se rozšířil i na migraci, roli církve a to, jestli má hlava katolické církve komentovat politiku. Z výměny názorů se rychle stal veřejný konflikt, do kterého vstoupili i další američtí politici.

Izrael už nebude bombardovat Libanon, má to zakázané od USA

Izrael už nebude bombardovat Libanon. Má to zakázané od USA, uvedl dnes americký prezident Donald Trump na své síti Truth Social. Doplnil, že Spojené státy budou spolupracovat s Libanonem a odpovídajícím způsobem se vypořádají se situací ohledně proíránského militantního hnutí Hizballáh.

Historická dohoda na dosah? V Libanonu platí dočasné příměří

Americký prezident Donald Trump oznámil platné desetidenní příměří mezi Izraelem a Libanonem a „brzký konec“ války s Íránem, uvedla agentura AP. Příměří slibuje pauzu v bojích a odstranění jedné z překážek pro dohodu mezi Washingtonem, Tel Avivem a Teheránem.

Nový prezident Barmy nařídil zrušení všech rozsudků smrti

Čerstvě zvolený prezident Barmy Min Aun Hlain dnes nařídil zrušit všechny rozsudky ukládající trest smrti, informovala agentura AFP. Jde o první oficiální opatření, které hlava státu od nástupu do funkce zavedla. Prezident a zároveň bývalý šéf armády tak učinil v rámci rozsáhlejší amnestie u příležitosti barmského buddhistického Nového roku Thingyan.

Izrael podle Libanonu porušuje příměří, Hizballáh zaútočil na izraelské vojáky

Izrael pokračuje v bombardování jižního Libanonu i po začátku vyhlášeného příměří, uvedla dnes nad ránem podle agentur Reuters a AFP libanonská média. Militantní šíitské hnutí Hizballáh naproti tomu uvedlo, že v reakci na izraelské útoky bombardovalo skupinu izraelských vojáků na jihu Libanonu. Žárné škody ani oběti nejsou hlášeny. Americký prezident Donald Trump Hizballáh vyzval, aby klid zbraní neporušoval. Generální tajemník OSN António Guterres apeloval na dodržování příměří všemi stranami, píše Reuters.

Bílý dům spouští systém pro navrácení miliard z cel. Má to ale háček

Administrativa amerického prezidenta Donalda Trumpa spustí příští týden slibovaný portál pro navracení peněz z cel uvalených během „Dne osvobození“ na základě legislativy o mezinárodních nouzových ekonomických pravomocích (IEEPA), kterou označil Nejvyšší soud za nezákonnou. Tento krok se setkal s pozitivními ohlasy, odpovědnost za získání svých peněz však klade na samotné dovozce.

Hegseth: Americká blokáda íránských přístavů potrvá tak dlouho, jak bude třeba

Spojené státy budou pokračovat v blokádě íránských přístavů tak dlouho, jak bude třeba, prohlásil dnes šéf Pentagonu Pete Hegseth na tiskové konferenci ve Washingtonu. Americké síly na Blízkém východě jsou podle něj rovněž připraveny obnovit útoky na Írán v případě, že Teherán s Washingtonem neuzavře mírovou dohodu. Ta je podle amerického ministra Íráncům na dosah.

Papež v Kamerunu kritizoval světové lídry za miliardové výdaje na války

Papež Lev XIV. při návštěvě kamerunského města Bamenda ostře kritizoval světové lídry, kteří podle něj kvůli válkám utrácejí miliardy dolarů, místo aby pomohli potřebným. Dodal, že svět pustoší hrstka tyranů, uvedl server Vatican News. Hlava katolické církve se tak vyjádřila poté, co ho americký prezident Donald Trump slovně napadl na sociálních sítích.

Slovensko hodlá blokovat 20. balík sankcí, chce záruky ohledně ropovodu Družba

Slovensko je připraveno blokovat přijetí připravovaného dvacátého balíku sankcí Evropské unie proti Rusku za jeho agresi vůči Ukrajině, dokud Bratislava nedostane záruky ohledně obnovení provozu ropovodu Družba. Řekl to dnes slovenský ministr zahraničí Juraj Blanár. Podle něj Slovensko ale nebude proti uvolnění unijní půjčky pro Ukrajinu ve výši 90 miliard eur (2,2 bilionu korun), kterou dosud blokovalo Maďarsko. To po vítězství opoziční strany Tisza v nedělních parlamentních volbách čeká změna vlády.

Válka otřásá trhy, růst čínské ekonomiky přesto překonal očekávání

Čína je první velkou ekonomikou, která zveřejnila hospodářské výsledky od začátku americko-izraelské války s Íránem. Díky silnému vývozu elektrických a strojírenských výrobků v letošním prvním čtvrtletí se čínská ekonomika nastartovala, přičemž její růst překvapil analytiky, a to i přes dopady konfliktu na ceny energií. To však neznamená, že je druhá největší ekonomika před vnějšími vlivy v bezpečí.
Reklama
Reklama
Reklama
Reklama