Reklama
15.2 C
Czech
Úterý 10. března 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Ruské dronové útoky na Charkov a Dnipro zranily přes 20 lidí

Rusko v noci na dnešek podniklo další sérii dronových útoků na Ukrajinu. V Charkově a Dnipru při nich utrpělo zranění více než 20 lidí, uvedly místní úřady. Naopak Moskva tradičně bez podrobností informuje o likvidaci útočících ukrajinských dronů.

Sestra Kim Čong-una kritizovala USA a Jižní Koreu za společné vojenské cvičení

Sestra severokorejského vůdce Kim Jo-čong v dnešním prohlášení kritizovala USA a Jižní Koreu za uspořádání společného vojenského cvičení a varovala, že jakékoli ohrožení bezpečnosti KLDR bude mít vážné následky. Informovaly o tom agentury AP a Reuters. Spojenci zahájili jedenáctidenní cvičení Freedom Shield (Štít svobody) v pondělí.

Írán je podle ministra zahraničí připraven pokračovat v raketových úderech

Írán je připraven pokračovat v raketových úderech, dokud to bude nutné. V rozhovoru s americkou veřejnoprávní stanicí PBS to prohlásil íránský ministr zahraničí Abbás Arakčí. Poznamenal rovněž, že po amerických a izraelských útocích na jeho zemi neočekává žádná další jednání o íránském jaderném programu.

Ukrajina téměř zcela vytlačila Rusy z Dněpropetrovské oblasti, tvrdí generál

Ukrajina během své nedávné protiofenzivy téměř zcela vytlačila ruská vojska z Dněpropetrovské oblasti. Zbývá osvobodit tři vesnice, uvedl v rozhovoru se serverem RBK-Ukrajina ukrajinský generál Oleksandr Komarenko. Tvrzení nelze ve válečných podmínkách bezprostředně ověřit z nezávislých zdrojů.

Trump poslal ceny ropy dolů, trhy však reagují předčasně

Ceny ropy klesají po několika vyjádřeních amerického prezidenta Donalda Trumpa o tom, že válka s Íránem se chýlí ke konci. Trhy nicméně začaly pracovat s koncem konfliktu ještě dříve, než k němu došlo, varoval expert. Americký dolar po Trumpových komentářích oslabil a akcie posílily.

Izrael čeká dlouhou ofenzivu v Libanonu

Izrael počítá s tím, že boj proti Hizballáhu v Libanonu potrvá déle než současná válka s Íránem, napsaly Financial Times. Operace může pokračovat i po případném příměří s Teheránem a podle izraelských plánů má oslabit hnutí natolik, aby sever země přestal žít ve stínu další evakuace.

Válka s Íránem brzy skončí, ujistil Trump

Americký prezident Donald Trump v pondělí ujistil republikány, že válka s Íránem nepotrvá dlouho. Konflikt nicméně podle něj skončí až ve chvíli, kdy USA splní všechny své válečné cíle. Írán reagoval s tím, že válka skončí, až to dovolí.

Íránská televize označila nového vůdce Modžtabu Chameneího za zraněného ve válce

Moderátoři íránské státní televize při nedělním oznámení jména nového nejvyššího duchovního Modžtaby Chameneího uvedli, že byl zraněn v "ramadánové válce", což je označení, které íránská média používají pro současný konflikt s USA a Izraelem. Analytik ale později v živém vysílání naznačil, že nyní 56letý Chameneí mohl být zraněn v irácko-íránské válce v 80. letech. Jak byl nový vůdce zraněn, tak z vysílání íránské televize není jasné, napsala agentura AP.

KOMENTÁŘ: Trump zlehčuje ropný šok. Uklidní svět uvolnění komoditních rezerv?

Pokračující válka na Blízkém východě vyhnala ceny ropy v jednu chvíli až na cenu 116 dolarů za barel. Napětí na trhu má ulevit plán států skupiny G7 na uvolnění ropných rezerv. O jaké množství černého zlata jde? A jak situaci komentuje prezident Donald Trump?

Výbuch v Lutychu poškodil synagogu. Antisemitský útok, míní belgická vláda

Belgické úřady vyšetřují pondělní výbuch před synagogou v Lutychu na východě země. Exploze poškodila budovu i okolní objekty, incident se obešel bez zranění. Podle představitelů státu šlo o cílený antisemitský čin.

Šéf rakouské veřejnoprávní ORF odstoupil z funkce kvůli obvinění z obtěžování

Šéf veřejnoprávní rakouské rozhlasové a televizní stanice ORF Roland Weissmann dnes z funkce s okamžitou platností odstoupil. Informovala o tom agentura APA s odvoláním na vedení rady této stanice. Weissmanna jedna ze zaměstnankyň obvinila ze sexuálního obtěžování, ten to ale popírá. Jeho právní zástupce oznámil právní kroky.

Trump naznačil, že o konci války s Íránem rozhodnou Spojené státy

Americký prezident Donald Trump v telefonickém rozhovoru s izraelským serverem The Times of Israel (ToI) naznačil, že o konci bojů s Íránem rozhodnou Spojené státy. Zároveň si šéf Bílého domu nemyslí, že bude nutné, aby Izrael ve válce pokračoval bez účasti USA.

Zemřel Joe McDonald, hlas Woodstocku a protiválečné generace

Hudební svět přišel o jednu z výrazných osobností americké kontrakultury 60. let. Joe McDonald se proslavil jako autor protiválečné hymny, která se stala symbolem protestů proti válce ve Vietnamu. Jeho jméno ale zůstává spojené i s legendárním festivalem Woodstock a celou generací, která tehdy hledala vlastní hlas.

Hlavní nádraží ve skotském Glasgow je uzavřeno kvůli požáru

Hlavní nádraží ve skotském Glasgow, které patří k největším v Británii, je uzavřeno na dobu neurčitou kvůli rozsáhlému požáru v jeho blízkém okolí. Uvedl to dnes ráno web BBC News. Budova, kde vypukl požár, se částečně zřítila. Není zcela jasné, jaké škody oheň způsobil v nádražní budově a na infrastruktuře. Nejsou informace o zraněných či mrtvých.
Reklama
Reklama
Reklama
Reklama