ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Meloni odmítla Trumpovu historku o společné fotografii

Italská premiérka Giorgia Meloni ostře odmítla tvrzení Donalda Trumpa, že ho na summitu G7 prosila o společnou fotografii. Výrok amerického prezidenta vyvolal v Římě neobvykle tvrdou reakci a naznačil další ochlazení vztahů mezi dvěma politiky, kteří k sobě měli dříve politicky blízko.

Italský šlechtic je podezřelý z brutálních vražd v rámci „lidského safari“ v Sarajevu

Během obléhání Sarajeva měli někteří bohatí cizinci platit vysoké částky za možnost střílet na civilisty. Italská prokuratura nyní prověřuje několik podezřelých, mezi nimi i aristokrata z Milána. Vyšetřovatelé ale zatím nemají dost důkazů, aby kohokoliv postavili před soud.

Ukrajinské úřady informují o mrtvých a raněných po ruských útocích

Nejméně dva lidé byli zabiti a další dva zraněni při ruských útocích na Sumskou oblast na severovýchodě Ukrajiny, uvedla dnes ukrajinská policie. Jedno dítě podle úřadů zemřelo při ruském útoku v Dněpropetrovské oblasti. Podle ukrajinského vicepremiéra Oleksije Kuleby ruské drony zaútočily na dvě civilní lodě v Černém moři. Jednoho námořníka zabily, několik dalších zranily. Naopak o ukrajinských útocích informuje Moskva, aniž by upřesnila případné škody.

Tříletého chlapce v britské zoo napadl ve výběhu krokodýl, policie to šetří jako pokus o vraždu

Policie v hrabství Cambridgeshire potvrdila, že tříletého chlapce, který ve čtvrtek utrpěl život ohrožující zranění v zoologické zahradě Johnsons of Old Hurst nedaleko Huntingdonu, napadl ve svém výběhu krokodýl. Incident policie vyšetřuje jako pokus o vraždu a zadržela muže podezřelého z toho, že chlapce do krokodýlího výběhu vhodil.

V Tokiu hasiči evakuovali asi 300 žáků a učitelů z hořící základní školy

Na základní škole v Tokiu dnes vypukl požár, všech asi 300 studentů a učitelů bylo evakuováno do bezpečí, oznámily místní úřady. Podle japonských médií je lehce zraněno kolem deseti lidí. Agentura Kjódó uvedla, že většina ze zraněných se nadýchala kouře. Příčina požáru se vyšetřuje.

Hormuzským průlivem proplulo 25 lodí, pětina obvyklého provozu

Ve čtvrtek proplulo Hormuzským průlivem 25 lodí, uvedla dnes specializovaná platforma AXSMarine. Podle ní je to nejvíce od poloviny dubna, kdy průliv blokovaly americké a íránské síly, a zhruba pětinásobek denního průměru ze začátku června. Provoz je ale zhruba pětinový ve srovnání s obdobím těsně před začátkem války, kterou na konci února útokem na Írán rozpoutaly Spojené státy spolu s Izraelem.

Obnova rašelinišť zvyšuje pohlcování oxidu uhličitého

Rašeliniště patří mezi nejvýznamnější přírodní zásobárny uhlíku na Zemi. Když se ale odvodní kvůli lesnictví nebo zemědělství, začnou naopak uvolňovat velké množství skleníkových plynů do atmosféry. Nový výzkum ze severního Švédska ukazuje, že návrat vody do vysušených rašelinišť dokáže tento trend poměrně rychle zvrátit. Už během prvních dvou let po obnově začala krajina výrazně lépe pohlcovat oxid uhličitý.

Noční izraelské nálety v Libanonu zabily 16 lidí, uvedla libanonská agentura

Životy nejméně 16 lidí si v noci na dnešek vyžádaly izraelské nálety v Libanonu, uvedla libanonská státní tisková agentura. Izraelská armáda předtím podle médií oznámila, že na několika místech na jihu Libanonu útočila na ozbrojence Hizballáhu a jejich infrastrukturu.

Viceprezident J.D. Vance zatím do Švýcarska neodletí, jednat se dnes nebude

Americký viceprezident J.D. Vance prozatím neodcestuje do Švýcarska na jednání s Íránem, jak se původně plánovalo, oznámily tiskové agentury s odvoláním na Bílý dům. Švýcarské ministerstvo zahraničí následně uvedlo, že se americko-íránská jednání v letovisku Bürgenstock dnes neuskuteční, uvedla agentura Reuters. Odklad budí otázky ohledně toho, co bude dál s prozatimní dohodou s Íránem o ukončení války, poznamenala agentura AP.

Cena ropy dál klesá. Optimismus tlumí odložené rozhovory a trvající přestřelky mezi Izraelem a Hizballáhem

Doprava v Hormuzském průlivu se postupně obnovuje a ceny ropy klesají. Stále se do nich však propisuje nejistota ohledně finální dohody mezi USA a Íránem, o níž budou obě strany jednat během následujících 60 dní. Páteční rozhovory ve Švýcarsku byly odloženy. Izrael poslal letadla nad jižní Libanon, přičemž při bombardování zemřelo 16 lidí. Napětí mezi USA a židovským státem roste. Americký viceprezident J. D. Vance se ostře pustil do izraelských představitelů, kteří kritizovali prezidenta Donalda Trumpa za mírovou dohodu.

Letiště v Nigeru napadli ozbrojenci. Několikahodinové boje si vyžádaly 35 mrtvých

Pětatřicet lidí zemřelo při útoku ozbrojenců na Mezinárodní letiště Diori Hamani v nigerské metropoli Niamey. Mezi mrtvými jsou útočníci, vojáci i civilisté. Boje podle stanice Al-Džazíra trvaly několik hodin. K „sebevražednému útoku“ se přihlásila ozbrojená skupina napojená na Al-Káidu. Cílit měla na vojenskou základnu, která je součástí komplexu letiště.

Nejvyšší soud USA omezil zákaz zbraní pro příležitostné uživatele marihuany

Nejvyšší soud USA jednomyslně rozhodl ve prospěch muže z Texasu, který napadl federální zákaz držení zbraní pro uživatele nelegálních drog. Verdikt se týká hlavně příležitostných uživatelů marihuany a neznamená úplné zrušení zákona.

Cambridge Science Park čeká rozsáhlá proměna

Nejstarší vědecký park v Evropě se může během příštích desetiletí výrazně rozšířit. Trinity College Cambridge představila plán, který počítá s novými laboratořemi, veřejnými zelenými plochami, vodními prvky i lepším propojením s okolím. Projekt má přinést tisíce pracovních míst a zároveň posílit biodiverzitu a odolnost krajiny.

Tichá proměna přírody. AI odhalila znepokojivý trend

Umělá inteligence (AI) pomohla vědcům odhalit, jak výrazně klimatická změna ovlivňuje rostliny po celém světě. Nová studie ukázala, že doba kvetení se za posledních sto let posouvá v průměru o 2,5 dne za desetiletí. Na první pohled jde o nepatrnou změnu, podle odborníků však může narušit vztahy mezi rostlinami a opylovači, na nichž závisí fungování celých ekosystémů.

Apple se dohodl s Intelem na spolupráci při vývoji a výrobě čipů v USA

Americká technologická společnost Apple se dohodla s polovodičovou firmou Intel na spolupráci při vývoji a výrobě čipů ve Spojených státech. Na své sociální síti Truth Social to dnes oznámil americký prezident Donald Trump. Akcie Intelu na tuto zprávu reagovaly výrazným růstem.
Reklama
Reklama
Reklama
Reklama