ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Macron poprvé jednal s papežem Lvem XIV. ve Vatikánu, mluvili o konfliktech

Francouzský prezident Emmanuel Macron dnes poprvé jednal ve Vatikánu s papežem Lvem XIV., píší agentura AFP a italská média. Vatikán k schůzi uvedl, že francouzský prezident jednal s papežem a vatikánskými představiteli o konfliktech ve světě. Macron k jednání řekl, že s papežem mají totožné přesvědčení, že usilovat o mír je povinností. Očekávalo se, že jednání se budou týkat mezinárodních krizí, války na Blízkém východě a situace v Libanonu.

Meloni varuje před poplatky v Hormuzském průlivu

Plán Íránu vybírat poplatky od lodí proplouvajících Hormuzským průlivem může zasáhnout světový obchod i dodávky energií. Italská premiérka Giorgia Meloni proto varovala, že podobný krok by mohl změnit obchodní toky a přinést citelné ekonomické dopady.

Kraken otevřel kryptu cestu k účtu u Fedu

Kryptoměnová burza Kraken získala přístup k účtu u americké centrální banky. Jde o první případ, kdy podobný účet získala firma z kryptosektoru, a otevírá to cestu k užšímu propojení digitálních aktiv s tradičním finančním systémem.

Stín, nebo smrt. Vedra už překračují naše limity, šokovalo vědce

Často se mluví o neobyvatelnosti planety v důsledku klimatických změn v budoucnosti. Podle nové studie však takové podmínky nastávají už během těch nejhorších vln veder. Jsme náchylnější k rostoucím teplotám, než se dosud myslelo, varují odborníci. Sami přiznávají, že si budoucnost zatím nedokážou představit.

Kolem jednání USA a Íránu panuje nejistota, Teherán žádá klid zbraní v Libanonu

Nejistota stále panuje kolem na dnešek či sobotu plánovaných mírových jednání mezi Spojenými státy a Íránem v pákistánském Islámábádu, píše stanice BBC. Teherán totiž dal už ve čtvrtek najevo, že účast íránských zástupců závisí na dodržování příměří ve všech oblastech Blízkého východu, včetně Libanonu. To však Izrael porušuje svými nepřestávajícími údery na cíle proíránského libanonského hnutí Hizballáh. Stanice NBC dnes informovala, že poblíž pákistánské letecké základny Nur Chán byl spatřen transportní letoun amerického letectva.

Ukrajinské úřady hlásí dva mrtvé po ruských nočních útocích

Ruské útoky v noci na dnešek v ukrajinské Dněpropetrovské oblasti zabily dva lidi, oznámil ráno na telegramu šéf regionální vojenské správy Oleksandr Hanža. V jihoukrajinském Chersonu je po ruském dronovém útoku zraněná seniorka, o dvou raněných v Sumské oblasti na severovýchodě země informovali ukrajinští záchranáři. Obětí náletu ukrajinských dronů se stal civilista ve Volgogradké oblasti, tvrdí ruské úřady.

Lídryně tchajwanské opozice Čcheng Li-wen se setkala s čínským prezidentem

Čínský prezident Si Ťin-pching se v pátek v Pekingu setkal s předsedkyní hlavní tchajwanské opoziční strany Kuomintang, Čcheng Li-wen. Jde o první návštěvu úřadující hlavy Kuomintangu v Číně za posledních deset let.

Astronauti mise Artemis II se vrací na Zemi, průlet atmosférou bude kritický

Mise Artemis II, při které první lidé od 70. let minulého století obletěli Měsíc, v noci na sobotu SELČ ukončí svou více než milion kilometrů dlouhou cestu. Čtveřice astronautů v kosmické lodi Orion proletí závratnou rychlostí atmosférou a pokud vše půjde podle plánu, dopadne do Tichého oceánu nedaleko západoamerického San Diega.

Izraelem v noci zněly sirény, z Libanonu jsou zprávy o zraněných

Izraelem v noci na dnešek zněly sirény varující před vzdušným útokem libanonského proíránského hnutí Hizballáh. Informoval o tom server The Times of Israel (ToI), podle něhož nejsou hlášena žádná zranění. Libanonská média naopak po izraelském útoku informovala o zraněných lidech a poničených civilních domech, uvedla BBC. Šéfka diplomacie Evropské unie Kaja Kallasová vyzvala k ukončení bojů v Libanonu.

Už mě to nebaví. Starmer kvůli účtům za energie přirovnal Trumpa k Putinovi

Britský premiér Keir Starmer prohlásil, že ho už nebaví sledovat, jak účty za energie v jeho zemi rostou kvůli krokům amerického a ruského prezidenta Donalda Trumpa a Vladimira Putina. Ceny ropy mírně vzrostly po oznámení o poškození energetické infrastruktury v Saúdské Arábii. Drží se však pod psychologickou hranicí 100 dolarů za barel.

Putin vyhlásil velikonoční příměří, Zelenskyj zmínil symetrické kroky

Ruský prezident Vladimir Putin vyhlásil na pravoslavné Velikonoce příměří na Ukrajině. Klid zbraní bude platit v sobotu 11. dubna od 16:00 moskevského času (15:00 SELČ) a v neděli 12. dubna po celý den, uvedla dnes státní agentura TASS. Ukrajinský prezident Volodymyr Zelenskyj následně na síti X uvedl, že jeho země je připravena na symetrické kroky a Kyjev letos navrhoval velikonoční příměří, podle čehož bude jednat. Ukrajina od února 2022 vzdoruje ruské invazi.

Poslali je na dostřel Íránu bez ochrany. Američtí přeživší vojáci promluvili

Vojáci, kteří přežili nejsmrtelnější útok na americké síly od začátku války s Íránem, zpochybnili vyjádření amerického ministra obrany Peta Hegsetha o tom, že protivzdušnou obranou náhodně pronikl dron. Podle nich byla základna v Kuvajtu špatně zabezpečená, přičemž jednotka nebyla na hrozby připravená.

Bílý dům varoval zaměstnance před sázením na predikčních trzích

Zaměstnanci Bílého domu dostali interní varování, aby nevyužívali neveřejné informace k sázení na predikčních trzích. Upozornění přišlo krátce po náhlé změně postoje prezidenta Donalda Trumpa k možnému útoku na íránskou infrastrukturu, která vyvolala podezření kolem načasovaných sázek.

Tornado Alley se posouvá na východ a zvyšuje riziko pro miliony lidí

Tornáda patří mezi nejničivější přírodní jevy v USA. Dlouho se spojovala hlavně s oblastí zvanou Tornado Alley ve střední části země. Teď se ale situace mění. Vědci upozorňují, že hlavní zóna se pomalu posouvá na východ, kde žije více lidí a kde jsou podmínky pro katastrofy složitější.

Chaos kolem vstupenek na MS ve fotbale 2026 rozčílil fanoušky

Fanoušci fotbalu zažili další zklamání při snaze získat vstupenky na mistrovství světa 2026 v USA, Kanadě a Mexiku. Poslední prodejní fáze se změnila v chaos. Lidé čekali dlouhé minuty ve frontě, která je nakonec dovedla na špatné místo. Mnozí přišli o šanci koupit lístky.
Reklama
Reklama
Reklama
Reklama