3.5 C
Czech
Středa 25. února 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Po ruských náletech jsou oběti, pohřešovaní a ranění, uvedly ukrajinské úřady

Nejméně čtyři lidé přišli o život při ruském bombardování vesnice v Záporožské oblasti na jihovýchodě Ukrajiny, oznámili dnes ukrajinští záchranáři. V sousední Dněpropetrovské oblasti záchranáři pátrají po čtyřech lidech, kteří mohou být pod troskami domu zasaženého ruskými řízenými leteckými bombami, oznámil šéf oblastní správy Mykola Lukašuk.

Rodina Nancy Guthrie nabízí milion dolarů za její návrat

Rodina pohřešované Nancy Guthrie vypsala odměnu milion dolarů za informace vedoucí k jejímu návratu. Čtyřiadvacátý den pátrání vystoupila její dcera Savannah Guthrie s emotivní výzvou. Policie dál pracuje s verzí únosu z domu v arizonském Tucsonu.

Severovýchod USA se stále nevzpamatoval, desítky tisíc domácností jsou dál bez elektřiny

Na severovýchodě Spojených států jsou po sněhové bouři nadále desetitisíce lidí bez proudu. Celý region se potýká s nízkými teplotami a pokračuje v odklízení desítek centimetrů sněhu, píší místní média. Bouře, která na východní pobřeží dorazila v neděli večer místního času, byla nejsilnější v pondělí. Podle agentury AP si počasí vyžádalo nejméně jednu oběť. Dnes má region zasáhnout další sněhová bouře menšího rozsahu.

Trump v Kongresu skoro dvě hodiny vychvaloval svou politiku

Americký prezident Donald Trump přednesl v Kongresu dosud nejdelší projev o stavu unie v novodobé historii Spojených států. Od republikánů sklidil bouřlivý potlesk vestoje, zatímco demokraté zůstali na protest sedět.

Indická skládka mramoru láká turisty i vědce

Na okraji města Kishangarh v Rádžasthánu leží místo, které vypadá jako zasněžené hory. Ve skutečnosti jde o obří skládku mramorového odpadu. Bílý prach a kal tu po letech vytvořily krajinu, která připomíná ledovec nebo měsíční povrch. Lidé sem míří za fotkami, filmaři za kulisami a vědci kvůli obavám o zdraví.

Kyle MacLachlan vydá memoár Fictional Selves

Herec, kterého si diváci pamatují jako agenta Dalea Coopera z legendárního seriálu Městečko Twin Peaks, otevírá svou minulost. V nové knize se vrací k ikonickým rolím, začátkům i osobním proměnám. Nechce ale vyprávět jen příběh slavné postavy. Chce ukázat, kolik různých podob během života prožil.

Zelenskyj vyzval Trumpa k návštěvě Kyjeva

Volodymyr Zelenskyj ve výročním projevu vyzval Donalda Trumpa, aby přijel do Kyjeva, a dal najevo, že Ukrajina „nezradí svůj lid“ v žádných jednáních s Ruskem. Čtvrté výročí plnohodnotné invaze spojil s apelem na spravedlivý mír a s připomínkou, že tlak se má obrátit na Moskvu, ne na Kyjev.

Yungblud přiveze Bludfest do Hradce Králové

Britský rocker Yungblud splní slib a vrátí se do Česka ve velkém stylu. Do Hradce Králové přiveze svůj vlastní festival Bludfest. Akce nabídne silná jména i nové objevy. Letos půjde o jedinou zastávku mimo Británii.

Bitcoin spadl pod hranici 63 000 dolarů. Analytici pokles připisují makroekonomickému šoku

Bitcoin se během dneška krátce propadl pod hranici 63 000 dolarů a prohloubil tak několikadenní sérii ztrát. Podle analytiků ale nejde o rozpad trhu ani konec čtyřletého cyklu, nýbrž o kombinaci makroekonomických tlaků a vysoké finanční páky.

Sněhová bouře ochromila severovýchod USA, zrušeny byly tisíce letů

Mohutná zimní bouře s rekordním úhrnem sněhových srážek v pondělí zasáhla severovýchod Spojených států, přičemž způsobila rozsáhlé výpadky elektřiny. Zrušeno bylo také několik tisíc letů. Nejvíce byl zasažen Rhode Island, kde šlo podle místních médií o nejsilnější sněhovou bouři v historii.

Írán se blíží dohodě s Čínou o nákupu protilodních nadzvukových střel

Írán se blíží dohodě s Čínou o nákupu protilodních střel s plochou dráhou letu, napsala dnes agentura Reuters s odvoláním na šest svých zdrojů. Dohoda o čínských střelách CM-302 je téměř dokončena, ale zatím nebylo dohodnuto datum dodání, řekly také tyto zdroje. Podle Reuters ale není jisté, zda Čína s ohledem na zvýšené napětí v regionu nakonec od dohody neustoupí. Na dodávky zbraní do Íránu platí zbrojní embargo OSN, připomněla též agentura Reuters.

V rozvíjejících se zemích sílí zájem o stablecoiny, vede Nigérie

Největší africké ekonomiky Nigérie a Jihoafrická republika v posledních měsících nejrychleji zvyšují poptávku po stablecoinech a zároveň patří k největším optimistům, pokud jde o jejich budoucí využití. Roste i chuť používat stablecoiny běžněji při placení a přijímání výplat, jenže naráží to na slabší akceptaci v obchodech a onlinu.

Ruská operace na Ukrajině zatím nedosáhla cílů a bude pokračovat, řekl Peskov

Ruská vojenská operace na Ukrajině zatím nedosáhla svých cílů a bude pokračovat. To, zda bude dosaženo míru, závisí na Kyjevu. Podle ruské státní agentury TASS to dnes řekl mluvčí Kremlu Dmitrij Peskov. Hovořil v den čtvrtého výročí zahájení rozsáhlé ruské invaze na Ukrajinu.
Reklama
Reklama
Reklama
Reklama