ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Kolumbii čeká napjaté finále prezidentských voleb

Kolumbijské prezidentské volby míří do druhého kola. V něm se 21. června utkají pravicový populista Abelardo de la Espriella a levicový senátor Iván Cepeda. První kolo ukázalo hluboce rozdělenou zemi, kde voliči dali jasně přednost výrazným politickým pólům před tradičním středem.

CSG získala zakázku od americké armády

Česká zbrojařská skupina CSG posiluje svou pozici na americkém obranném trhu. Její dceřiná společnost Federal Ammunition uzavřela dohodu s americkou armádou, která se týká patentované technologie nábojnic Peak Alloy. Smlouva otevírá cestu k dodávkám až 40 milionů kusů.

Írán zastavuje dialog a výměnu zpráv s USA

Íránský vyjednávací tým zastavuje dialog a předávání zpráv se Spojenými státy pomocí prostředníků, důvodem je izraelské porušování příměří v Libanonu, uvedla dnes agentura Tasním. Zdroj této informace ale nesdělila. Teherán podle agentury hodlá zcela zablokovat Hormuzský průliv, který je významnou dopravní tepnou pro vývoz ropy a plynu z Perského zálivu, a s pomocí spojenců otevřít novou frontu v průlivu Báb al-Mandab, který je klíčovým uzlem pro obchodní plavbu spojující Rudé moře s Adenským zálivem.

KOMENTÁŘ: Už žádná Toyota. Japonský akciový trh korunoval po 22 letech nového vládce

Od roku 2003 platilo, že automobilka Toyota je nejsilnější japonskou společností. Status quo teď ale po dvou dekádách narušil tokijský holding SoftBank. Titul vyrostl díky investicím do AI společností a během půl roku doručil investorům nadstandardní výnos. V čem tkví úspěch SoftBank?

Írán odmítl zprávy o údajně chystané rezignaci prezidenta Pezeškjána

Íránští představitelé označili zprávy o tom, že se íránský prezident Masúd Pezeškján chystá rezignovat, za vymyšlené a za protiíránskou propagandu, jejímž cílem je podkopávat jednotu íránského národa. S odkazem na své zdroje o tom dnes napsala íránská agentura Tasním.

Vláda podnikne kroky k odvolání prezidenta, oznámil Magyar

Maďarský premiér Péter Magyar po dnešním setkání s prezidentem Tamásem Sulyokem prohlásil, že vláda okamžitě zahájí právní kroky nezbytné k výměně prezidenta. Vládní strana Tisza disponuje v parlamentu ústavní většinou. Magyar označuje Sulyoka, který je ve funkci od roku 2024, za loutku předchozího premiéra Viktora Orbána.

Po ruských útocích informují ukrajinské úřady o desítkách raněných

Nejméně osm lidí, včetně tří dětí, utrpělo zranění při útocích ruských dronů v Černihivské oblasti, informovali ukrajinští záchranáři. Dalších šest zraněných si podle záchranářů vyžádal nálet ruských dronů na Oděsu. Devět lidí bylo zraněno při ruských útocích na Charkov a okolí, oznámil šéf správy Charkovské oblasti Oleh Syněhubov. Moskva naopak bez podrobností informovala o likvidaci útočících ukrajinských dronů.

Ropa zdražuje. Trhy znervóznil izraelský postup v Libanonu

Ceny ropy v pondělí 1. června vzrostly o více než dvě procenta. Důvodem je průnik izraelské armády hlouběji do libanonského území. Tento krok, odsouzený mezinárodním společenstvím, vyvolává obavy o pokračující rozhovory mezi USA a Íránem.

Rubio jednal se zástupci Libanonu a Izraele o návrhu plánu na uklidnění situace

Americký ministr zahraničí Marco Rubio hovořil s libanonským prezidentem Josephem Aúnem i izraelským premiérem Benjaminem Netanjahuem o diplomatických jednáních mezi Izraelem a Libanonem a navrhl plán, který by umožnil postupné uklidnění situace. S odvoláním na amerického úředníka to dnes napsala agentura Reuters. Izrael okupuje část Libanonu a ostřeluje mimo jiné pozice libanonské militantní skupiny Hizballáh.

Trump mluví o dohodě. Útoky mezi USA a Íránem ale pokračují

Spojené státy bombardovaly cíle spojené s Íránem v Kuvajtu poté, co islámská republika sestřelila americký dron. Kuvajt informoval, že jeho protivzdušná obrana zachytila několik dronů a raket. I přes vzájemné útoky křehké příměří trvá a jednání o konci války pokračují.

Macron: Francie zadržela tanker plující z Ruska, na který byly uvaleny sankce

Francouzské námořnictvo v Atlantiku zadrželo tanker plující z Ruska, na který byly uvaleny mezinárodní sankce, uvedl na síti X francouzský prezident Emmanuel Macron. Námořnictvo obsadilo plavidlo nazvané Tagor v mezinárodních vodách v neděli při společné operaci s podporou několika partnerů včetně Británie. Podle agentury AFP je to čtvrtý tanker, který Francie takto zastavila.

Výbuch skladu výbušnin v Myanmaru zabil desítky lidí

Silná exploze v severovýchodním Myanmaru připravila o život desítky lidí a další desítky zranila. Neštěstí zasáhlo obec Kaung Tat ve státě Šan poblíž čínských hranic, kterou kontrolují povstalci z Ta'ang National Liberation Army.

Lidstvo už dávno žije na ekologický dluh

Lidstvo žije na obrovský ekologický dluh a současná globální populace už dávno překročila hranici, kterou dokáže Země dlouhodobě unést. Bez drastických změn ve spotřebě zdrojů a přístupu k přírodě hrozí zhroucení ekosystémů, kritický nedostatek potravin i vody a nezvratné zhoršení klimatické krize. Pohodlný život miliard lidí je v současnosti možný jen díky drancování neobnovitelných zásob planety.

Lékaři bez hranic varují: šíření eboly v Kongu je alarmující

Rychlé šíření eboly v Konžské demokratické republice vyvolává vážné obavy zdravotnických organizací. Lékaři bez hranic (MSF) upozorňují, že rozsah epidemie krátce po jejím vyhlášení nemá v historii obdobu.

Volby na Maltě vyhrála vládnoucí Labouristická strana, počtvrté v řadě

Maltský premiér Robert Abela dnes oznámil vítězství své Labouristické strany v předčasných parlamentních volbách, které se konaly v sobotu. Generální tajemník opoziční Nacionalistické strany Charles Bonello v prohlášení pro veřejnoprávní stanici TVM porážku uznal.
Reklama
Reklama
Reklama
Reklama