ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Nové kolo rozhovorů mezi USA a Íránem má začít v pátek ve Švýcarsku

Nové kolo rozhovorů mezi Spojenými státy a Íránem začne v pátek ve Švýcarsku, uvedl dnes podle agentury Reuters íránský ministr zahraničí Abbás Arakčí. Nechal se také slyšet, že jakýkoliv izraelský útok na Libanon nebo okupace území by byly porušením dohody s USA.

SpaceX získala z primární nabídky o více než deset miliard dolarů více

Společnost SpaceX, kterou založil Elon Musk, získala z primární nabídky akcií (IPO) o více než deset miliard USD (208,2 miliardy Kč) více, než se původně předpokládalo. Celkový výnos z nabídky tak činil 85,7 miliardy USD, firma původně uváděla, že získala 75 miliard USD. Nabídka SpaceX se stala největší primární nabídkou všech dob.

Ukrajinské drony zasáhly v Moskvě rafinerii, uvedly úřady i Kyjev

Ukrajinské drony v noci na dnešek zasáhly rafinerii v Moskvě, uvedl starosta ruské metropole Sergej Sobjanin. Protivzdušná obrana podle něj zničila přibližně 60 bezpilotních prostředků směřujících na Moskvu. Zásah moskevského ropného zařízení potvrdil také ukrajinský prezident Volodymyr Zelenskyj.

Ceny ropy kolísají. Čeká se na podpis mírové dohody mezi USA a Íránem

Ceny ropy v úterý brzy ráno mírně klesly po zveřejnění detailů rámcové dohody, která má být oficiálně podepsána v pátek ve Švýcarsku. Americké akciové trhy posílily.

Anya Taylor-Joy se vydá do Středozemě

Chystaný film The Lord of the Rings: The Hunt for Gollum rozšiřuje obsazení o další známé jméno. Do nového příběhu ze světa Pána prstenů se přidává Anya Taylor-Joy. Herečka ztvární Seren, elfku z Lesní říše napojenou na krále Thranduila.

Do Íránu budou podle viceprezidenta Vance opět vpuštěni jaderní inspektoři

Jaderní inspektoři se budou moci vrátit do Íránu, bude to důsledek dohody mezi Teheránem a Washingtonem o ukončení války. V rozhovoru se stanicí NBC News to uvedl americký viceprezident J.D. Vance.

Agenta ICE srazil ujíždějící vůz. Padl výstřel

Agenta amerického Imigračního a celního úřadu (ICE) v pondělí v New Jersey srazilo auto při pokusu o zadržení osoby. Agent na ujíždějící vůz vystřelil. Hledanou osobu se zatím zadržet nepodařilo. ICE prosazuje imigrační politiku amerického prezidenta Donalda Trumpa. Nepokoje v několika amerických státech vyvolaly dva incidenty, při nichž zemřeli neozbrojení Američané.

Číňané méně utrácejí, maloobchodní tržby poprvé po letech spadly

Čínská ekonomika vyslala další varovný signál. Maloobchodní tržby v květnu meziročně klesly o 0,6 procenta, což je první propad od prosince 2022. Slabá spotřeba dopadla na druhou největší ekonomiku světa v době, kdy se dál prohlubuje útlum investic a sektor nemovitostí zůstává pod tlakem.

Při havárii amerického bombardéru B-52 zahynulo všech osm členů posádky

Při pondělní nehodě amerického strategického bombardéru B-52 Stratofortress na Edwardsově letecké základně v Kalifornii zahynulo všech osm členů posádky. Letadlo po pádu shořelo a po zhlédnutí záběrů havárie bylo zjištěno, že nikdo nemohl přežít, uvedl podle agentury AP plukovník James Hayes.

Zelenskyj nabídl Putinovi setkání na summitu G7. Moskva podle Kyjeva odmítla

Ukrajinský prezident Volodymyr Zelenskyj tvrdí, že Rusko odmítlo možnost přímého jednání o ukončení války během summitu skupiny G7 ve Francii. Kyjev nyní zvažuje další variantu setkání ve Spojených státech za účasti amerického prezidenta Donalda Trumpa. Pokud Moskva odmítne i tuto nabídku, Ukrajina chce prosazovat další tlak na Kreml.

Japonsko zvýšilo úroky na nejvyšší úroveň za 31 let

Japonská centrální banka zvýšila základní úrokovou sazbu na jedno procento. Jde o nejvyšší úroveň od roku 1995. Bank of Japan reaguje na obavy z dalšího růstu cen, který může přiživovat dražší energie a dopady války na Blízkém východě.

Evropu zasáhla vlna veder, teploty šplhají výrazně nad normál

Západní a střední Evropa zažívají mimořádně teplé období. Teploty v řadě zemí překonávají dlouhodobé průměry o více než deset stupňů a některé státy hlásí rekordně horké květnové dny. Meteorologové očekávají, že horké počasí vydrží ještě několik dní.

Hlavní body rámcové dohody Íránu a USA o ukončení války

Spojené státy a Írán společně s Pákistánem coby vyjednavačem oznámily rámcovou dohodu, která má ukončit válku; příslušné memorandum má být podepsáno v pátek. Agentura Reuters přinesla přehled hlavních informací, které se v této souvislosti objevily:

Cucurella přestoupil z Chelsea do Realu Madrid

Španělský obránce Marc Cucurella mění po čtyřech letech dres. Z Chelsea odchází do Realu Madrid, kde podepsal smlouvu na šest sezon. Podle informací médií zaplatí madridský klub za sedmadvacetiletého reprezentanta zhruba 60 milionů eur. Cucurella se zároveň stal první posilou po návratu trenéra Josého Mourinha na lavičku Realu.

Bednárik připustil odklad slev na jízdné

Studenti a senioři se zatím nemohou spoléhat na to, že se jim od ledna 2027 vrátí 75procentní sleva na jízdné. Ministr dopravy Ivan Bednárik za SPD připustil, že rozhodne až stav rozpočtu. Resort bude potřebovat zhruba dvě miliardy korun, jednání s ministerstvem financí mají přijít v červenci.
Reklama
Reklama
Reklama
Reklama