ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Dronový útok u Moskvy si vyžádal tři mrtvé

Ukrajina v noci na neděli podnikla jeden z největších dronových útoků na Rusko za celou dobu války. Ruské úřady hlásí více než pět set sestřelených dronů a tři mrtvé v Moskevské oblasti. Útok zasáhl i okolí ruské metropole, letiště Šeremetěvo a oblast u moskevské rafinerie.

WHO vyhlásila kvůli ebole globální zdravotní stav nouze

Světová zdravotnická organizace vyhlásila kvůli šíření eboly v Kongu a Ugandě stav ohrožení veřejného zdraví mezinárodního významu. Nákaza se během krátké doby dostala i do hlavních měst obou zemí a úřady zatím pracují s výraznou nejistotou ohledně skutečného rozsahu epidemie.

Mistrovství světa 2026 může zasáhnout nebezpečné vedro

Fotbalové mistrovství světa v roce 2026 může výrazně ovlivnit extrémní počasí. Nová analýza skupiny World Weather Attribution upozorňuje, že zhruba čtvrtina zápasů se odehraje v podmínkách, které hráčská unie FIFPRO považuje za rizikové. Turnaj hostí Spojené státy, Kanada a Mexiko. Hrát se bude od poloviny června do července, tedy v období nejvyšších letních teplot.

Trumpův sál v Bílém domě narazil v Senátu

Plán republikánů získat miliardu dolarů na bezpečnostní úpravy Bílého domu, které souvisejí i s chystaným Trumpovým tanečním sálem, narazil v Senátu na procedurální problém. Elizabeth MacDonough, která v Senátu dohlíží na výklad procedurálních pravidel, dospěla k závěru, že návrh v současné podobě nesplňuje pravidla pro schvalování rozpočtovým postupem.

Eurovize 2026 má vítěze. Finálový večer ovládla bulharská zpěvačka Dara

Jubilejní 70. ročník Eurovize přinesl velké emoce, překvapivého vítěze i politické napětí, které letos soutěž provázelo od samého začátku. Ve Vídni nakonec slavilo historický úspěch Bulharsko.

Horák vychytal Slovincům výhru nad Českem

Čeští hokejisté na mistrovství světa poprvé klopýtli. Po úvodní výhře nad Dánskem nezvládli druhý zápas ve Fribourgu a se Slovinskem prohráli 2:3 v prodloužení. Outsider slaví historicky první vítězství nad českým týmem, hlavní postavou večera byl brankář Lukáš Horák.

USA se chystají obvinit kubánského vůdce Raúla Castra

Spojené státy se chystají vznést obvinění proti Raúlu Castrovi, který byl několik desetiletí předním lídrem na Kubě, kde má dodnes i ve svých 94 letech velký vliv. O kroku, který zvýší tlak USA na komunistický režim karibské země, dnes informovaly tiskové agentury a další média s odvoláním na zdroje z americké vlády. Podle agentury Reuters se Washington chystá obvinění oznámit ve středu. Mluvčí ministerstva spravedlnosti se k plánu podle stanice CBS odmítl vyjádřit.

Polsko řeší kryptoskandál i novou regulaci

Polský parlament schválil nový zákon o kryptoměnách. Země tím reaguje nejen na evropská pravidla MiCA, která musí členské státy Evropské unie zavést do července, ale také na kauzu kolem burzy Zondacrypto. Tisíce uživatelů se podle vyšetřovatelů stále nemohou dostat ke svým penězům.

Putin příští týden navštíví Čínu, bude jednat s čínským prezidentem

Ruský prezident Vladimir Putin bude příští úterý a středu na návštěvě Číny, oznámil dnes Kreml. Putin bude v Číně jednat se svým čínským protějškem Si Ťin-pchingem o dvoustranných vztazích a vymění si s ním názory na zásadní mezinárodní a regionální otázky, dodal Kreml v prohlášení, z něhož cituje agentura Reuters.

Izrael při útoku v Libanonu zabil šest lidí a dalších 22 zranil

Izraelský útok na centrum civilní obrany v jižním Libanonu zabil nejméně šest lidí, z toho tři zdravotníky. Dalších 22 lidí utrpělo zranění. Informovala o tom agentura Reuters s odvoláním na libanonskou státní tiskovou agenturu. Izrael a Libanon se dnes podle Washingtonu dohodly na prodloužení příměří o 45 dní. Izrael v dubnu rozšířil pozemní invazi do jižního Libanonu, od oznámení příměří 16. dubna boje pokračovaly, i když v nižší intenzitě.

Lékař, který přežil ebolu, varuje před rizikem pro zdravotníky

Na východě Konga se šíří nová epidemie eboly. Úřady evidují stovky podezřelých případů a desítky úmrtí, největší obavy se teď týkají zdravotníků, kteří přicházejí do blízkého kontaktu s nakaženými v nejrizikovější fázi nemoci.

Češi vstoupili do mistrovství světa výhrou nad Dánskem

Čeští hokejisté zvládli první zápas na mistrovství světa ve Švýcarsku. Ve Fribourgu porazili Dánsko 4:1 a do turnaje vstoupili bez větších komplikací. O góly se postarali Dominik Kubalík, Daniel Voženílek, Roman Červenka a Matěj Blümel, v brance si první start na velké mezinárodní akci připsal Josef Kořenář.

Trump váhá s prodejem zbraní Tchaj-wanu

Americký prezident Donald Trump po jednání s čínským prezidentem Si Ťin-pchingem nevyloučil změnu postoje k prodeji zbraní Tchaj-wanu. Nejistý je kvůli tomu i zbrojní balík za 14 miliard dolarů, který Kongres schválil už v lednu.

Ebola se v Kongu může šířit dál. Úřady čekají na potvrzení kmene viru

Ve východní provincii Ituri v Demokratické republice Kongo vypukla nová epidemie eboly. Podle dosavadních údajů bylo zaznamenáno přibližně 246 případů nákazy a 65 úmrtí.

Bohatí investoři hledají jistotu ve staré ekonomice

Rodinné investiční kanceláře se stále víc zajímají o tradiční podniky s hmotným majetkem. Prodejci techniky, rybí farmy nebo zemědělské firmy sice nepůsobí tak lákavě jako technologické start-upy, investorům ale nabízejí stabilitu, hotovostní tok a menší riziko rychlého zastarání kvůli umělé inteligenci.
Reklama
Reklama
Reklama
Reklama