ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Porušil přísahu. Hegseth čelí pokusu o impeachment

Demokraté ve Sněmovně reprezentantů ve středu předložili šest článků žaloby proti ministru obrany Petu Hegsethovi, píše list The Guardian. V nich vznesli závažná obvinění týkající se i války s Íránem. Snaha o impeachment nemá šanci na úspěch, po listopadových volbách v Kongresu by se to ale mohlo změnit.

Francie propustila zadržovaný tanker z ruské stínové flotily po zaplacení pokuty

Ropný tanker, který Francie minulý měsíc zadržela ve Středozemním moři a který podle prezidenta Emmanuela Macrona patří k takzvané ruské stínové flotile, opustil francouzské teritoriální vody poté, co majitel lodi zaplatil pokutu. Informovaly o tom agentury s odvoláním na místní úřady.

ANALÝZA: Blokáda Hormuzského průlivu? Trump neměl jinou možnost

Americký prezident Donald Trump v posledních týdnech tlačí na otevření Hormuzského průlivu, klíčového koridoru pro přepravu především ropy, ale i zemního plynu, hnojiv a dalších komodit. Paradoxně však nařídil námořnictvu jeho blokádu. Dopady mohou být bolestivé nejen pro Írán, ale i pro USA, Evropu a Asii. Trumpovi však nic jiného nezbývá. Alternativy jsou totiž ještě riskantnější.

Rusko podle Kyjeva podniklo rozsáhlý vzdušný útok, zahynulo nejméně 15 lidí

Rusko za posledních 24 hodin zaútočilo na Ukrajinu 703 bezpilotními letouny a 44 střelami různého typu, oznámilo dnes ráno ukrajinské letectvo na platformě Telegram. Protivzdušná obrana podle něj zneškodnila 636 dronů a 31 střel. Regionální činitelé ráno informovali o nejméně 15 zabitých civilistech: osmi v Oděse, čtyřech v Kyjevě a třech v Dněpropetrovské oblasti. Rusko si nezaslouží uvolnění globální politiky ani zrušení sankcí, reagoval ukrajinský prezident Volodymyr Zelenskyj. Ruské úřady hlásí dvě oběti ukrajinských útoků.

Spor Trumpa s papežem mění náladu mezi americkými katolíky

Napětí mezi Donaldem Trumpem a Svatým Otcem přerostlo v otevřený konflikt, který rezonuje i mezi věřícími v USA. Kritika už nepřichází jen od tradičních oponentů prezidenta. Ozývají se i konzervativní katolíci, kteří ho dříve podporovali.

Izrael a Libanon mají po 34 letech jednat

Spojené státy mluví o možné diplomatické změně v konfliktu mezi Izraelem a Libanonem. Donald Trump oznámil, že se mají ve čtvrtek poprvé po 34 letech spojit představitelé obou zemí. Zároveň sílí spekulace o tom, že by se boje v Libanonu mohly přiblížit k příměří.

Druhá masová střelba na škole v Turecku v jednom týdnu. Tentokrát čtyři mrtví

Nejméně čtyři lidé přišli o život a další utrpěli zranění při střelbě na střední škole Ayser Çalık v provincii Kahramanmaraş na jihu Turecka. Podle dostupných údajů je mezi zraněnými několik osob v kritickém stavu.

Ye pod tlakem politiků odkládá koncert ve Francii

Ye měl vystoupit v Marseille, místo toho ale koncert odkládá. Americký rapper čelí tlaku politiků i dozvukům svých kontroverzí z posledních let. Jeho návrat se tak zatím odkládá.

KOMENTÁŘ: Válka v Íránu připravila luxusní značky o miliony. Módní byznys sčítá nečekané ztráty

Válka na Blízkém východě odvála turisty z destinací na Arabském poloostrově, což se okamžitě propsalo do tržeb sektoru s luxusním zboží. Francouzský gigant Kering, který stojí za značkami jako Gucci nebo Yves Saint Laurent, hlásí pokles tržeb a výplach na burze. Příbuzné společnosti na tom nejsou o moc lépe.

Slovensko prodloužilo dvojí ceny nafty, zrušilo finanční limit při tankování

Slovensko o dalších 30 dnů prodlouží uplatňování dvojích cen nafty. Současně od pátku zruší stávající maximální limit 400 eur (9740 Kč) pro jedno tankování tohoto paliva u čerpacích stanic. Rozhodla o tom dnes vláda, která tak potvrdila dřívější oznámení premiéra Roberta Fica. Dvojí ceny nafty, které v praxi vedly k vyšším cenám tohoto paliva pro vozidla registrovaná v zahraničí, už kritizovala Evropská komise (EK).

Největší ledovec světa se po téměř 40 letech rozpadl

Kdysi největší ledovec světa A23a definitivně zmizel z mapy. Po téměř čtyřiceti letech od svého vzniku se rozpadl na menší kry a postupně roztál v teplejších vodách jižního Atlantiku. Jeho dlouhá pouť, která měřila tisíce kilometrů, tak dospěla ke svému definitivnímu konci.

Magyar oznámil, že ho maďarský prezident pověří sestavením vlády

Vítěz maďarských voleb Péter Magyar dnes po jednání s prezidentem Tamásem Sulyokem oznámil, že ho hlava státu pověří sestavením nové vlády. Informovala o tom agentura Reuters. Magyarova dosud opoziční strana Tisza získala v nedělních volbách ústavní většinu, a ukončila tak šestnáctiletou vládu Fideszu dosavadního premiéra Viktora Orbána.

Noční ruský útok zabil ženu, několik lidí zranil, uvedla Ukrajina

Ruské útoky dronů a balistických raket na Ukrajinu v noci na dnešek zabily nejméně jednu ženu a několik lidí zranily. Oznámily to ukrajinské úřady, podle kterých úderům čelily mimo jiné města Záporoží, Dnipro či Čerkasy. Na Slovjansk ruská invazní armáda shodila leteckou pumu, zranila jednoho člověka, zničila dětské sportoviště a poničila desítky domů, sdělil šéf městské správy Vadym Ljach. Ukrajinské letectvo na síti Telegram uvedlo, že ruské síly v noci na Ukrajinu vypustily 324 dronů a tři balistické rakety Iskander-M. Ruské ministerstvo obrany informovalo o sestřelení 85 ukrajinských dronů.

Warsh přiznal investice do kryptofirem a blockchainu

Kevin Warsh, kterého Donald Trump navrhl do čela americké centrální banky, měl podle finančního přiznání investice v řadě kryptoměnových firem a projektů. Záběr je široký, od DeFi přes infrastrukturu pro bitcoin až po sítě navázané na ethereum. Většinu těchto podílů slíbil prodat.

Uber mění strategii. Investuje miliardy do robotaxi

Uber prochází největší proměnou ve své historii. Společnost, která si vybudovala jméno na modelu sdílené ekonomiky bez vlastních aut, teď mění kurz a sází miliardy na robotaxi. Celkem chce do autonomních vozidel investovat přibližně 10 miliard dolarů (přes 200 miliard korun).
Reklama
Reklama
Reklama
Reklama