ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Moskva plánuje údery na Kyjev, Guterres je znepokojen

Generální tajemník OSN António Guterres vyjádřil znepokojení nad ruským plánem zasáhnout ukrajinské obranné podniky a rozhodovací centra v Kyjevě. Moskva své záměry oznámila po jednom z nejtěžších ostřelování ukrajinské metropole od začátku války.

BTS ovládli American Music Awards

American Music Awards 2026 přinesly velký návrat BTS, silný večer pro K-pop i několik překvapivých vítězství. Letošní ročník ukázal, jak výrazně se proměňuje světová popová scéna.

Čína popravila vraha herního magnáta

Čína popravila muže odsouzeného za vraždu herního magnáta a miliardáře Lina Qiho. Za jeho smrtí stál bývalý obchodní partner Xu Yao, který Lina v roce 2020 otrávil poté, co byl vyhozen z vedení klíčového projektu.

Největší firemní držitel bitcoinu splácí dluh

Společnost Strategy, největší firemní držitel bitcoinu na světě, tentokrát nenavyšovala svou kryptoměnovou zásobu. Firma kolem Michaela Saylora použila hotovost na odkup části svého dluhu a ubrala tak z objemu závazků, které souvisejí s její bitcoinovou strategií.

Michigan tvrdě doplácí na extrémní počasí

Michigan se stále častěji řadí mezi americké státy, které nejcitelněji zasahují projevy klimatické krize. Loni tam úřady zaznamenaly 33 tornád a oblast se potýkala také se silnými záplavami. Výzkumníci upozorňují, že souvislost s měnícím se klimatem už nelze přehlížet.

V Belgii se srazil vlak se školním minibusem, zemřeli dva žáci, řidič a doprovod

V belgickém Buggenhoutu severně od Bruselu se dnes ráno srazil vlak se školním minibusem, podle belgického ministra dopravy při srážce zahynuli dva mladiství, řidič a jeden další dospělý. Ministr vnitra bez dalších podrobností na síti X vyjádřil soustrast rodinám obětí a popřál mnoho sil zraněným. Podle informací médií se ve voze kromě řidiče nacházelo sedm žáků a jedna doprovázející osoba.

NOAA letos očekává mírnou hurikánovou sezónu. Bouře ale mohou rychle sílit

Letošní sezóna hurikánů v Atlantiku bude klidnější než obvykle. Totéž se však nedá říct o hurikánové sezóně ve východním Pacifiku. Vliv na to bude mít klimatický jev El Niño, který letos podle meteorologů dosáhne nebývalé intenzity.

Americké údery na Írán znovu ženou ceny ropy vzhůru

Po pondělním výrazném poklesu ceny ropy Brent v úterý vzrostly o více než 2 procenta. Trhy tak reagují na proměnlivou situaci na Blízkém východě. Americký prezident Donald Trump avizoval brzké ukončení války, zatímco americká armáda udeřila na cíle v jižním Íránu. Íránský ministr zahraničí Abbás Aráqčí jednal v Dauhá o mírové dohodě s katarským premiérem.

Novým premiérem Senegalu se stal ekonom Lo, jmenoval ho prezident

Novým premiérem Senegalu se stal ekonom Ahmadou Al Aminou Lo, do funkce ho dnes jmenoval prezident Bassirou Diomaye Faye. Podle agentur AFP a Reuters o tom informovala senegalská televize. Premiérské křeslo se uvolnilo poté, co prezident v minulém týdnu po měsících sporů a rostoucím ekonomickém tlaku na zemi odvolal Ousmaneho Sonka a rozpustil vládu.

Španělsko potvrdilo druhý případ hantaviru u pasažéra z výletní lodi

U španělského občana, který byl v Madridu umístěn do karantény po vylodění z výletní lodi MV Hondius, potvrdily testy hantavirus. Podle agentur AFP a Reuters to v pondělí oznámilo španělské ministerstvo zdravotnictví. Jde o druhý případ mezi 14 španělskými pasažéry, kteří byli po evakuaci umístěni do karantény.

Lavrov informoval Rubia o chystaném ruském útoku na Kyjev

Ruský ministr zahraničí Sergej Lavrov včera telefonicky informoval svého amerického kolegu Marka Rubia o připravovaném ruském úderu na Kyjev. Informovala o tom agentura Reuters s odvoláním na prohlášení ruské diplomacie. Rusko vyzvalo zahraniční diplomaty v Kyjevě, aby město opustili, neboť ruské síly se v metropoli připravují udeřit na cíle spojené s ukrajinskou armádou. Rusko úder zdůvodňuje jako odvetu za ukrajinský útok na okupovaný Starobilsk, kde podle tvrzení Moskvy zasáhli Ukrajinci internátní školu.

USA během příměří udeřily na jižní Írán

Americká armáda v pondělí provedla preventivní údery na cíle v jižním Íránu, uvedlo ústřední velení CENTCOM. Útok byl zaměřen na raketová odpaliště a lodě pokládající miny. Írán na útok zatím nereagoval a není jasné, zda bude mít nějaký vliv na probíhající jednání.

KLDR ze západního pobřeží odpálila několik raket, včetně balistické

Severní Korea dnes ze západního pobřeží vystřelila do Žlutého moře několik raket, včetně alespoň jedné balistické rakety krátkého doletu. S odvoláním na jihokorejskou armádu to napsala agentura Reuters.

Írán po téměř třech měsících obnoví přístup k internetu

Íránský prezident Masúd Pezeškján nařídil obnovit mezinárodní internetové připojení po téměř třech měsících blackoutu. Podle státních médií má země znovu otevřít přístup ke globálnímu internetu, který úřady výrazně omezily po začátku války se Spojenými státy a Izraelem. Přesný termín ani způsob obnovení připojení zatím vláda neoznámila.

Japonské lesy po válce spustily ekologický problém i vlnu alergií

Japonsko každé jaro zaplaví pylová sezona, která milionům lidí komplikuje běžný život. Lidé nosí roušky, kupují léky a města sledují pylové mapy podobně jako předpověď počasí. Za problémem ale nestojí jen klima nebo znečištěné ovzduší. Hlavní příčina sahá až do 50. let minulého století, kdy země po válce masivně zalesňovala holé svahy.
Reklama
Reklama
Reklama
Reklama