-0.5 C
Czech
Sobota 3. ledna 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Zelenskyj do funkce šéfa prezidentské kanceláře jmenoval Budanova

Ukrajinský prezident Volodymyr Zelenskyj dnes do funkce šéfa své kanceláře jmenoval dosavadního ředitele ukrajinské vojenské rozvědky HUR Kyryla Budanova. Hlava státu na síti X zdůraznila, že Ukrajina se nyní musí více zaměřit na svou bezpečnost a obranu. Předchozího vlivného vedoucího prezidentské kanceláře Andrije Jermaka vloni Zelenskyj odvolal v souvislosti s vyšetřováním korupce v ukrajinské energetice.

Saúdská Arábie podnikla údery proti separatistům v jižním Jemenu

Saúdská Arábie, která je spojencem jemenské vlády, dnes provedla údery proti separatistům podporovaným Spojenými arabskými emiráty na jihu Jemenu, uvedl podle agentury AP zástupce separatistů. Podle agentury AFP při útoku zahynulo sedm lidí a několik dalších bylo zraněno. Cílem operace vedené Rijádem je převzít kontrolu nad tábory Jižní přechodné rady (STC) v provincii Hadramaút u hranic se Saúdskou Arábií.

Ukrajinské úřady informují o raněných po ruských nočních náletech

Ruské útoky si během noci vyžádaly dva zraněné v Záporožské a dva zraněné v Dněpropetrovské oblasti, v Chersonské oblasti ruský dron zranil řidiče sanitky jedoucí pro dva zraněné po předchozím útoku, uvedly úřady v těchto regionech na jihovýchodě Ukrajiny. Ruské úřady naopak tvrdí, že počet obětí ukrajinského útoku na ves Chorly v okupované části Chersonské oblasti stoupl z 24 na 27; Kyjev popírá, že by zaútočil na civilní cíl, a ruská tvrzení odmítá jako dezinformaci. Ukrajinské drony podle médií během noci opět zaútočily na rafinerii v Novokujbyševsku v ruské Samarské oblasti.

Trump pohrozil Íránu intervencí na ochranu pokojných demonstrantů

Americký prezident Donald Trump dnes uvedl, že pokud Írán bude střílet a zabíjet pokojné demonstranty, přispěchají jim Spojené státy na pomoc. Šéf Bílého domu se takto vyjádřil na své sociální síti Truth Social.

Nezvykle čistý start roku. Novoroční ovzduší bylo nejlepší za 22 let

Silvestrovská půlnoc obvykle přináší prudký nárůst znečištění. Letos ale data ukázala jiný obraz. Ovzduší na Nový rok bylo nezvykle čisté a meteorologové mluví o nejlepších hodnotách za víc než dvě dekády. Co se změnilo a proč tentokrát pyrotechnika nezanechala takovou stopu?

Venezuela propustila přes 80 lidí uvězněných po povolebních protestech

Venezuelská vláda dnes oznámila, že nechala propustit v uplynulých hodinách 88 lidí zadržených po prezidentských volbách v roce 2024. Venezuelské nevládní organizace informovaly dříve o propuštění 87 lidí, píší agentury. Jedná se o druhý podobný krok v krátké době, poté co v prosinci úřady nařídily propustit 99 lidí.

Venezuela je připravena jednat s USA o boji proti drogám, řekl Maduro

Venezuela je připravená jednat se Spojenými státy o boji proti drogám či o investicích do ropného sektoru. V noci na dnešek to řekl venezuelský prezident Nicolás Maduro, napsala agentura AFP. Madura americká vláda považuje za jednoho z vůdců venezuelského Kartelu sluncí. Maduro také jednoznačně nepotvrdil úder na venezuelské území, o kterém v minulých dnech informovala americká média.

Rozsáhlé protesty v Íránu si již vyžádaly nejméně šest mrtvých

Pokračující střety mezi demonstranty a bezpečnostními složkami v Íránu si vyžádaly první oběti na životech, podle tiskových agentur zemřelo nejméně šest lidí. Zemi kvůli prudce rostoucí inflaci zasáhly největší protesty za poslední tři roky, které se v několika regionech změnily v násilí.

Ceny ropy za rok 2025 spadly nejvíc od pandemie covidu

Ropný trh má za sebou nejprudší roční pokles od covidové pandemie. Cena ropy v roce 2025 klesla zhruba o pětinu a podle části analytiků může tlak na zlevňování pokračovat i v prvních měsících roku 2026.

Zelenskyj v novoročním projevu: Mírová dohoda je z 90 procent hotová, Donbasu se nevzdáme

Ukrajinský prezident Volodymyr Zelenskyj v novoročním projevu oznámil, že mírová dohoda o ukončení války s Ruskem je podle něj hotová z devadesáti procent. Zároveň však varoval, že zbývající část jednání bude zásadní nejen pro budoucnost Ukrajiny, ale i celé Evropy.
Reklama
Reklama
Reklama
Reklama