Reklama
13.4 C
Czech
Úterý 24. března 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Íránská raketa dopadla na Tel Aviv, v Libanonu pokračovaly izraelské údery

Írán v noci pokračoval v ostřelování Izraele v odvetě za pokračující americko-izraelské údery z předchozích dnů. Íránské rakety zasáhly domy v Tel Avivu a předměstí Haify, uvedla agentura AFP. Izrael naproti tomu podnikl vzdušné útoky na jižní předměstí Bejrútu i na jih Libanonu. Jeho údery zabily v sousední zemi nejméně dva lidi, píší místní média.

Ukrajina hlásí pět mrtvých po ruských útocích, sirény zněly po celé zemi

Nejméně pět lidí přišlo o život a dalších 16 bylo zraněno při nočních ruských vzdušných útocích na Ukrajinu, informovaly úřady. Útoky zasáhly především bytové domy. Sirény varující před útoky zněly takřka v celé zemi a prezident Volodymyr Zelenskyj nabádal obyvatele k ostražitosti před možným masivním ruským úderem, píše agentura AFP.

Jako během pandemie. Expati prchají z Blízkého východu

Válka s Íránem otřásla technologickým trhem na Blízkém východě. Firmy se snaží přeorientovat dodavatelské řetězce, logistické trasy a zajistit bezpečí zaměstnanců. Změny se projevují také v náborech. Některé společnosti je pozastavily nebo obsazují jen vybrané pozice, zatímco expati se vracejí do Evropy a Asie. Pravý opak se podle průzkumu odehrává v Izraeli.

Trumpova strategie vůči Íránu selhala, řekl bývalý ministr obrany

Bývalý americký ministr obrany James Mattis v pondělí na konferenci pro energetický průmysl CERAWeek v Houstonu v Texasu zkritizoval administrativu prezidenta Donalda Trumpa za válku s Íránem. Domnívá se, že selhala ve strategickém myšlení. Na Blízký východ míří tisíce amerických mariňáků, spekuluje se ale o mírových rozhovorech v Pákistánu.

Země čelí rekordní energetické nerovnováze

Planeta Země se dostala do stavu, který vědci popisují jako mimořádně nebezpečný. Nejnovější zpráva Světové meteorologické organizace ukazuje, že klimatický systém je vychýlený víc než kdykoli v historii měření. Rychlé změny proběhly během několika desetiletí, ale jejich dopady potrvají staletí až tisíciletí.

Ropa se vrátila nad 100 dolarů za barel

Cena ropy se po prudkém pondělním propadu znovu zvedla. Severomořský Brent se v asijském obchodování vrátil nad hranici 100 dolarů za barel a americká ropa WTI se dostala nad 91 dolarů. Trhy dál reagují hlavně na napětí kolem konfliktu mezi USA a Íránem.

Vyšetřování srážky na LaGuardii přineslo nové detaily

Vyšetřování nedělní srážky letadla Air Canada Express s hasičským vozem na letišti LaGuardia přineslo další podrobnosti o tom, co se stalo těsně před nehodou. Při kolizi zemřeli dva piloti a desítky dalších lidí utrpěly zranění.

Izrael zasáhl v Libanonu další most, podle místního deníku chce region odříznout

Izraelská armáda se nadále snaží odříznout jižní část Libanonu v oblasti řeky Lítání od zbytku země, napsal deník L'Orient-Le Jour (OLJ). Izrael při leteckých útocích na Libanon dnes znovu cílil na jeden z klíčových mostů přes Lítání, který spojuje oblast Bint Džbajl a Nabatíja. Jeho zničení přerušilo spojení mezi těmito dvěma regiony. V noci na dnešek Izrael bombardoval údolí Bikáa a oblast Baalbek na východě země. V oblasti Súr na jihu izraelská armáda zabila dva lidi. Dnes pozdě večer izraelská armáda oznámila novou vlnu leteckých úderů na bejrútské předměstí Dahíja s tím, že cílí na proíránské hnutí Hizballáh.

Žháři v Londýně zapálili sanitky židovské dobrovolnické organizace

V londýnské čtvrti Golders Green došlo v pondělí brzy ráno ke žhářskému útoku, při němž útočníci zapálili sanitky patřící židovské dobrovolnické organizaci Hatzola. Incident policie vyšetřuje jako antisemitský zločin z nenávisti.

Nejistota kolem Hormuzského průlivu drží trhy v napětí

Napětí kolem Hormuzského průlivu znovu znervózňuje investory. Část trhu omezuje rizikové pozice a přesouvá peníze do hotovosti, jiní naopak sázejí na výrazné cenové výkyvy nebo čekají na pokles, po kterém by mohli levněji nakupovat.

Trump nařídil o pět dnů podmínečně odložit útoky na íránské elektrárny

Americký prezident Donald Trump nařídil ministerstvu obrany na dobu pěti dnů podmínečně odložit jakékoliv útoky na íránské elektrárny a energetickou infrastrukturu. Oznámil to na sociální síti Truth Social s tím, že Spojené státy vedly v posledních dvou dnech velmi dobré a produktivní rozhovory s Íránem o úplném ukončení války na Blízkém východě.

KOMENTÁŘ: Co stojí za výprodejem zlata? Panika na drahých kovech jde zdánlivě proti logice

Zlato v posledních dvou letech předvádělo na burze obdivuhodné výkony i ve chvílích, kdy to od něj nikdo nečekal. Jenže teď, když válka na Blízkém východě vytváří argumenty pro další růst, aktivum paradoxně padá. Investoři se mimo jiné zalekli postoje americké centrální banky.

Írán hrozí zaminováním Perského zálivu, pokud USA podniknou pozemní invazi

V případě americké pozemní invaze by Írán zaminoval Perský záliv a zaútočil na elektrárny v celém arabském regionu, pohrozila dnes podle agentury Reuters íránská rada obrany. Prohlášení vydala v době, kdy Washington vyhrožuje Teheránu okupací či blokádou íránského ostrova Charg a také útoky na íránské elektrárny, aby zemi donutil znovu otevřít Hormuzský průliv. Americký prezident Donald Trump dal Íránu 48hodinové ultimátum, které vyprší v noci.
Reklama
Reklama
Reklama
Reklama