-4.2 C
Czech
Středa 18. února 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Lavina u jezera Tahoe zabila osm lyžařů

Po úterním pádu laviny nedaleko jezera Tahoe v severní Kalifornii zemřelo osm lyžařů a po jednom se dál pátrá. Záchranáři už dříve v horské divočině vytáhli šest dalších lidí, kteří lavinu přežili, ale zůstali uvěznění pod sněhem a ledem.

V souvislosti s vraždou aktivisty Deranqueho francouzská policie zadržela už 11 lidí

Francouzská policie pokračuje ve vyšetřování brutální vraždy 23letého studentského aktivisty Quentina Deranqueho. Úřady nyní zadržely další dvě osoby, čímž se celkový počet podezřelých zvýšil na jedenáct. Jedním ze zadržených je i asistent francouzského poslance. Podle vyšetřovatelů za útokem pravděpodobně stojí radikální levice.

Bitcoin se drží u 68 tisíc dolarů a trh zklidňuje deriváty

Bitcoin se ve středu drží poblíž hranice 68 tisíc dolarů a po bouřlivějším začátku měsíce se obchoduje v poměrně úzkém pásmu. Od 6. února se největší kryptoměna pohybuje zhruba mezi 65 100 a 72 000 dolary, přičemž po výprodeji z 5. února postupně klesla i krátkodobá volatilita.

Japonský parlament potvrdil ve funkci premiérku Takaiči, vláda je beze změn

Dolní komora japonského parlamentu dnes podle očekávání zvolila premiérkou dosavadní šéfku vlády Sanae Takaiči, jejíž Liberálnědemokratická strana (LDP) získala v nedávných předčasných volbách dvoutřetinovou většinu. Staronová premiérka následně beze změn uvedla do funkce svůj dřívější kabinet, napsala agentura Kjódó.

Írán a Rusko provedou společné vojenské cvičení v Ománském moři

Írán a Rusko uskuteční ve čtvrtek společné vojenské cvičení v Ománském moři a severní části Indického oceánu, píše agentura Fars. Cílem cvičení je podle íránského námořnictva koordinace společných opatření pro boj proti aktivitám ohrožujícím námořní bezpečnost. Oznámené cvičení následuje krátce po dvoudenním cvičení íránských revolučních gard v Hormuzském průlivu začátkem tohoto týdne.

USA zabily 11 lidí při třech dalších leteckých úderech v Karibiku a Pacifiku

Americká armáda zabila 11 lidí při dalších třech leteckých úderech na lodě v Karibiku a východním Tichém oceánu, jejichž posádky podle ní pašovaly drogy. Velitelství americké armády SOUTHCOM, které má na starosti veškeré operace v Karibiku a Střední a Jižní Americe, pondělní útoky oznámilo v úterý na sociální síti X. Podle agentury AP tak vzrostl počet obětí amerických úderů v Karibiku a Tichém oceánu na nejméně 145.

Slovensko vyhlásilo stav ropné nouze

Slovenská vláda sahá do nouzových zásob ropy, aby udržela plynulé zásobování trhu po výpadku dodávek přes Ukrajinu. Rafinerie Slovnaft má získat čas na přechod na alternativní trasu a návrat k plnému provozu.

Nikdo neví, kde jsou. Z detenčních táborů v Sýrii uprchli zahraniční členové IS

Svržení režimu Bašára Asada a ofenziva proti kurdským milicím v Sýrii vedly k chaosu, během něhož uprchly tisíce lidí z detenčních táborů pro členy Islámského státu (IS) a jejich příbuzné. Byli mezi nimi i členové radikálního hnutí ze zahraničí. Nikdo neví, kde se nacházejí. Okno k útěku se otevřelo během přesunu vězňů ze Sýrie do Iráku.

Rusko v noci podle Ukrajiny zaútočilo 126 drony a balistickou raketou

Rusko v noci na dnešek zaútočilo na Ukrajinu 126 drony a jednou balistickou raketou Iskander-M. Na síti Telegram to oznámilo ukrajinské letectvo s tím, že stovku dronů se podařilo obraně zneškodnit. Šéf vojenské správy Záporožské oblasti Ivan Fedorov v noci oznámil, že ruský večerní úder na město Záporoží si vyžádal nejméně jednoho mrtvého a šest zraněných. Ukrajina od února 2022 vzdoruje ruské invazi.

KOMENTÁŘ: Něco mezi investicí a hazardem. Na této platformě se tipují i výsledky války

Z USA se do světa šíří fenomén takzvaných predikčních trhů, na kterých se investoři snaží odhadovat průběh nejrůznějších událostí. Tipují se ceny komodit, termíny konce válečných konfliktů a sportovní výsledky. A lidé mají podezření, že některé tipy jsou až podezřele přesné.

V severní Kalifornii je po pádu laviny nezvěstných devět lyžařů

Po pádu laviny nedaleko jezera Tahoe v severní Kalifornii je nezvěstných devět lyžařů. Záchranáři v hornaté divočině zachránili šest dalších lyžařů, kteří lavinu přežili, ale zůstali uvěznění pod sněhem a ledem. Dva ze zachráněných skončili v nemocnici, uvedla podle agentury AP mluvčí kanceláře šerifa okresu Nevada County Ashley Quadrosová. Kalifornií v době pádu laviny postupovala silná zimní bouře.

Hizballáh odmítl plán na odzbrojení a čtyřměsíční lhůtu libanonské vlády

Libanonská vláda dala armádě čtyři měsíce na to, aby rozjela druhou fázi odzbrojovacího plánu. Hizballáh, kterého se odzbrojení týká především, to odmítá a tvrdí, že kabinet tím nahrává Izraeli. Ten dál útočí v Libanonu a tlačí na odstranění hrozeb u hranice.
Reklama
Reklama
Reklama
Reklama