0.5 C
Czech
Čtvrtek 5. března 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Sarah Ferguson se po zatčení bývalého manžela stáhla z veřejnosti

Sarah Ferguson se po zatčení bývalého prince Andrewa, drží mimo veřejnost. Podle lidí z jejího okolí ji aktuální vývoj kolem Epsteinova případu zasáhl. Nové dokumenty a vyšetřování zároveň znovu otevřely otázky kolem jejích někdejších kontaktů.

USA a Británie se neshodly na testování tokenizovaných akcií a dluhopisů

Američtí a britští regulátoři narazili na spor, jak společně otestovat takzvané tokenizované cenné papíry, tedy akcie nebo dluhopisy převedené na blockchain. Jde o jednu z klíčových věcí, na které mají obě země spolupracovat v rámci nové pracovní skupiny pro digitální aktiva.

Aryna Sabalenka se zasnoubila

Aryna Sabalenka se zasnoubila se svým partnerem Georgiosem Frangulisem. Tenistka sdílela na sociálních sítích video z okamžiku, kdy ji požádal o ruku, a ukázala i výrazný zásnubní prsten.

Britská policie zatkla tři muže podezřelé ze špionáže pro Čínu. Jeden z nich je partnerem poslankyně

Policie ve Spojeném království zatkla ve středu tři muže podezřelé ze špionáže ve prospěch čínské zpravodajské služby. Jedním z nich je partner poslankyně opoziční Labouristické strany, další je partner nejmenovaného exposlance za labouristy.

Americký ministr obrany Hegseth uvedl, že USA v boji s Íránem vyhrávají

Amerika vyhrává, zničujícím, rozhodujícím a nemilosrdným způsobem, prohlásil dnes na briefingu Pentagonu americký ministr obrany Pete Hegseth. Zároveň avizoval, že Spojené státy podniknou další vlny útoků na islámskou republiku, chválil spolupráci s Izraelem a poznamenal, že íránský režim je na pokraji sil.

Izrael vyzval obyvatele jižního Libanonu k evakuaci za řeku Lítání

Izraelská armáda dnes vyzvala obyvatele jižního Libanonu k evakuaci na území severně od řeky Lítání, která leží asi 30 kilometrů od izraelských hranic. Informovala o tom agentura AFP. Armáda to zdůvodnila chystanými vojenskými operacemi proti proíránskému hnutí Hizballáh. Podle libanonské státní tiskové agentury NNA izraelská armáda vstoupila do města Chijám, které se nachází šest kilometrů od hranic.

Hongkong zažil nejteplejší zimu v historii měření

Hongkong má za sebou nejteplejší zimu od začátku měření v roce 1884. Únor přinesl nezvykle vysoké teploty, rekordně teplý Lunární nový rok i jen pár chladných dnů. Data potvrzují pokračující trend oteplování, který se ve městě projevuje čím dál výrazněji.

Americká ponorka potopila íránskou válečnou loď v Indickém oceánu, 80 mrtvých

Americká ponorka torpédovala a potopila íránskou válečnou loď v Indickém oceánu, oznámil dnes americký ministr obrany Pete Hegseth. Podle náměstka srílanského ministra zahraničí zemřelo nejméně 80 lidí, píše agentura Reuters. Hegseth před novináři uvedl, že jde o první podobný útok na nepřítele od druhé světové války.

Turecko: Protivzdušná obrana NATO ve Středozemí zneškodnila raketu letící z Íránu

Protivzdušná obrana NATO ve středu zničila balistickou raketu vypálenou z Íránu, která po přeletu nad Irákem a Sýrií směřovala do tureckého vzdušného prostoru. Podle Ankary incident nepřinesl žádné oběti, Turecko však varovalo před další eskalací konfliktu v regionu.

Válka na Blízkém východě je testem pro centrální banky

Probíhající válka na Blízkém východě může podnítit růst inflace v ekonomikách, jejichž růst zpomalují americká cla. Centrální banky se ocitly v obtížné situaci. Zvýšením úrokových sazeb sice sníží inflaci, ale zpomalí ekonomiku. Jejich ponecháním na současné úrovni mohou způsobit ještě větší inflační růst.

KOMENTÁŘ: Pod svícnem útoku na Írán. V USA se připravuje půda pro AI válku

Zatímco na Blízkém východě dopadají do pouště rakety, v USA se řeší něco, co může ovlivnit všechny konflikty ve světě. Pentagon chce totiž zjevně pokročit ve využívání AI ve vojenském sektoru. Zákazku měl původně plnit Anthropic, jenže nakonec vycouval. Jeho místo pohotově zaplnila OpenAI.

Ruský útok zasáhl prázdný vlak a zranil železničáře, uvedl Kyjev

Rusko pokračuje v útocích na ukrajinskou železnici, v Mykolajivské oblasti zasáhlo prázdný vlak, ale zranilo železničáře, napsal dnes ráno na platformě Telegram ukrajinský vicepremiér Oleksij Kuleba. Ve Slovjansku podle místních úřadů ruský útok zabil jednoho člověka. Ukrajinské letectvo mezitím informovalo o zneškodnění 129 ze 149 dronů, kterými podle něj Rusové v noci útočili na Ukrajinu. Ruské ministerstvo obrany hlásí sestřel 70 ukrajinských bezpilotních letounů.

Americká armáda udeřila na drogové gangy v Ekvádoru

Administrativa amerického prezidenta Donalda Trumpa otevřela v rámci operace Southern Spear (Jižní kopí) další frontu. Společně s Ekvádorem zakročila proti „teroristickým organizacím“ v latinskoamerické zemi. Ekvádor se v posledních letech stal jedním z největších center obchodu s drogami na světě.
Reklama
Reklama
Reklama
Reklama