1.9 C
Czech
Sobota 14. února 2026
ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Reklama

Doporučujeme

Merz chce silnější Evropu a opravu transatlantické důvěry

Amerika už podle německého kancléře Friedricha Merze naráží na limity, když chce řešit světové krize sama. V projevu na Mnichovské bezpečnostní konferenci vyzval k opravě transatlantické důvěry, ale zároveň k tomu, aby Evropa posílila vlastní obranu. Zmínil i první rozhovory s Emmanuelem Macronem o možnosti, že by se Německo opřelo o francouzské jaderné odstrašení.

Jílek má olympijské zlato

Rychlobruslař Metoděj Jílek vyhrál na zimních olympijských hrách závod na 10 000 metrů a přidal pro Česko další cenný kov. Po stříbru z pětky tak během jednoho týdne získal druhou olympijskou medaili.

Adamczyková vybojovala na olympiádě stříbro

Česká výprava má na zimních hrách v Itálii třetí medaili. Eva Adamczyková dojela ve finále snowboardcrossu v Livignu druhá, od zlata ji dělily čtyři setiny sekundy. V programu dne zaujalo i další Klaebovo vítězství v běhu na lyžích a solidní umístění českých reprezentantů.

Logistika se stala novou obětí AI nervozity na trzích

Akcie dopravních a logistických firem ve čtvrtek prudce oslabily poté, co malá společnost Algorhythm Holdings představila nový nástroj pro plánování přeprav s využitím umělé inteligence. Investoři se obávají, že podobné systémy mohou snížit potřebu služeb části trhu a roztočily se další výprodeje napříč sektory.

Svět bojuje o kritické suroviny

Bez lithia, kobaltu nebo mědi dnes ve světě nefunguje moderní ekonomika. Tyto suroviny pohánějí elektromobily, větrné turbíny, solární panely i datová centra. Zároveň ale jejich těžba zatěžuje přírodu, vodu i místní komunity. Státy proto řeší složitou rovnici. Jak zajistit dostatek nerostů a přitom nezhoršit ekologické škody ani geopolitické napětí.

Čína může podle Sybihy mít pro spravedlivý mír na Ukrajině důležitou roli

Čína může podle šéfa ukrajinské diplomacie Andrije Sybihy sehrát důležitou roli při nastolení spravedlivého míru na Ukrajině. Svého čínského kolegu Wang Ia pozval na návštěvu Ukrajiny, píše agentura Reuters.

Zákaz skupiny Palestine Action v Británii je nezákonný, rozhodl soud

Zákaz propalestinské skupiny Palestine Action v Británii je nezákonný. Podle britských médií o tom dnes rozhodl londýnský vrchní soud, jenž vyhověl žalobě organizace, kterou loni britská vláda označila za teroristickou. Ministryně vnitra Shabana Mahmoodová oznámila, že se proti rozhodnutí odvolá. Zákaz zůstane v platnosti, dokud justice o odvolání nerozhodne, stanovil soud.

Sbírka na podporu rodiny Jamese Van Der Beeka vybrala přes 2 miliony dolarů

Jen pár hodin po oznámení smrti Jamese Van Der Beeka vznikla veřejná sbírka na podporu jeho manželky a šesti dětí. Reakce fanoušků i hollywoodských hvězd byla okamžitá. Částka překonala původní cíl během jediného dne.

Venezuelská prezidentka slíbila svobodné volby, lhůtu pro ně ale neuvedla

Venezuelská prozatímní prezidentka Delcy Rodríguezová v rozhovoru s americkou stanicí NBC News slíbila, že uspořádá svobodné volby. Nezmínila ale žádnou lhůtu. Agentura AFP dnes také informovala, že venezuelský parlament ve čtvrtek odložil přijetí zákona o amnestii, který má vést k masovému propuštění politických vězňů a který Rodriguezová pod tlakem Washingtonu slíbila prosadit.

Kosmická loď Crew Dragon se čtyřčlennou posádkou odstartovala k ISS

Kosmická loď Crew Dragon se čtyřčlennou posádkou odstartovala k Mezinárodní vesmírné stanici (ISS). Start přenášel živě na svém webu americký Národní úřad pro letectví a vesmír (NASA). Na palubě lodi jsou Američané Jessica Meirová a Jack Hathaway, Francouzka Sophie Adenotová a Rus Andrej Feďajev. Na ISS by podle agentury Reuters měli dorazit v sobotu odpoledne.

Ruský útok na přístav v Oděské oblasti má jednu oběť, na Kramatorsk čtyři

Ruská armáda v noci na dnešek podnikla útok na přístav v ukrajinské Oděské oblasti. Jeden člověk přišel o život, dalších šest utrpělo zranění, oznámil na telegramu ukrajinský vicepremiér Oleksij Kuleba. Čtyři lidé zahynuli ve čtvrtek večer v Kramatorsku, kde ruská armáda zasáhla rodinný domek. Ruské úřady hlásí tři zraněné po ukrajinském dronovém útoku z Volgogradu a okolí.

Šéf Microsoft AI: Kancelářské práce se zautomatizují do 18 měsíců

Většina, ne-li všechny úkoly „bílých límečků" budou automatizovány umělou inteligencí (AI) během příštího roku nebo příštího roku a půl. V rozhovoru pro deník Financial Times to řekl ředitel AI divize Microsoftu Mustafa Suleyman.

Bangladéšská BNP si připsala ve volbách drtivé vítězství

Bangladéšská nacionalistická strana (BNP) Taríka Rahmána, syna někdejší premiérky Bégam Chálidy Zijá, v pátek drtivě vyhrála v parlamentních volbách – prvních od povstání generace Z v roce 2024, které vedlo ke svržení autokratického režimu. Volby jsou také považovány za první spravedlivé po dvaceti letech. Slibují ukončení nepokojů a nestability v zemi.

Portugalsko a Španělsko sužují další silné bouře

Iberský poloostrov dál bičují silné deště a vítr. Portugalsko i Španělsko vyhlásily nejvyšší stupně varování. Bouře ničí infrastrukturu, přerušují dopravu a zavírají školy. V Portugalsku si série extrémů vyžádala nejméně 16 obětí a škody jdou do stovek milionů eur.
Reklama
Reklama
Reklama
Reklama