ITBoxUmělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Umělá inteligence VALL-E od Microsoftu dokáže napodobit jakýkoliv hlas

Microsoft oznámil nový model umělé inteligence pro převod textu na řeč. Model nazvaný VALL-E dokáže věrohodně napodobit hlas člověka z třísekundového zvukového vzorku. Informoval o tom server Engadget a Ars Technica.

Společnost předpokládá, že VALL-E by mohl být použit pro vysoce kvalitní aplikace pro převod textu na řeč. Dalším možným využití je editace řeči, kde by se nahraný zvuk upravil tak, aby originální osoba řekla něco, co původně neřekla. Stejně jako deepfakes s sebou ale nese VALL-E riziko zneužití.

Vědci trénovali VALL-E na 60 000 hodinách anglické řeči od více než 7 000 mluvčích ze zvukové knihovny LibriLight společnosti Meta. Hlas, který se pokouší napodobit, musí být blízký hlasu v tréninkových datech. Pokud tomu tak je, použije tréninková data k odvození toho, jak by cílový mluvčí zněl, kdyby četl požadovaný textový vstup.

Společnost Microsoft poskytuje na GitHub stránce desítky zvukových ukázek modelu umělé inteligence v akci. Mezi ukázkami jsou pole „Speaker Prompt“, což je třívteřinový zvuk poskytnutý modelu VALL-E, který musí napodobit. „Ground Truth“ je již existující nahrávka téhož mluvčího, který říká určitou frázi pro účely srovnání. „Baseline“ je příklad výstupu poskytovaného běžnou metodou syntézy textu na řeč a ukázka „VALL-E“ je výstup z modelu VALL-E.

Výsledky jsou různé, některé nahrávky znějí strojově, jiné překvapivě realisticky. Ty, které dopadly dobře, většinou dokáží zachovat emocionální tón původních vzorků. Výstupu z modelu zachovávají akustické prostředí. Pokud řečník tedy nahrál svůj hlas v sále s ozvěnou, zní i výstup VALL-E, jako by pocházel ze stejného místa.

Pro zlepšení modelu plánuje společnost Microsoft rozšířit svá tréninková data, aby „zlepšila výkonnost modelu z hlediska prozódie, stylu mluvení a podobnosti mluvčího“. Zkoumá také způsoby, jak omezit nejasná nebo vynechaná slova.

Zdrojový kód nebude veřejný

I když to tak často u projektů s umělou inteligencí nebývá, společnost Microsoft se rozhodla nezpřístupnit kód jako open source, pravděpodobně kvůli rizikům spojeným s možným využitím k podvodům. Výzkumníci si zřejmě uvědomují potenciální sociální škody, které by tato technologie mohla přinést.

„Vzhledem k tomu, že VALL-E může syntetizovat řeč, která zachovává identitu mluvčího, může to s sebou nést potenciální rizika při zneužití modelu, jako je podvržení identifikace hlasu nebo vydávání se za někoho jiného,“ napsala společnost.

Pro zmírnění rizik je také podle společnosti možné vytvořit detekční model, který rozliší, zda byl zvukový klip syntetizován pomocí VALL-E.

Doporučujeme

Situace ve Venezuele je čím dál zoufalejší, lidé hlásí nedostatek záchranářů

Situace ve Venezuele je s každou hodinou zoufalejší, lidé třetí den po dvou silných zemětřeseních prohledávají sutiny zřícených budov a bytových domů s vědomím, že čas na nalezení přeživších se krátí. Venezuelané si stěžují na nedostatečnou reakci vlády a absenci záchranářů. Po svých příbuzných často pátrají sami. Pod troskami je uvězněno nejméně 172 lidí, uvedl v pátek předseda parlamentu Jorge Rodríguez. Pohřešuje se jich však více než 51.000, zatímco bilance mrtvých činí nejméně 920, uvedla agentura AP.

Ukrajina zaútočila na průmyslová zařízení ve Volgogradě, nejméně deset raněných

Ukrajina v noci na dnešek a brzy ráno zaútočila střelami na průmyslová zařízení v ruském velkoměstě Volgograd, údery si vyžádaly nejméně deset raněných. Na platformě Telegram to oznámil gubernátor Volgogradské oblasti Andrej Bočarov. Úder později potvrdil ukrajinský prezident Volodymyr Zelenskyj, podle něhož zásah způsobil požár v areálu zbrojovky Titan-Barrikady. Ukrajinská státní energetická společnost Naftogaz dnes podle agentury Reuters oznámila, že Rusko vyslalo balistické rakety a drony na její zařízení v Poltavské a Charkovské oblasti, kde způsobily škody.

Amal Clooney přiznala, že život před svatbou byl jednodušší

Amal Clooney promluvila o tom, jak jí vztah s Georgem Clooneym změnil život. Úspěšná právnička v oblasti lidských práv přiznala, že po svatbě s hollywoodskou hvězdou musela nově řešit pozornost veřejnosti, paparazzi i prolínání soukromí s prací.

Zástupci USA, Izraele a Libanonu podepsali rámcovou dohodu

Zástupci Izraele, Libanonu a Spojených států podepsali dnes večer ve Washingtonu rámcovou dohodu. Oznámilo to americké ministerstvo zahraničí, kde se vedla od úterý jednání mezi izraelskými a libanonskými diplomaty. Americký ministr zahraničí Marco Rubio uvedl, že dohoda vytváří rámec pro trvalý mír a bezpečnost. Podle médií počítá s částečným odchodem izraelské armády z jihu Libanonu. Boje v oblasti trvají od března, ačkoliv byla uzavřená příměří. Zástupce Hizballáhu pohrozil, že uplatňování dohody může vést k občanské válce v Libanonu.

Íránské revoluční gardy oznámily útok na základny USA v regionu

Íránské revoluční gardy oznámily, že v reakci na americký útok napadly vojenské základny Spojených států v regionu. V noci na dnešek o tom informovala agentura AFP. Americká armáda v pátek provedla nové údery na cíle v Íránu v reakci na čtvrteční íránský útok na obchodní loď v Hormuzském průlivu.

Největší požár v USA se dál šíří, Utah vyhlásil stav nouze

Americký stát Utah vyhlásil stav nouze a před oslavami Dne nezávislosti omezil používání ohňostrojů. Na jihu státu se dál šíří požár Cottonwood Fire, který je nyní největším aktivním lesním požárem ve Spojených státech a komplikuje ho suché, větrné počasí.

Krym, jenž se potýká s nedostatkem pohonných hmot, vyhlásil nouzový stav

Moskvou dosazený šéf anektovaného Krymu Sergej Aksjonov vyhlásil na poloostrově nouzový režim, který má podle něj pomoci řešit otázky ekonomického charakteru. Konkrétní důvody nesdělil. Stanice BBC na svém ruskojazyčném webu připomněla, že Krym po útocích ukrajinských dronů zažívá palivovou krizi, kterou v posledních dnech prohloubily výpadky v dodávkách proudu. Ukrajina se už pátým rokem brání ruské vojenské invazi, v poslední době zintenzivnila své vzdušné útoky na ruské cíle.

Jihokorejská bývalá první dáma Kim Kon-hi dostala sedm let za úplatkářství

Jihokorejský soud dnes uložil bývalé první dámě Kim Kon-hi sedm let vězení za přijímání drahých darů výměnou za zprostředkování pracovních míst a obchodních výhod, informovala agentura Jonhap. Podle agentury Reuters má také zaplatit pokutu 64,8 milionů wonů (přes 896.000 Kč) a přijít o všechny přijaté dary. Třiapadesátiletá Kim si už odpykává čtyřletý trest za manipulaci s akciemi a za korupci. Její manžel, exprezident Jun Sok-jol, zase dostal doživotí za předloňské vyhlášení stanného práva.

Král Karel III. nebude bydlet v Buckinghamském paláci

Král Karel III. se po dokončení rozsáhlé rekonstrukce Buckinghamského paláce nepřestěhuje do jeho obytných prostor. S královnou Camillou zůstane v nedalekém Clarence House, zatímco palác má dál sloužit hlavně jako ceremoniální a pracovní centrum monarchie a více se otevřít veřejnosti.

Počet utonulých při vlně veder ve Francii vzrostl na 55

Počet utonulých ve Francii, kteří se v současné vlně veder chtěli osvěžit koupáním, vzrostl na 55, uvedla dnes podle agentury AFP ministryně sportu Marina Ferrariová. Pařížská policie dnes vyzvala organizátory hudebního festivalu Solidays, pochodu hrdosti na podporu komunity LGBT+ a sportovních akcí, aby je kvůli panujícím vedrům zrušily. Organizátoři pochodu Paris Pride posléze oznámili, že jej odkládají.

Ceny ropy se dočasně vrátily na předválečnou úroveň. Ohrožuje je přetrvávající nejistota

Ceny ropy klesly na předálečnou úroveň, než zase mírně vzrostly. Celkově však ceny pokračují v poklesu. Hormuzským průlivem proplouvá stále více lodí. Jednání o finální mírové dohodě pokračují, ale provází je napětí a neshody. Kromě toho došlo k útoku na plavidlo nedaleko ománského pobřeží, což přimělo Mezinárodní námořní organizaci (IMO) dočasně pozastavit evakuační plán v Hormuzském průlivu.

Japonsko kvůli dvěma blížícím se tropickým bouřím zrušilo přes 200 letů

Japonsko dnes kvůli dvěma blížícím se tropickým bouřím zrušilo přes 200 letů a desítky vlakových spojení a doporučilo lidem evakuovat se z některých oblastí, kde hrozí povodně a sesuvy půdy. Nevlídné počasí zasáhlo také Tchaj-wan, kde byly evakuovány stovky lidí a nejezdí některé vlaky, napsaly agentury AFP a Reuters.

Včelí královny nevznikají jen díky mateří kašičce

Včely medonosné patří mezi nejvýznamnější opylovače na světě a jejich role je zásadní pro fungování přírodních ekosystémů i zemědělské krajiny. Nový výzkum nyní odhalil, že vznik včelí královny je mnohem složitější proces, než se dosud předpokládalo. O její budoucnosti nerozhoduje pouze potrava, ale také prostředí, které pro ni vytváří celé včelstvo.

Soud uložil doživotní trest muži, který zaútočil na vánoční trhy v Magdeburku

 Na doživotí poslal dnes německý soud do vězení saúdskoarabského lékaře, který předloni v prosinci zaútočil na vánoční trhy v Magdeburku. Jednapadesátiletý Tálib Abdalmuhsin zabil při zběsilé jízdě po magdeburském hlavním náměstí šest lidí a přes 300 dalších zranil.

Soud nařídil odtajnit další Epsteinovy spisy, včetně výpovědi proti Trumpovi

Federální soud ve Washingtonu nařídil americkému ministerstvu spravedlnosti, aby buď zveřejnilo dosud začerněné části spisů týkajících se zesnulého sexuálního delikventa Jeffreyho Epsteina, nebo vysvětlilo, proč tak nemůže učinit. Okresní soudce Emmet Sullivan tak reagoval na žalobu nezávislé novinářky Katie Phang, která se kauzou dlouhodobě zabývá.
Reklama
Reklama
Reklama
Reklama