Microsoft Teams dostane vylepšení kvality hlasu založené na umělé inteligenci, které by mělo každému účastníkovi hovoru pomoct slyšet ostatní. Informoval o tom server The Verge.
Každý, kdo někdy používal službu Teams, byl v hovoru s někým, kdo měl špatnou akustiku v místnosti, takže ho bylo blbě slyšet. Často se také stává, že několik lidí začne mluvit přes sebe, a trvá chvíli, než se rozhodne, kdo bude mluvit jako první. Nové vylepšení kvality hlasu od Microsoftu s využitím umělé inteligence by mělo tyto nepříjemnosti zlepšit nebo dokonce odstranit.
Společnost Microsoft uvedla, že začala používat modely strojového učení ke zlepšení akustiky místnosti, což by mělo eliminovat efekt, jako kdyby někdo mluvil z jeskyně. „Zatímco v Teams jsme se snažili pomocí digitálního zpracování signálu odvést opravdu dobrou práci, nyní jsme poprvé začali používat strojové učení k vytvoření systému pro potlačení ozvěny, kde můžete skutečně snížit ozvěnu ze všech různých zařízení,“ vysvětluje v rozhovoru pro The Verge Robert Aichner, hlavní programový manažer pro intelligent conversation a communications cloud ve společnosti Microsoft.
Všechny potřebné výpočty se budou dít přímo na klientském zařízení
Technologie využívá kombinaci zhruba 100 000 simulovaných místností a tréninku z 30 000 hodin řeči. Společnost Microsoft také platila běžným uživatelům služby Teams, aby nahrávali své hlasy a pomohli tak rozpoznat tisíce různých zařízení. A co je zásadní, zpracování probíhá přímo ve vašem zařízení. To samozřejmě pomáhá Microsoftu snižovat náklady, ale také zajišťuje, že k redukci ozvěny dochází rychle a u širšího okruhu uživatelů.
„Řekli jsme si, že to chceme dělat na klientovi, protože cloud je drahý, pokud chcete každý hovor zpracovávat v cloudu… a samozřejmě bychom tyto náklady museli přenést na zákazníka,“ vysvětluje Aichner. To by znamenalo potenciální omezení těchto důležitých vylepšení pro platící zákazníky. Zpracovávání na straně klienta znamená, že funkce budou dostupné na 90 procentech zařízení, která používají aplikaci Teams.
Nejpůsobivější je, že lidé se nyní mohou navzájem přerušovat při hovorech, aniž by docházelo k nepříjemnému překrývání, kdy druhého člověka neslyšíte kvůli ozvěně. Po měsících testování jsou novinky již v provozu. Přichází společně s několika dalšími vylepšeními, včetně vylepšení videohovorů s omezenou šířkou pásma a optimalizací zobrazování textu.