Facebook nauczył się rozpoznawać głosy i tłumaczyć je na teksty

Facebook nauczył się rozpoznawać głosy i tłumaczyć je na teksty

11 lipca 2020, 21:53
Źródło: © hightech.fm
237
Inżynierowie Facebooka wprowadzili nowy model, który może zidentyfikować do pięciu różnych głosów, a następnie przetłumaczyć je na tekst lub podzielić na różne utwory.

Sztuczna inteligencja Facebooka nauczyła Cię, jak rozpoznać do pięciu różnych głosów w jednej rozmowie, przetłumaczyć je na tekst lub podzielić na pięć różnych ścieżek. Zespół twierdzi, że nowa metoda przewyższa wszystkie analogi pod względem jakości i szybkości separacji źródeł mowy, redukcji szumów i pogłosu.

Facebook wykorzystał nową rekurencyjną sieć neuronową do stworzenia nowej klasy algorytmów wykorzystujących stan wewnętrzny podobny do pamięci do przetwarzania sekwencji zmiennych wejściowych. W takim przypadku model może automatycznie zidentyfikować głośniki i wybrać model mowy.

Separacja mowy jest kluczowym krokiem w kierunku poprawy komunikacji w różnych aplikacjach - przy użyciu wiadomości głosowych lub strumieniowego przesyłania dźwięku. Ponadto zaproponowane przez naukowców metody separacji mowy można wykorzystać do tłumienia szumu tła, na przykład podczas nagrywania instrumentów muzycznych.
Szukaj według partii
* Wybierz sekcję
Sekcja wyszukiwania
Szukaj:
Wyniki wyszukiwania w:
Cookies
Używamy plików cookie niezbędnych do prawidłowego funkcjonowania witryny oraz dodatkowych, aby interakcja z witryną była maksymalnie wygodna. Pomaga nam to personalizować Twoje doświadczenia użytkownika oraz uzyskiwać informacje analityczne w celu poprawy usługi. Jeśli zgadzasz się na akceptację wszystkich plików cookie, kliknij "Akceptuj wszystkie"; jeśli nie, kliknij "Tylko niezbędne". Aby dowiedzieć się więcej, przejrzyj Politykę plików Cookie.