Facebook nauczył się rozpoznawać głosy i tłumaczyć je na teksty

Kategorie

Udostępnij:

Inżynierowie Facebooka wprowadzili nowy model, który może zidentyfikować do pięciu różnych głosów, a następnie przetłumaczyć je na tekst lub podzielić na różne utwory.

Sztuczna inteligencja Facebooka nauczyła Cię, jak rozpoznać do pięciu różnych głosów w jednej rozmowie, przetłumaczyć je na tekst lub podzielić na pięć różnych ścieżek. Zespół twierdzi, że nowa metoda przewyższa wszystkie analogi pod względem jakości i szybkości separacji źródeł mowy, redukcji szumów i pogłosu.

Facebook wykorzystał nową rekurencyjną sieć neuronową do stworzenia nowej klasy algorytmów wykorzystujących stan wewnętrzny podobny do pamięci do przetwarzania sekwencji zmiennych wejściowych. W takim przypadku model może automatycznie zidentyfikować głośniki i wybrać model mowy.

Separacja mowy jest kluczowym krokiem w kierunku poprawy komunikacji w różnych aplikacjach - przy użyciu wiadomości głosowych lub strumieniowego przesyłania dźwięku. Ponadto zaproponowane przez naukowców metody separacji mowy można wykorzystać do tłumienia szumu tła, na przykład podczas nagrywania instrumentów muzycznych.

Udostępnij:

Powiązane wiadomości

Контактные линзы с дополненной реальностью впервые протестировали на человеке

12:29, 28.06

1136

Попугаи обучаются речи как дети: исследование ученых

00:30, 05.06

969

Питание компьютера с помощью водорослей: новая разработка ученых

23:00, 12.05

823

Używamy plików cookie niezbędnych do prawidłowego funkcjonowania witryny oraz dodatkowych, aby interakcja z witryną była maksymalnie wygodna. Pomaga nam to personalizować Twoje doświadczenia użytkownika oraz uzyskiwać informacje analityczne w celu poprawy usługi. Jeśli zgadzasz się na akceptację wszystkich plików cookie, kliknij "Akceptuj wszystkie"; jeśli nie, kliknij "Tylko niezbędne". Aby dowiedzieć się więcej, przejrzyj Politykę plików Cookie.