Facebook навчили розпізнавати голоси і переводити їх в тексти

Розділи

Поділитися:

Інженери Facebook представили нову модель, яка може визначити до п'яти різних голосів, потім перевести їх в текст або розділити на різні доріжки.

Штучний інтелект (ШІ) компанії Facebook навчили визначати до п'ять різних голосів в одній розмові, переводити їх в текст або розділити на п'ять різних доріжок. Команда стверджує, що новий метод перевершує всі аналоги за якістю і швидкістю поділу джерел мови, придушення шуму і реверберації.

Facebook використовувала нову рекуррентную нейронну мережу для створення нового класу алгоритмів, що використовують внутрішній стан, схожий на пам'ять, для обробки послідовностей входів змінних. При цьому модель може автоматично визначити тих, хто говорить і вибрати мовну модель.

Поділ мови є найважливішим кроком на шляху до поліпшення комунікації в різних додатках - за допомогою голосових повідомлень або потокового аудіо. Крім того, методи поділу мови, запропоновані дослідниками, можна застосувати для придушення фонового шуму, наприклад, під час запису музичних інструментів.

Поділитися:

Схожі новини

Контактные линзы с дополненной реальностью впервые протестировали на человеке

12:29, 28.06

1136

Попугаи обучаются речи как дети: исследование ученых

00:30, 05.06

969

Питание компьютера с помощью водорослей: новая разработка ученых

23:00, 12.05

823

Ми використовуємо обов'язкові файли cookie для коректної роботи сайту та додаткові, щоб зробити взаємодію з сайтом максимально зручною. Це допомагає нам персоналізувати ваш користувацький досвід, а також отримати аналітичну інформацію для покращення сервісу. Якщо згодні прийняти всі файли cookie, натисніть «Прийняти всі», якщо ні – «Тільки необхідні». Щоб дізнатися більше, перегляньте Політику використання cookie.