Зображення користувача Олена Каганець.
Олена Каганець
  • Відвідувань: 57
  • Переглядів: 59

ElevenLabs створює універсальну машину дубляжу зі штучним інтелектом

Система замінить будь-який голос актора таким самими голосом цього актора, тільки іншою мовою. Стартап у сфері штучного інтелекту пропонує послугу клонування голосу за допомогою штучного інтелекту на основі завантажених аудіо-зразків тривалістю кілька хвилин.

23101201.jpg

Ілюстрація: avdyachenko via Getty Images

Після того, як Disney випустить новий фільм англійською мовою, компанія повернеться і локалізує його на 46 мов світу, щоб зробити фільм доступним для якомога ширшої аудиторії. Для виконання такого масштабного завдання у Disney є цілий підрозділ — Disney Character Voices International Inc. І це — не повернути Кріса Пратта до студії звукозапису, щоб він озвучив свої репліки у "Ґотґ 3" ісландською та суахілі. Кожна версія звучить дещо по-різному, зважаючи на місцевих акторів озвучення, пише Ендрю Тарантола (Andrew Tarantola) у своїй статті на Engadget.

Але з новою системою "ШІ-дубляжу" від ElevenLabs ми скоро зможемо отримати точне відтворення голосу Пратта, незалежно від мови, якою розмовляють на екрані.

ElevenLabs — це стартап у сфері штучного інтелекту, який пропонує послугу клонування голосу, що дозволяє підписникам генерувати майже ідентичні голоси за допомогою штучного інтелекту на основі завантажених аудіо-зразків тривалістю кілька хвилин. Не дивно, що як тільки функція вийшла в бета-версії, її одразу ж почали використовувати, щоб видавати себе за знаменитостей, іноді навіть без їхнього попереднього відома та згоди.

Нова функція штучного дубляжу робить те саме більш ніж 20 мовами, зокрема, гінді, португальською, іспанською, японською, українською, польською та арабською, але легально та з дозволу власника. Цей інструмент призначений для використання медіакомпаніями, викладачами та інтернет-інфлюенсерами, які не мають Disney Money™ для фінансування своїх зусиль з глобальної адаптації.

ElevenLabs стверджує, що система зможе не лише перекладати "розмовний контент на іншу мову за лічені хвилини", але й генерувати новий розмовний діалог цільовою мовою, використовуючи власний голос актора. Або принаймні згенерований штучним інтелектом репліку. Система навіть здатна зберігати "емоції та інтонації" існуючого діалогу і переносити їх у згенерований переклад.

"Це допоможе аудиторії насолоджуватися будь-яким контентом, який вони хочуть, незалежно від мови, якою вони розмовляють, — сказав генеральний директор ElevenLabs Маті Станішевський (Mati Staniszewski) у своїй заяві для преси. Mati Staniszewski. — І це означатиме, що творці контенту зможуть легко та автентично отримати доступ до набагато більшої аудиторії в усьому світі".

Наші інтереси: 

Неймовірно, як розвивається штучний інтелект і які можливості пропонують новітні технології, створені на основі ШІ.

Якщо ви помітили помилку, то виділіть фрагмент тексту не більше 20 символів і натисніть Ctrl+Enter
Підписуюсь на новини

Зверніть увагу

Френк Герберт: Ну як вам друге дно Вулика Геллстрома?

«Вулик Геллстрома», «Дюна» і 10 принципів Джигаду – політичний проект Френка Герберта

«Життя у вулику передбачає не регламентовану монотонність, а МЕТАМОРФОЗУ. Коли комаха досягає межі своїх можливостей, вона чудесним чином перетворюється на абсолютно нову істоту. У цій метаморфозі я...

Останні записи