Перевод речи с помощью Gemini 3.5 Live Translate
Компания Google представила сервис Gemini3.5 Live Translate, который, по словам разработчиков, обеспечивает плавный и естественный перевод речи.
Что пишут:
Модель автоматически распознает более 70 языков и генерирует плавную, естественно звучащую переведенную речь, сохраняя интонацию, темп и высоту голоса говорящего. В отличие от поочередных систем, которые ждут, пока говорящий закончит говорить, прежде чем ответить, 3.5 Live Translate генерирует речь непрерывно, находя баланс между ожиданием контекста для улучшения качества и немедленным переводом, чтобы оставаться в синхроне с говорящим. Он обеспечивает плавный звук без неловких пауз и отстает от говорящего всего на несколько секунд на протяжении всей сессии.
В скором времени эту функцию внедрят в приложение Google Translate по всему миру, как для Android, так и для iOS. При использовании функции «Перевод в реальном времени» достаточно подключить любые наушники, чтобы получить плавный перевод, передающий интонацию говорящего, на более чем 70 языках.
Также будет возможность использовать "режим прослушивания" без наушников - чтобы слушать перевод через динамик телефона.
Демонстрации выглядят впечатляюще, но посмотрим, конечно, как это все будет работать чисто практически.
Его содержание определено.
Трудность с переводом в реальном времени, когда следующее слово неизвестно.
И вообще - я не советовал бы абитуриентам поступать на иностранную филологию с прикладными целями - чтоб зарабатывать этой профессией. Тысячи лет эта профессия обеспечивала хлебушек с маслом, а сейчас уже нет.
Так что перспектива есть.
www.youtube.com
Ну или еще более простая и куда более нужная вещь - текстовая запись разговора. Не обычная запись, которая много где нельзя. А вот просто текст, без заранее выбранного языка. В Тимз - пожалуйста. А просто на телефоне, чтобы оно работало сразу при звонке и во всех мессенджерах?
