Перевод речи с помощью Gemini 3.5 Live Translate

16.06.2026 10:30  820   Комментарии (67)

Компания Google представила сервис Gemini3.5 Live Translate, который, по словам разработчиков, обеспечивает плавный и естественный перевод речи. 

Что пишут:

Модель автоматически распознает более 70 языков и генерирует плавную, естественно звучащую переведенную речь, сохраняя интонацию, темп и высоту голоса говорящего. В отличие от поочередных систем, которые ждут, пока говорящий закончит говорить, прежде чем ответить, 3.5 Live Translate генерирует речь непрерывно, находя баланс между ожиданием контекста для улучшения качества и немедленным переводом, чтобы оставаться в синхроне с говорящим. Он обеспечивает плавный звук без неловких пауз и отстает от говорящего всего на несколько секунд на протяжении всей сессии.

В скором времени эту функцию внедрят в приложение Google Translate по всему миру, как для Android, так и для iOS. При использовании функции «Перевод в реальном времени» достаточно подключить любые наушники, чтобы получить плавный перевод, передающий интонацию говорящего, на более чем 70 языках.

Также будет возможность использовать "режим прослушивания" без наушников - чтобы слушать перевод через динамик телефона. 

Демонстрации выглядят впечатляюще, но посмотрим, конечно, как это все будет работать чисто практически. 

 

Комментарии 67

Угу, "демонстрация".
Люблю осбенно роботы Бостон Дайнемикс. 20 лет уже нимнатсикой занимаются. Правда ,вот как унитаз помыть, так самому, ёршиком - и где те роботы?
16.06.26 14:01
2 0

Угу, "демонстрация".Люблю осбенно роботы Бостон Дайнемикс. 20 лет уже нимнатсикой занимаются. Правда ,вот как унитаз помыть, так самому, ёршиком - и где те роботы?
Тут все будет как с электросамокатами. Помните хайп с Сегвеем - транспорт будущего, экзотика, ооо, ууу? А сейчас электросамокат весит в разы меньше и стоит триста долларов.
16.06.26 14:24
0 0

Прогресс есть немалый и тут. Но это оказалось самым сложным таки. Быстрее оказалось сделать подобие разума в виртуальном пространстве чем простой автомат в реальном мире. Потому что весь комплекс действий даже автомобиля на дороге не говоря про действия руки оказался весьма сложен с учетом миллиона всяких случайностей и обстоятельств.
16.06.26 14:09
0 0

Есть сейчас смысл заставлять детей учить языки, если во взрослой жизни им это уже не понадобится?
16.06.26 13:54
0 1

Есть сейчас смысл заставлять детей учить языки, если во взрослой жизни им это уже не понадобится?
Примерно как смысл учить играть в шахматы или говорить на эсперанто. Прикладного смысла нет.
16.06.26 14:29
0 0

Я думаю все равно будет смысл но уже для саморазвития и перехода на следующий уровень понимания для себя лично или узкой специальности в этом плане. А так, чисто в практической плоскости уже мало смысла видимо.
Печально. Ещё один человеческий навык - из важнейших, и более всего развивающих культуру общества и интеллект каждого индивидуума, уходит.

Мир "Матрицы" всё меньше похож на фантазию. Только люди залягут в машину без всякой войны - сами попросят. После того, Гугл представит на очередной презентации...
16.06.26 14:23
0 0

Я думаю все равно будет смысл но уже для саморазвития и перехода на следующий уровень понимания для себя лично или узкой специальности в этом плане. А так, чисто в практической плоскости уже мало смысла видимо.
16.06.26 14:11
0 1

У меня уже вроде как неделю работает. Впечатляет, да
16.06.26 12:51
0 1

У меня уже вроде как неделю работает. Впечатляет, да
В Google Translate? Расскажите подробнее о впечатлениях, плиз.
16.06.26 12:59
0 3

все-таки постановочные ролики от гугла не катят. Посмотрим, когда независимый народ будет тестировать.
16.06.26 12:50
0 2

Если нельзя будет включить на ютубе ролик и не получить автоматом синхронный перевод голосом Володарского, то для чего все это?
16.06.26 11:57
0 1

много живых стримов
Отстающих от реальности на несколько секунд.
16.06.26 14:22
0 0

Думаю они на ютубе и обучали - функционал автоперевода и автоозвучки (бесит кстати) уже полгода наверно у меня есть есть. Просто для ютуб видео оно было не в реальном времени а через какое то время
+

Особенно впечатляет, как в уже не новом ролике оно не способно произнести правильно фамилию оч известного человека, велик называет мотоциклом, известнейший бренд - как попало.
16.06.26 14:01
0 1

Думаю они на ютубе и обучали - функционал автоперевода и автоозвучки (бесит кстати) уже полгода наверно у меня есть есть. Просто для ютуб видео оно было не в реальном времени а через какое то время
16.06.26 13:56
0 0

На ютубе есть много живых стримов
16.06.26 12:56
0 0

Ролик уже записан.
Его содержание определено.
Трудность с переводом в реальном времени, когда следующее слово неизвестно.
16.06.26 12:24
0 1

Мои поздравления синхронным переводчикам - наша с вами сложная и высокооплачиваемая специальность доживает последние годы. Письменный перевод как коммерческая работа перестал существовать процентов на 95. На очереди перевод синхронный - и как только ИИ заработает в этой сфере, он будет справляться намного лучше "живого" синхрониста. Просто потому, что он не охрипнет и не затупит в самый неподходящий момент.

И вообще - я не советовал бы абитуриентам поступать на иностранную филологию с прикладными целями - чтоб зарабатывать этой профессией. Тысячи лет эта профессия обеспечивала хлебушек с маслом, а сейчас уже нет.
16.06.26 11:47
1 10

А как ваш хвалёный ИИ переведёт такое:
А вот сейчас и проверим:
Here are the translations:

**"If grandma had grandpa's external genitalia, she would be a grandpa, not a grandma."**
A dismissive deflection used when asked about hypothetical scenarios — roughly equivalent to "if my aunt had wheels, she'd be a bicycle."

**"You'll get tired of swallowing dust!"**
A threat implying opponents will be left far behind and struggling to keep up.

**"We'll waste them in the outhouse!"**
The most famous one — said about Chechen militants in 1999. "Мочить" means to wet/soak but in criminal slang means to kill; "сортир" is a crude word for toilet. Often translated as "we'll rub them out in the shithouse."

**"You hire prostitutes specially. You gave them $10 each specifically to discredit me."**
Said to journalists at a press conference, accusing Western media of staging compromising coverage.

**"Since the death of Adolf Hitler, there's no one to talk to..."**
Said in the context of negotiations, implying no other world leader is a sufficiently decisive or powerful interlocutor. The remark is as revealing as it sounds.
16.06.26 14:33
0 0

Но ведь после ядерной войны кому-то нужно будет опять научить людей читать и писать.Так что перспектива есть.
Это уже вторично. Для начала стоило бы научиться строить землянки и разжигать огонь трением.
16.06.26 14:30
0 0

Просто потому, что он не охрипнет и не затупит в самый неподходящий момент.

А если речь идёт о встрече императора Си и Кима? Тут от страха любой ИИ охрипнет! Правда Ким, вроде, выучил китайский.
16.06.26 14:27
0 0

А как ваш хвалёный ИИ переведёт такое:- Если бы у бабушки были внешние половые органы дедушки, она была бы дедушкой, а не бабушкой.- Замучаетесь пыль глотать!- Будем мочить в сортире!- Вы нанимаете шлюх специально. Дали им по 10 долларов, специально чтобы меня дискредитировать- После смерти Адольфа Гитлера не с кем поговорить...
ИИ все эти приколы уже прекрасно понимает и применяет - обучается на лету
16.06.26 14:17
0 0

А как ваш хвалёный ИИ переведёт такое:- Если бы у бабушки были внешние половые органы дедушки, она была бы дедушкой, а не бабушкой.- Замучаетесь пыль глотать!- Будем мочить в сортире!- Вы нанимаете шлюх специально. Дали им по 10 долларов, специально чтобы меня дискредитировать- После смерти Адольфа Гитлера не с кем поговорить...
А вы попробуйте. Я не увидел никаких проблем ни с одной из предложенных фраз. Не понимаю даже, где вы тут увидели сложности. Все это не требует понимания контекста.
16.06.26 14:13
0 2

Вслед за разработчиками сайтов и интерфейсов например. Теперь надо не менее чем "сайты гарантированно приносящие бабло одной кнопкой" и проч.))

Сейчас вместо переводчика надо быть "копирайтером" и "специалистом по межкультурной коммуникации".
16.06.26 13:57
0 0

Тысячи лет эта профессия обеспечивала хлебушек с маслом, а сейчас уже нет.
Но стоит только отключить интернет...

Уже сейчас во время глюков ChatGPT заметно падение активности аналитиков в комментариях, то ли ещё будет )

Но, в целом, да: видно, что грядет очередная революция, сопоставимая, пожалуй, лишь с изобретением интернета.
16.06.26 13:52
0 0

А как ваш хвалёный ИИ переведёт такое:
- Если бы у бабушки были внешние половые органы дедушки, она была бы дедушкой, а не бабушкой.
- Замучаетесь пыль глотать!
- Будем мочить в сортире!
- Вы нанимаете шлюх специально. Дали им по 10 долларов, специально чтобы меня дискредитировать
- После смерти Адольфа Гитлера не с кем поговорить...
16.06.26 13:46
2 2

Но ведь после ядерной войны кому-то нужно будет опять научить людей читать и писать
Но почему вы планируете поручить это переводчикам-синхронистам?
16.06.26 12:18
0 3

Но ведь после ядерной войны кому-то нужно будет опять научить людей читать и писать.
Так что перспектива есть.
16.06.26 12:01
0 2

www.youtube.com

задачка со звездочкой
16.06.26 11:29
0 2

задачка со звездочкой
картинка не картинится.

images.prom.ua
16.06.26 14:19
0 0

або так)
www.youtube.com
lex
16.06.26 11:42
0 0

Скорее бы уже роботы с ИИ, и гедонизм на безусловном доходе. Смогу посвятить время написанию поэм (сам, без ИИ). Левые не будут с пеной у рта требовать отобрать несуществующий триллион у Маска. Правые могут дальше пахать с рассвета и до забора во имя святого Кальвина.
16.06.26 11:16
1 2

Это вот реально мрачный сценарий прогресса
Реально мрачный сценарий прогресса - когда все доходы уходят на то, чтобы штамповать боеприпасы и швыряться ими друг в друга. Мегапроекты на Марсе на этом фоне куда предпочтительнее.
16.06.26 14:32
0 0

Если победит такая зараза как Маск то все безусловные доходы уйдут на его мегапроекты на Марсе. Это вот реально мрачный сценарий прогресса когда всем казалось бы всего будет дофига и можно поделиться но нееет, нафиг вы нужны, все доходы подут на монструозные проекты ибо нефиг.
16.06.26 13:54
0 0

А кашель и кряхтение Путина будет адекватно переводить?
16.06.26 11:15
0 0

неопределенный звук
16.06.26 14:16
0 0

А кашель и кряхтение Путина будет адекватно переводить?
"президент издал губами неопределенный звук' - классика уже
16.06.26 12:19
0 1

Они бы лучше диалог шотландца с ирландцем показали в качестве демки
16.06.26 11:13
0 1

16.06.26 14:05
0 0

16.06.26 14:04
0 0

ИИ справится с таким переводом гораздо лучше живого переводчика.
16.06.26 11:48
0 0

А председатель конференции - американец с южных штатов
Не вижу проблем. Просто взять опытного человека. Ведущего аукционов или даже конгрессмена. Он всё возразит, как надо.

16.06.26 11:41
0 1

Надпись на валлийском внизу взята из автоответа почтовой программы переводчика и гласит: "Извините, меня нет в офисе на данный момент".
16.06.26 11:24
0 1

И валлийца ещё пригласить.
А председатель конференции - американец с южных штатов, которому это всё нужно понять и подготовить возражения сторонам.
16.06.26 11:16
0 1

И валлийца ещё пригласить.
16.06.26 11:15
0 3

Читал заметки переводчиков-синхронистов. Там отдельно был упомянут немецкий язык, где человек произносит длинную фразу, а в конце всставляет частицу отрицания, переворачивающую всю предыдущую фразу в противоположный смысл. Интересно, как с этим она справляется.
16.06.26 11:10
0 2

сделать 10 секундный тайм-шифт
Ну да, пока на улице кричат "гол", у вас все еще в своей штрафной возятся. 😉
16.06.26 14:17
0 0

на английском некоторые любят извернуться и сказать "triple seven"
На русском это вообще будет: три топора, барабанные палочки, гуси-лебеди. 🤣 777-11-77. Шутка, но мало ли приколистов.
16.06.26 14:14
0 0

Есть стримы. Есть онлайн вещание ТВ. То есть все, что идёт в потоке, а не в записи.
Никакой технической проблемы сделать 10 секундный тайм-шифт для любого "онлайн вещания ТВ" - оно, впрочем, и так всё очень условное онлайн
16.06.26 14:14
0 0

записанный любой ролик
Есть стримы. Есть онлайн вещание ТВ. То есть все, что идёт в потоке, а не в записи.
16.06.26 14:11
0 0

Читал заметки переводчиков-синхронистов. Там отдельно был упомянут немецкий язык, где человек произносит длинную фразу, а в конце всставляет частицу отрицания, переворачивающую всю предыдущую фразу в противоположный смысл. Интересно, как с этим она справляется.
у людей зависит от восприятия.
вот, например, кто-то вам диктует номер телефона и вы БЫСТРО записываете
на французском 75 будет шестьдесят пятнадцать. И пока говорят "шестьде..." вы уже написали 6, в потом приходится калякать и исправлять на 7-ку
на английском некоторые любят извернуться и сказать "triple seven", тоже начинаешь писать тройку, но нет ...
на немецком вообще нельзя начинать писать числа со слуха, пока не услышишь все число и наступит пауза
16.06.26 13:58
0 0

Читал заметки переводчиков-синхронистов. Там отдельно был упомянут немецкий язык, где человек произносит длинную фразу, а в конце всставляет частицу отрицания, переворачивающую всю предыдущую фразу в противоположный смысл. Интересно, как с этим она справляется.
Кстати, любопытно, что часто при переводе фильмов ИИ с английского, он в субтитрах не различает мужской и женский род.
Это читается очень странно ...
16.06.26 13:53
0 0

а в конце всставляет частицу


гыыы, Бивис, он сказал "вссссссссставляет частицу"
16.06.26 13:51
0 0

То есть для прослушивания доклада на конференции - это норм. А вот натравить ее на кино/ютуб видео уже облом. Сильное несовпадение звука с актерами.
Ну так как раз на уже записанный любой ролик никаких проблем нету - контекст уже известен и предзаписан. Проанализировать можно сразу вообще весь текст, или кэшировать на плюс сколько нужно секунд-минут. Это не угадайка с прямой речью.
16.06.26 13:14
0 2

Ну так и чем переводчик-синхронист здесь выигрывает?
А я сказал, что он выигрывает? Я просто написал, что плавной параллельной синхронной речи не бывает в силу особенностей конструкций предложений некоторых языков.

То есть для прослушивания доклада на конференции - это норм. А вот натравить ее на кино/ютуб видео уже облом. Сильное несовпадение звука с актерами.
16.06.26 13:11
0 0

Они то сумеют, но это не пара секунд запаздывания, а именно что ожидание законченности целой фразы.
Ну так и чем переводчик-синхронист здесь выигрывает? Ровно также дослушивает фразу до конца, чтобы понять контекст. Или любой другой человек, владеющий обоими языками.
16.06.26 12:44
0 1

А как нативы вообще сживаются с такими проблемами в разговорной речи?
16.06.26 12:04
0 0

Интересно, как с этим она справляется.
Элементарно просто.
16.06.26 11:48
0 0

Не вижу, почему бы голосовым моделям не уметь того же самого.
Они то сумеют, но это не пара секунд запаздывания, а именно что ожидание законченности целой фразы.
16.06.26 11:46
0 2

немецкий перевод зачастую (в нынешних средствах) зависит от того, почтавил точку в конце или нет.
а в конце всставляет частицу отрицания
в конце иногда кучкуются вообще все глаголы - и смысловые, и управляющие, и отрицательная частица. Ну да, странновато, но тыщщу лет так живут.
16.06.26 11:28
0 3

Текстовые LLM-ки умеют, при грамотно составленном промпте, ловить неоднозначность и ждать, пока накопится достаточно контекста, чтобы сделать выбор. Не вижу, почему бы голосовым моделям не уметь того же самого.
16.06.26 11:27
0 2

На S24 Ultra голосовая подсказка Gemini заколебала, выскакивает каждые 10 секунд
16.06.26 11:01
0 1

Демонстрации выглядят впечатляюще, но посмотрим, конечно, как это все будет работать чисто практически. 
А вот так.
16.06.26 10:58
0 3

16.06.26 10:57
0 9

Люблю угадывать содержание таких видео в контексте беседы. Ёлка? Ёлка же, да? /Padme.hum/
16.06.26 12:23
0 1

Жжош, сцуко!
16.06.26 11:14
0 1

Дай бог, через пол годика выкатят...
16.06.26 10:51
0 0

Гениальные возможности, круто, все такое. Но куда полезнее не перевод вот так вот просто - а перевод разговора. Слава богу, наконец-то он начал появляться в телефонах. Почему гугл не прикрутил его прямо в ОС?

Ну или еще более простая и куда более нужная вещь - текстовая запись разговора. Не обычная запись, которая много где нельзя. А вот просто текст, без заранее выбранного языка. В Тимз - пожалуйста. А просто на телефоне, чтобы оно работало сразу при звонке и во всех мессенджерах?
16.06.26 10:50
0 2
Теги
Сортировать по алфавиту или записям
BLM 22
Calella 151
exler.es 338
RIP 133
SNL 1
авто 518
видео 4747
вино 371
еда 558
ЕС 95
игры 124
ИИ 104
кино 1699
попы 211
СМИ 3003
софт 1005
США 303
ФБК 14
шоу 6
Что ещё почитать