Google har lanceret et AI-system der oversætter tale i realtid og lyder som dig.
Modellen hedder Gemini 3.5 Live Translate og er fra denne uge på vej ud i Google Translate, Google Meet og via Googles udvikler-API. Den dækker mere end 70 sprog og er designet til at fastholde den oprindelige talers stemmeprofil, hastighed og tonefald.
Det er ifølge Google en konkret forbedring frem for tidligere systemer, der ventede til taleren var færdig og derefter leverede oversættelsen i en flad robotstemme.
Lyder som taleren, ikke som en robot
Den nye model bygger lyden løbende, mens taleren stadig snakker, og forskydningen mellem original og oversættelse er typisk få sekunder. Outputtet er “naturligt lydende oversat tale, der bevarer talerens intonation, tempo og pitch”, oplyser Google på selskabets blog.
På Android-appen er der samtidig kommet en såkaldt listening mode. Funktionen lader brugeren holde telefonen op til øret som ved et almindeligt opkald og høre oversættelsen direkte i højtaleren, skriver det amerikanske teknologimedie 9to5Google. Den er tænkt til de situationer, hvor man ikke lige har høretelefoner ved hånden, men stadig vil have privat lyd.
Vandmærket lyd skal afsløre AI
Hver eneste lydfil, systemet producerer, bliver mærket med Googles vandmærke-teknologi SynthID. Vandmærket er ikke hørbart, men kan aflæses af software og skal gøre det muligt at spotte AI-genereret tale ude i omløb.
Det er især relevant, fordi en model, der kan efterligne en specifik stemme, også åbner for misbrug, eksempelvis svindelopkald der lyder som en chef, en politiker eller et familiemedlem.
Tre rollouts på én gang
Funktionen er ikke gemt bag en venteliste. Den almindelige Translate-app på Android og iOS får adgang fra denne uge, mens udviklere kan teste den i offentlig preview via Gemini Live API og Google AI Studio.
Erhvervskunder med Google Workspace får adgang via en lukket preview i Google Meet. Her er pointen, at 70 sprog tilsammen giver mere end 2.000 mulige kombinationer i ét og samme møde, frem for det tidligere setup, hvor alt skulle gå via engelsk.
For danske brugere er timingen til at få øje på. Åbningskampen ved VM i fodbold spilles torsdag den 11. juni på Estadio Azteca i Mexico City, og turneringen kører frem til 19. juli på tværs af USA, Mexico og Canada. Tilrejsende fans og forretningsrejsende får dermed en oversætter i lommen, lige som behovet topper.
Apple introducerede sidste år en lignende liveoversættelsesfunktion til AirPods, men den dækker et mindre udvalg af sprog og kræver bestemte modeller af hovedtelefoner. Googles løsning kører direkte i mobilappen uden ekstra udstyr.