Google ouvre ses modèles de traduction. TranslateGemma, une famille de trois modèles (4B, 12B, 27B paramètres), est disponible en open source depuis le 15 janvier. 55 langues validées, près de 500 paires de langues en bonus.
L'annonce vient de David Vilar, chercheur chez Google, et Kat Black, product manager. Les modèles sont construits sur l'architecture Gemma 3 et disponibles sur Kaggle, Hugging Face et Vertex AI. Rien à payer pour télécharger ; rien à demander pour utiliser.
Ce que TranslateGemma apporte aux développeurs
Trois tailles pour trois usages. Le modèle 4B tourne sur mobile. Le 12B passe sur un laptop standard. Le 27B vise le cloud et les gros volumes.
Le plus intéressant : le 12B surpasse le Gemma 3 27B de base sur les benchmarks de traduction, avec moins de la moitié des paramètres. Google a combiné fine-tuning supervisé sur données parallèles (dont des traductions synthétiques Gemini) et reinforcement learning avec modèles de récompense. Résultat : des taux d'erreur réduits sur toutes les familles de langues testées.
Autre point notable : TranslateGemma garde les capacités multimodales de Gemma 3. Un screenshot en japonais ? Le modèle extrait et traduit le texte dans l'image.

Comparaison des taux d'erreur entre Gemma 3 27B et TranslateGemma 12B (source)
Pourquoi c'est un signal fort pour l'écosystème
Jusqu'ici, la traduction de qualité pro restait verrouillée derrière des APIs payantes. DeepL, Google Translate, Microsoft Translator : tous facturés à l'usage. Les alternatives open source demandaient des compromis sur la qualité ou du travail d'intégration conséquent.
TranslateGemma change la donne. Un modèle 12B qui bat les baselines, utilisable localement, sans API, sans coût variable. Pour une startup française qui traite des documents multilingues, la facture mensuelle peut fondre. Pour avoir intégré des solutions de traduction dans plusieurs projets, je sais que le coût à l'usage devient vite un frein quand on scale. Avoir une option locale change la logique économique.
4B : apps mobiles, traduction embarquée
12B : laptops, serveurs légers, meilleur ratio perf/taille
27B : cloud, pipelines industriels, qualité maximale
Les limites à connaître
Les 55 langues sont "rigoureusement testées" selon Google. Les 500 paires supplémentaires ? En exploration communautaire. Autrement dit : Google ne garantit pas la qualité sur toutes les combinaisons. Le rapport technique sur arXiv détaille les performances par famille de langues.
Autre réalité : faire tourner un modèle 12B en local demande du hardware. Comptez 16 Go de RAM minimum, un GPU aide sérieusement. Pas du plug and play pour tout le monde.
Ce qu'il faut surveiller
La communauté va tester. Les premiers retours sur le français, l'arabe, les langues asiatiques arriveront dans les semaines qui viennent. Si la qualité tient ses promesses, TranslateGemma pourrait devenir le standard open source de la traduction.
En résumé : Google met la traduction pro entre les mains de tous. Reste à voir si la communauté tech s'en empare et si les performances tiennent en conditions réelles.


Laisser un commentaire