谷歌DeepMind推出最强手语翻译模型SignGemma，将开源

日期：2025-06-01 来源：网络整理作者：佚名浏览：179

核心提示：谷歌DeepMind最强手语翻译模型登场

IT之家于5月31日传来消息，谷歌的DeepMind团队在5月27日公布了一项新成果——SignGemma手语翻译模型，这是他们迄今为止开发出的功能最为强大的手语翻译工具，它能够把手语转换成口语文本。据悉，这个开源的SignGemma模型将在今年稍晚的时候成为Gemma模型家族的一员。

谷歌语言翻译器_谷歌翻译口技_

谷歌语言翻译器__谷歌翻译口技

IT之家指出，SignGemma模型具备多语言处理能力，目前主要对美式手语（ASL）及英语进行了深入优化。其开源特性允许开发者自由运用并对其进行优化改进。

谷歌语言翻译器__谷歌翻译口技

DeepMind 致力于借助这项技术，消除手语使用者沟通时的障碍，从而使他们能够在工作、学习和社交活动中更加自如地融入。

DeepMind 在今年发布了 Gemma 3n 模型，该模型能够处理音频、图像、视频和文本等多种输入，并生成智能文本，从而帮助开发者构建能够实现实时互动的应用程序。

_谷歌语言翻译器_谷歌翻译口技

此外，谷歌携手佐治亚理工学院以及Wild Dolphin Project，共同研发了DolphinGemma模型。该模型致力于对海豚声音进行分析与生成，其构建基础是源自巴哈马大西洋斑点海豚的长期研究数据。

MedGemma模型作为Gemma 3系列的新添成员，其核心在于专注于医疗领域的AI技术，旨在辅助临床推理以及医学影像的深入分析，从而有效推动医疗行业与人工智能技术的深度融合与创新。

标签： 手语翻译模型 SignGemma DeepMind 开源多语言

打赏

更多>同类资讯