IT之家于5月31日传来消息,谷歌的DeepMind团队在5月27日公布了一项新成果——SignGemma手语翻译模型,这是他们迄今为止开发出的功能最为强大的手语翻译工具,它能够把手语转换成口语文本。据悉,这个开源的SignGemma模型将在今年稍晚的时候成为Gemma模型家族的一员。
IT之家指出,SignGemma模型具备多语言处理能力,目前主要对美式手语(ASL)及英语进行了深入优化。其开源特性允许开发者自由运用并对其进行优化改进。
DeepMind 致力于借助这项技术,消除手语使用者沟通时的障碍,从而使他们能够在工作、学习和社交活动中更加自如地融入。
DeepMind 在今年发布了 Gemma 3n 模型,该模型能够处理音频、图像、视频和文本等多种输入,并生成智能文本,从而帮助开发者构建能够实现实时互动的应用程序。
此外,谷歌携手佐治亚理工学院以及Wild Dolphin Project,共同研发了DolphinGemma模型。该模型致力于对海豚声音进行分析与生成,其构建基础是源自巴哈马大西洋斑点海豚的长期研究数据。
MedGemma模型作为Gemma 3系列的新添成员,其核心在于专注于医疗领域的AI技术,旨在辅助临床推理以及医学影像的深入分析,从而有效推动医疗行业与人工智能技术的深度融合与创新。