首页 抖音热门文章正文

用AI,学一门2000万人在用的“外语”

抖音热门 2025年09月30日 06:53 1 aa

嘈杂或喧嚣?动听或刺耳?

这个世界,听起来是什么声音?

这样的疑问,有一群人很难回答

与此同时

他们的“声音”

也很少被世界听见

用AI,学一门2000万人在用的“外语”

为了让世界听见他们,更听懂他们

百度和天津理工大学聋人工学院的师生们

一直在努力

用AI,学一门2000万人在用的“外语”

9月28日,国际聋人日

让我们一起回顾

AI 如何让世界听见手语的“声音”

▎他们的沉默

“每次走进医院,都被劝说,回家带上父母再来。”这是听力残疾人士明静遭遇的苦恼。

“陪学生去医院看病。”这是天津理工大学聋人工学院副院长袁甜甜执教几年最常做的工作之一。作为一所高等工科特殊教育学院,天津理工大学聋人工学院容纳了500多名明静这样的学生。

第二次全国残疾人抽样调查数据显示,我国大约有2004万听力残疾人,是世界上听力残疾人数最多的国家。然而,我国全职从事手语翻译职业的人员不足千人,约97%的聋人因为手语翻译的缺失面临就诊困难的问题。

用AI,学一门2000万人在用的“外语”

即便有手语作为第一语言,他们和世界的沟通仍然存在厚厚的阻隔:

手语作为视觉语言,培养了听力残疾人士独特的思维逻辑,也给他们理解有声语言造成了困难。即便有实时翻译语音的字幕,也只有配合手语,才能让他们更好地理解意思。

怎么让世界听懂他们?2018年,聋人工学院的老师和学生们共同启动了智能手语翻译项目,孵化成果公司“鲸言科技”。

近几年,百度先后与天津理工大学、鲸言科技合作,共同研发出百度智能云 AI 手语平台与双向手语翻译机。

▎AI 手语平台,双向奔赴

做手语翻译,为什么需要“双向”?“不能让听力残疾群体只接纳信息,不输出自己的信息。”

要搭起听力残疾人士和世界沟通的桥梁,除了“会说”,把语音转化成手语,便利听力残疾人士理解;还要“会听”,能够识别他们的手语动作,转化成语音。

2022年,百度 AI 手语平台实现“手语-汉语”的智能互译。

用AI,学一门2000万人在用的“外语”

百度智能云产品团队联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等,制定面向人工智能应用的自然手语标注规范,建设大规模自然手语翻译语料库,使模型能够生成符合听力残疾人群习惯的自然手语。

百度 AI 手语平台通过4D 扫描技术训练,不仅能呈现出真实生动的面部表情,还借助动作融合算法,如真人般流畅表达11000多个《国家通用手语词典》所涵盖的手语动作,为听力残疾群体打造更具情感表现力的沟通体验。

2024年开始,百度正式投入双向手语翻译机的研发及生产。

用AI,学一门2000万人在用的“外语”

双向手语翻译机集成了百度各项 AI 技术,是多模态 AI 模型的典型应用:

当听力残疾人士打出手语之后,翻译机需要先通过视觉识别及自然语言处理技术,将手语翻译为汉语;健全人理解后,将要回复的内容通过语音识别驱动翻译,最终以手语和文字的形式,再呈现给听力残疾人士。

为此,百度、天津理工大学、鲸言科技在全社会范围内收集了近千万自然手语(含视频、文本、标注等)作为多模态模型训练数据。

“终于有人开始做这件事了。”明静也接触了手语数据的采集工作,她很开心。

这一年,双向手语翻译机研发完成。

越来越多的听力残疾人士,能够在充满声音的世界中找到自己的位置;也将有越来越多的普通人,听到手语翻飞的声音。

听见他们

听见手语的声音

搭起听障人士和世界沟通的桥梁

做好这件有“AI”的事

百度一直在路上

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap