金融界2025年8月1日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“显示方法及相关装置”的专利,公开号CN120407057A,申请日...
2025-08-01 0
作者:周源/华尔街见闻
在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,社交平台Soul App展示了其自研的全双工通话大模型。
该模型即将在Soul平台开启内测,后续计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景,是社交领域的一项新探索。
就眼下Soul的“虚拟人”应对用户互动场景的表现来看,已深具“真实感”,但这种互动目前仅限于文字形式。
此次推出自研全双工通话大模型,若能实现实时通话,则其智能性确然会有更大提升。
传统语音交互长期依赖VAD(话音活性检测)机制与延迟控制逻辑,形成轮次对话模式。
这种模式的人机对话,呈现一问一答刻板节奏:用户发言结束后,AI才开始响应,中间存在明显延迟,影响了交互的自然性。
在很多时候,用户发言过程中会出现短暂停顿,这可能被系统误判为发言结束,导致AI过早介入,打断用户思路,交流显得过于生硬。
Soul自研的端到端全双工语音通话大模型,对这一传统模式做了调整:不再采用VAD机制,尝试通过算法让AI自主把控对话节奏。
在实际交互中,AI可实时监测对话动态,有能力做出主动打破沉默、适时打断用户、边听边说等操作。
比如,用户讲述事情时稍作停顿思考,AI能察觉并非发言结束,补充引导性话语推动话题;在多人交流场景中,AI能判断发言时机加入讨论,与用户发言相互交织,使对话更流畅,接近人与人面对面交流的状态。
在理论上,这种交互模式使AI从被动的回应者转变为主动的参与者,在一定程度上能提升人机对话的自然度。
为让AI在交互中更接近“真人”,Soul的全双工通话大模型构建了多维度感知体系,包括时间感知、环境感知、事件感知等。通过分析这些维度的信息,AI试图更好地理解用户意图和情感状态,给出贴合情境的回应。
从时间感知来看,AI会依据对话时间调整语言风格和话题。清晨可能以“早上好,新的一天有什么安排吗?”开启对话;深夜用户倾诉烦恼时,回应会更温柔,给予情感支持。
在环境感知上,模型能识别用户所处环境,嘈杂时适当提高音量保证清晰,安静时声音则更轻柔。
在事件感知方面,AI能结合讨论的事件给出针对性观点。用户分享工作中完成重要项目时,AI会表示祝贺并询问细节,增加对话的真实感。
此外,模型在口语化表达和音色复刻上做了优化:能模拟语气词、结巴、情绪起伏等日常口语特征,还可根据用户需求复刻特定音色。
还有情绪表达,AI的声音情绪会随对话推进变化,用户分享喜悦时语调上扬,用户情绪低落时声音低沉关切。
这些处理在一定程度上提升了AI交互的真实感,但距离完全模拟真人还有差距,仍有较大的提升空间。
事实上,在该大模型推出前,Soul虚拟人在1V1或在响应用户评论时的互动中,其表现也有较高的自然性和智能性。若Soul没有标注“虚拟人”标签,其应对内容已具有高度的“真人”感。
全双工通话大模型在Soul平台的多个应用场景中得以应用,在1V1和多对多互动场景中,会对用户的社交体验产生影响。
在虚拟人实时通话场景中,该模型有望让虚拟人与用户的交流更自然。
以往虚拟人对话较刻板,有了这一模型后,虚拟人可实时捕捉用户情绪和话语变化,调整回应方式和语气,提供更个性化的陪伴服务,使用户感受到更真实的情感反馈。
在AI匹配的1V1互动场景中,模型发挥了怎样的作用?比如能通过算法帮助用户筛选契合的聊天对象,提高社交匹配效率。
在交流过程中,模型分析双方对话内容和情绪,适时提供话题建议或引导:当匹配双方初次交流出现冷场,AI会抛出与双方兴趣相关的话题,如“听说你们都喜欢摄影,最近有拍到满意的作品吗?”打破僵局,让交流更顺畅。
在多人语音互动场景如群聊派对中,AI主持人具备相应功能:用户进入群聊派对后,AI主持人能管理群聊秩序,控制发言顺序、提醒文明交流,还能与用户语音互动。
当群内气氛沉闷时,发起如“大家最近有看什么好电影,分享一下吧?”的话题,吸引用户参与;新成员加入时,热情打招呼并引导相互认识,帮助新成员融入,在一定程度上可能提升群聊派对的参与度。
Soul全双工通话大模型的出现,为自身平台发展带来了新的方向,也为AI社交行业提供了参考案例。
这个模型展示了AI技术在社交领域的一种应用可能:即通过技术创新突破传统交互限制,实现更自然的社交体验。
随着该技术的推广应用,其他社交平台可能会增加AI技术研发投入,探索将AI技术融入社交场景,推动行业技术发展。比如提升对话流畅性,或在多维度感知方面深入研究,增强社交体验的沉浸感。
Soul的实践会吸引更多开发者关注AI社交领域,促使新的社交应用和服务出现。AI社交的发展会影响人们的社交方式和观念,打破地域、时间限制,让人们更便捷地结识不同地区的朋友,拓展社交圈。
随着AI在社交中作用渐显,人们对“社交”的定义可能发生变化,更注重与AI及其他用户的情感共鸣和信息交流。
Soul全双工通话大模型即将内测并应用,是AI社交领域的一次新尝试:凭借新的技术架构和应用场景,为用户带来新的社交体验,为行业发展提供思路。
本文来自华尔街见闻,欢迎下载APP查看更多
相关文章
金融界2025年8月1日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“显示方法及相关装置”的专利,公开号CN120407057A,申请日...
2025-08-01 0
2025年我们见证了非常反常的一幕:主打泛二次元文化的哔哩哔哩世界数字娱乐动漫文化博览会(BW2025)现场汇集着佳能索尼富士松下唯卓仕等相机/镜头品...
2025-08-01 0
作者:周源/华尔街见闻在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,社交平台Soul App展示了其自研的...
2025-08-01 0
24款小游戏37起联名文/凜祢、锦西我们整理了微信小游戏,在过去半年的IP联名情况。37起IP合作中涉及24款小游戏,分别是:《向僵尸开炮》、《跃动小...
2025-08-01 0
北京商报讯(记者 胡永新)7月31日,由北京商报社、深蓝媒体智库主办的“AI金融双刃剑:从安全底线寻找转型机遇沙龙”在上海成功举办。对于当前AI应用的...
2025-08-01 0
金融界2025年8月1日消息,国家知识产权局信息显示,科磊股份有限公司取得一项名为“用于改善半导体装置的不对齐及不对称性的小波系统及方法”的专利,授权...
2025-08-01 0
金融界2025年8月1日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司取得一项名为“媒体信息的播放方法、装置、设备、存储介质及产品”的专利,授...
2025-08-01 0
发表评论