赛道Hyper | Soul推出全双工通话大模型

景点排名 2025年08月01日 20:05 0 admin

作者：周源/华尔街见闻

在 2025 世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2025）展览现场，社交平台Soul App展示了其自研的全双工通话大模型。

该模型即将在Soul平台开启内测，后续计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景，是社交领域的一项新探索。

就眼下Soul的“虚拟人”应对用户互动场景的表现来看，已深具“真实感”，但这种互动目前仅限于文字形式。

此次推出自研全双工通话大模型，若能实现实时通话，则其智能性确然会有更大提升。

调整传统交互模式

传统语音交互长期依赖VAD（话音活性检测）机制与延迟控制逻辑，形成轮次对话模式。

这种模式的人机对话，呈现一问一答刻板节奏：用户发言结束后，AI才开始响应，中间存在明显延迟，影响了交互的自然性。

在很多时候，用户发言过程中会出现短暂停顿，这可能被系统误判为发言结束，导致AI过早介入，打断用户思路，交流显得过于生硬。

Soul自研的端到端全双工语音通话大模型，对这一传统模式做了调整：不再采用VAD机制，尝试通过算法让AI自主把控对话节奏。

在实际交互中，AI可实时监测对话动态，有能力做出主动打破沉默、适时打断用户、边听边说等操作。

比如，用户讲述事情时稍作停顿思考，AI能察觉并非发言结束，补充引导性话语推动话题；在多人交流场景中，AI能判断发言时机加入讨论，与用户发言相互交织，使对话更流畅，接近人与人面对面交流的状态。

在理论上，这种交互模式使AI从被动的回应者转变为主动的参与者，在一定程度上能提升人机对话的自然度。

为让AI在交互中更接近“真人”，Soul的全双工通话大模型构建了多维度感知体系，包括时间感知、环境感知、事件感知等。通过分析这些维度的信息，AI试图更好地理解用户意图和情感状态，给出贴合情境的回应。

从时间感知来看，AI会依据对话时间调整语言风格和话题。清晨可能以“早上好，新的一天有什么安排吗？”开启对话；深夜用户倾诉烦恼时，回应会更温柔，给予情感支持。

在环境感知上，模型能识别用户所处环境，嘈杂时适当提高音量保证清晰，安静时声音则更轻柔。

在事件感知方面，AI能结合讨论的事件给出针对性观点。用户分享工作中完成重要项目时，AI会表示祝贺并询问细节，增加对话的真实感。

此外，模型在口语化表达和音色复刻上做了优化：能模拟语气词、结巴、情绪起伏等日常口语特征，还可根据用户需求复刻特定音色。

还有情绪表达，AI的声音情绪会随对话推进变化，用户分享喜悦时语调上扬，用户情绪低落时声音低沉关切。

这些处理在一定程度上提升了AI交互的真实感，但距离完全模拟真人还有差距，仍有较大的提升空间。

事实上，在该大模型推出前，Soul虚拟人在1V1或在响应用户评论时的互动中，其表现也有较高的自然性和智能性。若Soul没有标注“虚拟人”标签，其应对内容已具有高度的“真人”感。

全双工通话大模型在Soul平台的多个应用场景中得以应用，在1V1和多对多互动场景中，会对用户的社交体验产生影响。

在虚拟人实时通话场景中，该模型有望让虚拟人与用户的交流更自然。

以往虚拟人对话较刻板，有了这一模型后，虚拟人可实时捕捉用户情绪和话语变化，调整回应方式和语气，提供更个性化的陪伴服务，使用户感受到更真实的情感反馈。

在AI匹配的1V1互动场景中，模型发挥了怎样的作用？比如能通过算法帮助用户筛选契合的聊天对象，提高社交匹配效率。

在交流过程中，模型分析双方对话内容和情绪，适时提供话题建议或引导：当匹配双方初次交流出现冷场，AI会抛出与双方兴趣相关的话题，如“听说你们都喜欢摄影，最近有拍到满意的作品吗？”打破僵局，让交流更顺畅。

在多人语音互动场景如群聊派对中，AI主持人具备相应功能：用户进入群聊派对后，AI主持人能管理群聊秩序，控制发言顺序、提醒文明交流，还能与用户语音互动。

当群内气氛沉闷时，发起如“大家最近有看什么好电影，分享一下吧？”的话题，吸引用户参与；新成员加入时，热情打招呼并引导相互认识，帮助新成员融入，在一定程度上可能提升群聊派对的参与度。

Soul全双工通话大模型的出现，为自身平台发展带来了新的方向，也为AI社交行业提供了参考案例。

这个模型展示了AI技术在社交领域的一种应用可能：即通过技术创新突破传统交互限制，实现更自然的社交体验。

随着该技术的推广应用，其他社交平台可能会增加AI技术研发投入，探索将AI技术融入社交场景，推动行业技术发展。比如提升对话流畅性，或在多维度感知方面深入研究，增强社交体验的沉浸感。

Soul的实践会吸引更多开发者关注AI社交领域，促使新的社交应用和服务出现。AI社交的发展会影响人们的社交方式和观念，打破地域、时间限制，让人们更便捷地结识不同地区的朋友，拓展社交圈。

随着AI在社交中作用渐显，人们对“社交”的定义可能发生变化，更注重与AI及其他用户的情感共鸣和信息交流。

Soul全双工通话大模型即将内测并应用，是AI社交领域的一次新尝试：凭借新的技术架构和应用场景，为用户带来新的社交体验，为行业发展提供思路。

本文来自华尔街见闻，欢迎下载APP查看更多

发表评论