4月9日消息,字节跳动正式宣布推出原生全双工语音大模型Seeduplex,相较于上一代半双工豆包端到端语音模型,该模型采用“边听边说”全新框架设计,大幅提升了语音交互的自然感与顺畅度,让AI通话体验更贴近真人交流。
据官方介绍,Seeduplex核心实现两大技术突破。其一的精准抗干扰能力,让模型具备持续“倾听”能力,可精准适配用户声学环境,有效过滤背景噪音与无关对话,在复杂场景下,误回复率和误打断率较半双工模型减少一半。
其二是动态判停功能,模型可结合语音与语义特征判断用户意图,灵活控制对话节奏,既能耐心等待用户思考犹豫,也能在用户说完后快速响应,抢话比例较半双工模型下降40%。多维度评测显示,该模型在对话流畅度、节奏感上优于传统半双工方案及行业主流语音通话功能,判停表现提升8%。
大规模A/B实验数据表明,Seeduplex上线后,豆包语音通话的时长、用户留存等核心指标均正向提升,通话满意度绝对值提高8.34%,“抢话”“响应慢”等负面反馈显著减少。目前该模型已在豆包App全量上线(需选择桃子音色),用户更新App至最新版本,在对话框选择“打电话”即可体验。