
2023年7月24日,人工智能翻译领域迎来重大突破。字节跳动Seed团队正式推出端到端同声传译模型——Seed LiveInterpret 2.0。这款产品以接近人类水平的超低延迟与翻译准确率,成为当前极具竞争力的中英语音同传系统。
LiveInterpret 2.0究竟有何不凡?它首次实现了真正的“边听边说”。这套基于全双工端到端语音生成理解框架打造的系统,能够实时处理多人语音输入。如同专业同传译员一般,它在接收源语言(如中文)声音的同时,便迅速输出目标语言(如英文)的翻译语音。其核心优势为:
· 翻译准确率逼近真人:系统在复杂场合表现卓越,如多人会议场景下中英互译准确率超70%,单人演讲中翻译准确率更超80%,直追专业译员水平。
· 极低延迟实现“边听边说”:得益于创新的全双工框架,翻译延迟低至2-3秒,比传统系统大幅降低60%以上,实时翻译体验提升显著。
· 声音复刻自然流畅:LiveInterpret 2.0具备“0样本声音复刻”技术,它仅需捕获实时语音信号,便能精准提取说话者声音特征,随即以完全相同的独特音色“说出”外语,大大增强了沟通的亲自然感与沉浸感。
· 智能调节输出节奏:面对不同场景与说话节奏,系统能在确保翻译质量的前提下,根据语速清晰度、语句复杂程度等因素进行智能优化,即使是复杂长句传译也能确保流畅自然的表达节奏。
现场测试结果令人印象深刻:当40秒的较长中文发言结束时,系统不仅以极低延迟完成了翻译,更能精准模拟原说话人音色输出流畅的英文翻译,整个传译过程如行云流水。
这一尖端技术成果将加速转化应用。据了解,Seed LiveInterpret 2.0的详细技术报告已正式对外披露,基于火山引擎构建的模型能力已实现开放共享。更值得期待的是,Ola Friend智能耳机将于8月底率先集成该模型,成为首个搭载这项领先同传技术的智能硬件产品。
LiveInterpret 2.0的发布标志着机器同声传译正式步入实用新阶段,开启了高效流畅沟通的全新可能。

