生活 理财 投资 股票知识 贷款 基金
早泄 皮肤补水 白癜风 雀斑 癫痫 高血压 肝硬化 青光眼 尿毒症 腹泻 腰肌劳损 预防肝癌 牙龈肿痛 改善哮喘 痛经 前列腺炎 广告
首页 > 资讯> 热点推荐 > 正文

准确率接近真人 字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0

2025-07-24 15:01 投稿:admin 广告
核心提示:今天,字节跳动Seed团队正式发布端到端同声传译模型Seed LiveInterpret 2.0,是首个延迟&准确率接近人类水平的产品级中英语音同传系统。

今天,字节跳动Seed团队正式发布端到端同声传译模型Seed LiveInterpret 2.0,是首个延迟&准确率接近人类水平的产品级中英语音同传系统。

 
据官方介绍,它基于全双工端到端语音生成理解框架,支持中英互译,可实时处理多人语音输入,像人类同传译员一样以极低的延迟“边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0还支持0样本声音复刻,让沟通更加流畅自然。
 
在测试中,可以观察到,Seed LiveInterpret 2.0面对40秒的大段中文表达,能够低延迟地丝滑输出同款音色的英语翻译。此外,Seed LiveInterpret 2.0还能快速学习音色。
 
相比传统机器同传系统,Seed LiveInterpret 2.0模型具备以下优势:
 
接近真人同传的翻译准确率。精准的语音理解能力保障了翻译准确度,在多人会议等复杂场景中英双向翻译准确率超70%,单人演讲翻译准确率超80%,接近真人专业同传水平。
 
极低延迟的“边听边说”能力。采用全双工语音理解生成框架,翻译延迟可低至2-3秒,较传统机器同传系统降低超60%,实现了真正的“边听边说”翻译。
 
零样本声音复刻,音色真实自然。只需采样实时语音信号,便能提取声音特征,用说话人的音色特质实时“说出”外语,提升交流的沉浸感和亲和力。
 
智能平衡翻译质量、延迟和语音输出节奏。可根据语音清晰度、流畅度、复杂程度,调整输出节奏,并适配不同语言特性。面对超长信息,依然能保证传译语音节奏的自然流畅。
 
目前Seed LiveInterpret 2.0技术报告已公布,模型基于火山引擎对外开放。此外,Ola Friend耳机也将在8月底接入Seed LiveInterpret 2.0,成为首个支持该模型的智能硬件设备。
 
来源: IT之家

版权及免责声明:本文内容由入驻卓商务会员投稿发布或转载,该文观点仅代表作者本人,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至zhuoshangwu888@126.com 举报,一经查实,本站将立刻删除。

大家关注
最新热点一周热点
健康导购更多
举报/反馈