科技媒体NeoWin报道,微软近日发布新一代DragonV2.1 Neural零次学习模型,该文本转语音系统仅需数秒语音样本即可生成超100种语言的逼真语音。相比前代产品,新模型在发音准确性方面取得突破性进展,单词错误率平均降低12.8%,特别改善了专有名词的发音问题。 这项技术创新通过SSML音素标签和自定义词典实现精准的发音控制,可应用于智能客服语音定制、多语言视频配音等场景。微软同步推出Andrew、Ava等预设音色库,方便用户体验其卓越的自然语言表现力。
扫码关注二维码
2025-07-29 20:55
2025-07-30 19:56
2025-07-28 19:35
2025-07-28 09:34
2025-07-29 11:25
2025-07-25 17:56
扫码加入社群
扫一扫
关注亿恩公众号