通义实验室推出 Fun-ASR1.5:方言工业级可用,多语言识别能力大幅提升!

张开发
2026/4/22 19:50:05 15 分钟阅读
通义实验室推出 Fun-ASR1.5:方言工业级可用,多语言识别能力大幅提升!
通义实验室正式推出 Fun-ASR1.5 语音识别大模型实现「方言工业级可用」单模型覆盖 30 种语言及多种方言典型方言场景字错误率大幅下降。多语言与方言覆盖Fun-ASR1.5 基于统一大模型架构能无缝覆盖 30 种语言、汉语七大方言体系及 20 地方口音。目前已有 5 种方言准确率突破 90%15 种超过 80%。训练与场景适配该模型基于超数十万小时真实方言语音数据训练涵盖日常对话、地方新闻等多场景支持汉语传统七大方言体系适配 20 地区口音官话。性能提升测试显示典型方言音频上Fun-ASR1.5 相比上一版本平均字错误率相对下降 56.2%赋能县域教育直播等长尾高价值应用场景。特色能力它支持 30 种主流语言精准识别在混合语种对话等场景表现突出还对中文古诗词识别专项优化内部评测集字符级准确率达 97%。后处理优化Fun-ASR1.5 在后处理环节标点预测更智能文本归一化表现进一步提升。编辑观点Fun-ASR1.5 的推出为语音识别领域带来新突破有望在多领域广泛应用推动方言文化传承和多语言交流发展。

更多文章