清华大学与巨人网络联合首创多方言语音合成大模型框架

上海证券报·中国证券网 10-15 18:33


上证报中国证券网讯(记者罗茂林)10月15日,记者从巨人网络获悉,巨人网络AI Lab与清华大学电子工程系SATLab的研究团队联合首创多方言语音合成大模型框架DiaMoE-TTS,数据代码方法全开源,借此推动方言语音合成的公平与普惠。

在当今大模型引领的语音合成时代,通用TTS系统已展现出令人惊叹的能力,但方言TTS依然是相关从业者难以触及的“灰色地带”。现有的工业级模型往往依赖巨量专有数据,这让方言TTS从业者和研究者几乎无从下手:缺乏统一的语料构建方法,更缺乏一个可实现多语言的端到端开源框架。

据悉,双方联合首创的DiaMoE-TTS,这是一个在一定程度上媲美工业级方言TTS模型的开源全套解决方案。他们基于语言学家的专业经验,构建了一个统一的IPA表达体系,并且在仅依赖开源方言ASR数据的前提下提出这一方案。

在推出广东话、四川话、上海话等中文方言版本之前,研究团队已在英语、法语、德语、荷兰比尔茨语等多语种场景中进行验证,确保该方法具备全球范围内多语言的可扩展性与稳健性。

巨人网络AI Lab与清华大学电子工程系SATLab希望借此推动方言语音合成的公平与普惠,让任何研究者、开发者乃至语言文化保护工作者都能自由使用、改进与扩展这一框架;让小众语言与方言不再被淹没在通用大模型洪流中,而能通过开源的力量被更广泛地听见与传承。

(文章来源:上海证券报·中国证券网)

文章来源:上海证券报·中国证券网
文章作者:罗茂林
原标题:清华大学与巨人网络联合首创多方言语音合成大模型框架
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
学习时报:努力稳股市让老百姓的消费底气更足
学习时报:努力稳股市让老百姓的消费底气更足
学习时报 551评论
金价再创历史新高!瑞银唱多:明年一季度前有望站上4700美元
金价再创历史新高!瑞银唱多:明年一季度前有望站上4700美元
财联社 299评论
突发!美国、印度重大变局!特朗普再次向印度施压
突发!美国、印度重大变局!特朗普再次向印度施压
证券时报网 348评论
这个赛道火热!全球AI眼镜上半年出货量大增超64%
这个赛道火热!全球AI眼镜上半年出货量大增超64%
证券时报网 120评论
打开东方财富APP查看更多内容
24小时点击排行
操作:CPO强势归来!小白白乘胜追击,布局二次行情,速速发车
集体狂欢 宁德业绩炸裂
清者自清
核聚变赛道,10家龙头亮眼!
深夜利好,5个科技龙头利润翻倍,科大讯飞暴增202%,主线确定
点击查看更多内容
写评论 ...