发布时间:2024-05-25 17:12 原文链接: 首个支持30种方言混说语音大模型发布

“唔该查吓电话费吖”“侬帮阿拉查下话费好伐?”中国电信万号智能客服每天接到几百万通电话,其中许多是用方言拨打,尤其是一些老人习惯说方言、只会说方言,智能客服及人工客服都难以理解,沟通效率大打折扣。

近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。

据统计,全国仍有约20%人口未普及普通话,他们常常被隔绝在智能信息服务之外,难以享受到AI时代的便利。构建高质量方言数据库,是方言保护和研究的基础。当前,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。

中国电信人工智能研究院(TeleAI)坚持自主研发创新,推出了星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持最多方言、覆盖人口最多的语音大模型。

据中国电信首席技术官、人工智能研究院院长李学龙介绍,研发团队首创“蒸馏+膨胀”联合训练算法,解决了超大规模多场景数据集和大规模参数条件下预训练坍缩的问题,并实现1B参数80层模型稳定训练。同时,星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,其通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。

AI正在为传承语言文化注入全新生命力。方言语料采集、记录和归纳后,需保证能被后人正确理解。中国幅员辽阔,“百里不同俗,十里不同音”各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。

星辰语音大模型已广泛应用落地。据介绍,星辰语音大模型已在福建、江西、广西、北京、内蒙等地的中国电信万号智能客服试点应用,接入星辰大模型以后,万号智能客服秒懂30种方言,实现日均处理约200万通电话;智能客服翼声平台接入星辰大模型的语音理解和分析能力,实现31省全覆盖,每天处理125万通客服电话。此外,星辰语音大模型还落地多地市的12345平台。


相关文章

两名学者获“人民教育家卫兴华经济学教育奖”

5月25日,第二届“人民教育家卫兴华经济学教育奖”颁奖典礼在南京大学举行。中国人民大学教授吴易风和厦门大学教授吴宣恭被授予第二届“人民教育家卫兴华经济学教育奖”。山西大学校长黄桂田主持颁奖典礼并宣读获......

第七届人工智能与大数据国际会议在成都召开

5月25日,第七届人工智能与大数据国际会议(ICAIBD2024)在成都隆重召开。本次会议吸引了来自中国在内的多个国家约200余位人工智能和大数据领域的专家、学者和企业代表线上线下共同参与,来自多个国......

2024四川省科技活动周暨蓉城科学之夜开启

5月24日,2024四川省科技活动周暨蓉城科学之夜启动仪式(以下简称启动仪式)在成都科创生态岛1号馆举行。即日起,围绕“弘扬科学家精神,激发全社会创新活力”的主题,2024成都市科技活动周将通过“线下......

我国新药注册临床试验首破4000项

5月20日是国际临床试验日,国家药品监督管理局药品审评中心(以下简称药审中心)于当日发布了《中国新药注册临床试验进展年度报告(2023年)》(以下简称报告)。报告截图。报告显示,药物临床试验登记与信息......

陈厚群:为祖国高坝大库筑牢“安全线”

清晨的阳光透过窗户洒进房间,92岁的中国工程院院士陈厚群开始了新的一天。他来到书桌前,开始阅读一些业务书籍。尽管已退休多年,但科研工作者的“惯性”使他依然保持着对高坝工程抗震科研的关注和热情。作为我国......

“具身智能已成为人工智能的下一个浪潮”

“具身智能旨在发展基于数据驱动的软硬件结合智能体,以不同形态的机器人在真实物理环境下执行任务为主要方式,来实现人工智能的进化,具备自感知、自认知、自决策、自执行、自学习等智能特征。”2024松山湖科学......

跨越10万年,他们用“指纹”解锁中国水稻演化史

5月24日,距离杭州约120公里的浙江省浦江县,蓝天白云下,稻田环绕间,上山遗址迎来一个重要发现。中国科学院地质与地球物理研究所(以下简称地质地球所)研究员吕厚远、张健平,与浙江省文物考古研究所、临沂......

《2024松山湖科学会议共识》正式发布

5月25日至26日,由东莞市人民政府与广东院士联合会共同主办的2024松山湖科学会议在东莞举行。本次会议聚焦“具身智能”领域,与会院士专家通过深入交流、研讨,广泛凝聚科学共识,在大会正式发布了《202......

国内首部干燥综合征超说明书用药指南发布

5月25日,2024年广东省药学会风湿免疫用药专家委员会学术年会在广州举行。会上,《干燥综合征超药品说明书用药中国临床实践指南(2023版)》(以下简称《指南》)正式发布,这是国内首部干燥综合征超说明......

第四届数学促进企业创新发展论坛在广州举行

5月24日至26日,中国工业与应用数学学会(CSIAM)第四届数学促进企业创新发展论坛在广州举行。来自全国300余名数学界及产业界专家、学生代表等齐聚一堂,围绕数学界与企业界合作、创新链与产业链融合、......