近年来,随着人工智能的发展,各种语音合成应用也迅速普及,如即时的文本信息转语音、视觉障碍人士的辅助软硬件,甚至是推销电话、厂商客服以及短视频配音等,都有语音合成的身影。不仅如此,技术手段的加持,使得语音合成呈现出更逼真的人声、更自然的音色以及有一定情感起伏的语调。
近日,中国科学院大学成都学院科学前沿讲座邀请了中国科学技术大学教授凌震华,以《语音合成基础与前沿进展》为主题,介绍了语音合成技术的最新进展,包括语音信号的离散表征与基于大模型架构的语音合成方法,以及以改变语音中说话人音色为目标的声音转换任务等。
凌震华表示,赋予机器像人一样自如说话的能力,是人工智能领域的关键技术之一。“我们做语音合成,就是利用机器去模拟人类将文本转化成声学信号的生理过程。”讲座中,凌震华从语音合成的基本概念,以及语音合成技术的发展历史讲起,重点介绍波形拼接语音合成与统计参数语音语音合成两条技术路线。
2013年深度学习技术被引入语音合成后,基于深度学习的统计参数语音合成日益受到研究关注。为此,他围绕早期帧对齐预测的深度学习声学建模方法,以及神经网络声码器与序列到序列的深度学习声学建模方法等,作了深入浅出的讲解。
对于语音合成技术研究面临的挑战和发展方向,凌震华也提出了自己的思考。“例如,一些方言或特殊语种的数据采集受限,这是我们未来在语音合成研究中需要考虑的方面。”
据悉,科学前沿讲座是由中国科学院大学成都学院主办的学术讲座。讲座主要面向学院内师生,内容涉及科技领域最新、最尖端以及最具挑战性的研究方向和课题,以拓宽学生的学科视野,激发创新热情。
近年来,随着人工智能的发展,各种语音合成应用也迅速普及,如即时的文本信息转语音、视觉障碍人士的辅助软硬件,甚至是推销电话、厂商客服以及短视频配音等,都有语音合成的身影。不仅如此,技术手段的加持,使得语......
近年来,随着人工智能的发展,各种语音合成应用也迅速普及,如即时的文本信息转语音、视觉障碍人士的辅助软硬件,甚至是推销电话、厂商客服以及短视频配音等,都有语音合成的身影。不仅如此,技术手段的加持,使得语......
挖掘铲将萝卜松土,扶缨器捋直萝卜缨,夹拔带拔出萝卜,切割器斩断萝卜缨,萝卜落入传送带后被传送至收集箱……在江苏省南京市六合区竹镇蔬菜种植基地里,一垄垄萝卜就这样被整齐划一地连根拔起,轻松完成了“采收之......
蒋新松(1931年8月3日—1997年3月30日)人们知道钱学森,知道李四光,却未必听说过蒋新松的名字。1998年3月,中共中央组织部、中共中央宣传部、中共国家科委党组、中共中国科学院党组、中共中国工......
12月19日,《自然-计算科学》发表的一项研究描述了一种机器学习方法,能够从不同方面准确预测人类生活,包括早死可能性和个性的细微差异。该模型或许能提供对人类行为的量化认知。社会科学家对人类生活是否能被......
癌症以高发病率和高死亡率严重威胁着人们的生命健康。因此,寻找肿瘤治疗新原理、新方法,提高治疗效果,并降低副作用,是当前生命化学和医学领域亟待解决的科学问题。近日,华东理工大学化学与分子工程学院副教授钱......
零距离中国团队历时8年打造“最强化学大脑”机器化学家诞生记在中国科学技术大学的机器化学家实验室,可以看见颇具科技感的一幕——一个体型“敦实”但动作灵活的机器人,在操作台之间穿梭,伸出机械手臂配制试剂。......
近日,在国网天津电科院高压试验大厅中,科研人员正在检测一个像鱼一样的机器人的各项性能。这条“机器鱼”在变压器矿物绝缘油中,可以清晰、准确、快速地识别、检测出大型变压器内部碳痕、电树枝放电等典型缺陷,并......
如今,有超过三分之一的药品是基于自然界的活性物质合成的,在众多植物、细菌和真菌中出现的次级天然物质可以消炎,可以抵御病原体,甚至可以防止癌细胞的生长。但是,利用自然界药柜提供的财富和识别新天然物质是非......
一个日本、美国联合科研团队开发了一种机器学习技术,利用质谱评估复杂的有机混合物,可以更加可靠地寻找外星生物。研究于3月12日发表在《生命》上,标题为“ClassificationoftheBiogen......