动物所在鸟类声音识别研究中取得新进展

在物种演化的漫长过程中,很多物种都形成了具有自身特异性的“叫声”。我们可以利用这些物种特异性的“叫声”来识别不同的物种。同样,研究人员发现,在同一个物种的不同个体之间,它们的“叫声”也存在着不同程度的差异。这些差异可以被用来进行个体识别。利用“叫声”来进行种间的物种识别及种内的个体识别一直是动物学研究的热点之一。然而,传统的基于“叫声”记录图谱比较以及“叫声”记录长时统计量的分析,不仅在识别的准确性上无法让人满意,而且是一个非常费时费力的人工过程。 在语音识别的自动化取得突破之后,很多研究者就开始尝试把语音识别领域的方法应用到“叫声”的种间识别以及种内的个体识别中来,并且取得了很好的效果。然而到目前为止,多数的研究还只是种间识别,而且这种识别基本上都是基于“叫声”的某一音节类型。 中国科学院动物研究所的科研人员利用语音识别领域的先进技术和模式识别方法,在四种雀形目鸟类中进行了种内个体识别的研究。在声......阅读全文

动物所在鸟类声音识别研究中取得新进展

  在物种演化的漫长过程中,很多物种都形成了具有自身特异性的“叫声”。我们可以利用这些物种特异性的“叫声”来识别不同的物种。同样,研究人员发现,在同一个物种的不同个体之间,它们的“叫声”也存在着不同程度的差异。这些差异可以被用来进行个体识别。利用“叫声”来进行种间的物种识别及种内的个体

ZLG深度解析:语音识别技术(二)

6、波束形成波束形成是指将一定几何结构排列的麦克风阵列的各个麦克风输出信号,经过处理(如加权、时延、求和等)形成空间指向性的方法,可用于声源定位和混响消除等。波束形成主要分为:固定波束形成、自适应波束形成和后置滤波波束形成等。2语音识别的基本原理已知一段语音信号,处理成声学特征向量之后表示为

ZLG深度解析:语音识别技术(一)

语音识别已成为人与机器通过自然语言交互重要方式之一,本文将从语音识别的原理以及语音识别算法的角度出发为大家介绍语音识别的方案及详细设计过程。语言作为人类的一种基本交流方式,在数千年历史中得到持续传承。近年来,语音识别技术的不断成熟,已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”

语音识别技术分析:语音变成文字其实没有那么神秘2

  那每帧音素对应哪个状态呢?有个容易想到的办法,看某帧对应哪个状态的概率最大,那这帧就属于哪个状态。比如下面的示意图,这帧对应 S3 状态的概率最大,因此就让这帧属于 S3 状态。  那这些用到的概率从哪里读取呢?有个叫“声学模型”的东西,里面存了一大堆参数,通过这些参数,就可以知道帧和状态对应的

语音识别技术分析:语音变成文字其实没有那么神秘1

  简要给大家介绍一下语音怎么变文字的吧。希望这个介绍能让所有同学看懂。  首先,我们知道声音实际上是一种波。常见的 mp3、wmv 等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如 Windows PCM 文件,也就是俗称的 wav 文件。wav 文件里存储的除了一个文件

我国学者实现对类脑语音的识别

记者16日从安徽大学获悉,该校集成电路学院吴秀龙课题组与北京大学杨玉超教授课题组合作,利用动态忆阻器的动力学行为,开发了一种生物学可解释的特征提取单元,用于提取语音事件信号时空特征,并基于此单元成功构建了语音识别硬件系统进行实验验证。相关研究成果日前在线发表于国际学术期刊《科学‧进展》上。目前,基于

类器官电子混合计算系统可识别语音

  美国科学家报告了一种由电子硬件和一个大脑类器官组成的混合计算系统,可以执行如语音识别和非线性方程预测等任务。这一研究凸显出一种可能的方法,或可克服现有计算硬件的一些限制。相关研究12月12日发表于《自然—电子学》。  随着人工智能(机器学习和人工神经网络模型)成为关键驱动因素,近年来对算力的需求

解析设计ARM语音识别系统的步骤(二)

  2.3 语音组成单元规划  TTS(Text To Speech)文本转语音技能是人机智能对话开展的趋势。依据TTS技能的语音系统无需事前录音就能够随时依据查询条件查出并组成语音进行播报,然后大大减少了系统维护的作业量。利用此技能,经过MCU或许PC机就能操控语音芯片发音。  这篇文章选

解析设计ARM语音识别系统的步骤(一)

  伴着高新技能在军事范畴的大范围利用,武器装备逐渐向高、精、尖方面开展。传统的军事练习因为练习时刻长、练习费用高、练习空间窄,常常不能到达预期的练习作用,已不能满意现代军事练习的需求。为解决上述问题,模仿练习应运而生。    为进一步提高练习作用,这篇文章利用智能语音交互芯片规划了某模仿练

我国学者实现对类脑语音的识别

记者16日从安徽大学获悉,该校集成电路学院吴秀龙课题组与北京大学杨玉超教授课题组合作,利用动态忆阻器的动力学行为,开发了一种生物学可解释的特征提取单元,用于提取语音事件信号时空特征,并基于此单元成功构建了语音识别硬件系统进行实验验证。相关研究成果日前在线发表于国际学术期刊《科学进展》上。目前,基于深

模拟AI芯片将语音识别能效提升14倍

  美国IBM研究实验室的科学家报告了一种能效为传统数字计算机芯片14倍的人工智能(AI)模拟芯片。这一芯片在语音识别上的效率超过了通用处理器,该技术或能打破当前AI开发中因对算力性能和效率的需求而遇到的瓶颈。相关研究近日发表于《自然》。  随着AI技术的崛起,对能源和资源的需求也随之上升。在语音识

模拟AI芯片将语音识别能效提升14倍

原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507362.shtm美国IBM研究实验室的科学家报告了一种能效为传统数字计算机芯片14倍的人工智能(AI)模拟芯片。这一芯片在语音识别上的效率超过了通用处理器,该技术或能打破当前AI开发中因对算力性能和效

研究人员提出基于神经元整合发放的语音识别新机制

  基于注意力机制的端到端模型正深刻影响着语音识别技术的发展。但经典的注意力识别模型因“要对整句语音编码后投入注意力”的特点面临着无法支持在线(流式)识别、无法提供语音边界时间戳等问题。  中国科学院自动化研究所博士董林昊、研究员徐波将脉冲神经网络中的整合发放思想进行连续化,提出一种低复杂度并具有单

全基因组研究识别出饮酒吸烟相关变异

根据《自然》近日发表的遗传学研究,在一项涉及近340万人的多血统全基因组关联研究(GWAS)中,发现了近4000个与吸烟和饮酒行为相关的遗传变异。这些发现对这类复杂行为的潜在遗传影响提供了见解。 吸烟和饮酒是多种疾病和紊乱的主要风险因素,虽然它们也受文化背景、公共健康政策等环境因素影响,有显著证

国产彩超再获突破,迈瑞首款语音识别超声系统面世

  迈瑞推出全球首台全触控超声系统TE7,被冠以"最听话”的超声系统,作为超声系统语音识别的先行者,迈瑞这款超声设备有哪些特点呢?   iVocal 智能“听话”技术   TA很智能    -只需动口,不用动手!   基于人工智能语音识别技术,TA能识别医生的语音操作指令。让使用超声机器的医

科大讯飞四获国际多通道语音分离与识别大赛冠军

  时隔3年后,国际多通道语音分离和识别大赛CHiME-7再次“上线”。当地时间8月25日,CHiME-7 Workshop在Meta公司都柏林研发中心举行,官方组委会现场公布了大赛成绩:科大讯飞联合中科大语音及语言信息处理国家工程研究中心(NERC-SLIP)、国家智能语音创新中心,在参与的多设备

狒狒叫声隐藏语言起源秘密

  人类语言是如何在2500万年前起源的,一直被认为是科学界最大的未解谜团之一。科学家近日发现,这个谜可能从狒狒的叫声中找到答案。  来自法国格勒诺布尔阿尔卑斯大学等6所高校的科学家对1335只狒狒进行了声学和舌部解剖学研究。结果发现,几内亚狒狒的几类叫声中包含着独特的类人元音。  此前研究认为,人

海豚用叫声给自己取“名字”

  海豚是有名的高智商动物,英国一项新研究发现,海豚甚至会用独特的叫声作为自己的标记,仿佛给自己取了个“名字”。   英国圣安德鲁斯大学23日发表公报说,该校研究人员发现,生活在一起的海豚会经常性地使用一些独特的“口哨”。他们由此猜测,这些特别的叫声有可能是海豚对自己的声音标记,海豚会“辨音识豚”

最新研究:抹香鲸可创造出复杂叫声,类似于人类语言

北京5月8日电 (记者 孙自法)施普林格·自然旗下学术期刊《自然-通讯》最新发表一篇生态学研究论文显示,善于社交的抹香鲸,其交流可能比之前想象的更加复杂。这项研究发现,抹香鲸可以将不同的“咔嗒”声和节奏进行结合、调节,从而创造出复杂的叫声,类似于人类的语言。该论文介绍,交流对于社会性动物而言十分重要

研究识别威士忌真假

  近日来自德国的研究团队提出了一个更加简便的鉴别威士忌真假的方法:使用荧光染料比较不同的饮料。  当威士忌开始在全球流行起来的时候,骗子也随之而来了。因为他们的伪劣假冒品很便宜,比如混合威士忌冒充纯麦苏格兰威士忌。但除了酿酒大师,很多人难以甄别。虽然,化学家们设计了各种方法甄别伪造威士忌。但这些方

Sci-Rep:蝙蝠的叫声有什么意义?

  最新一项研究显示,蝙蝠叫声中传达的信息远比人们想象的要复杂得多,其中包括在群体中向某一个个体打招呼,或参与一个火热的讨论等等。这表明蝙蝠可能具有与海豚一样的信息传递能力。  研究者们通过分析不同的埃及水果蝙蝠的叫声,能够区分蝙蝠正在传达的信号内容,以及它们所表达的同意或不同意的观点。  "埃及水

情感语音转换技术研究取得新进展

科技日报呼和浩特8月23日电 (记者张景阳 通讯员胡红波)记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”

上海交大课题组研究肿瘤精准识别获全新靶标成果

  国际著名学术杂志American Journal of Human Genetics(AJHG, IF=10.794)2017年第一期在线发表了上海交通大学医学院细胞分化与凋亡重点实验室张健课题组在变构领域的最新成果Proteome-scale investigation of protein

语音报警验电器

描述伸缩型语音报警验电器主要技术指标产品规格:10KV、35KV、110KV、220KV、500KV注:可根据用户需求定做。序号项目验电器类别参数10KV35KV110KV220KV500KV1缩态长度mm38048058078016002伸态长度mm100015002000310072003有效绝

河马怎么通过声音识别同伴?

  河马是会“说话”的动物。它们“呼哧呼哧”的叫声可以在很远的地方被听到,这使得研究人员怀疑这种叫声在维持社会群体中发挥重要作用。1月25日发表在细胞出版社(Cell Press)旗下期刊Current Biology(《当代生物学》)上的一项研究表明,河马能够识别同伴的声音。与陌生叫声相比,它们对

研究揭示抹香鲸的神秘语言系统

几千年来,鲸鱼都是人类眼里神秘的存在,常出现在神话和民间传说里。在过去一个世纪里,尽管鲸类学或鲸鱼科学提高了我们对这些海洋哺乳动物的认识,但研究鲸鱼仍然是一项艰巨的挑战。现在,多亏了机器学习,我们离了解这些深海“居民”更近了一点。近日,美国麻省理工学院计算机科学与人工智能实验室(CSAIL)和“鲸类

ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手

新品发布在即,奥特曼的最新表态或暗示OpenAI意在人工智能语音助手。当地时间5月11日,人工智能(AI)巨头OpenAI CEO山姆·奥特曼(Sam Altman)在一档播客节目中称,OpenAI将继续改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向未来交互方式的一个重要途径。奥特

美国研究揭示人类语音生成的深层神经机制

  美国纽约大学科研人员利用深度学习架构和神经外科监测数据,揭示了人类语音生成过程中前馈和反馈机制的交互作用。该研究成果发表在《美国科学院院报》(PNAS)上。  人类语音生成过程是一个复杂的神经生物学现象,涉及运动命令的前馈控制以及自身产生语音的反馈处理,并需要大脑中多个神经网络协同参与。科研团队

合肥语音信息技术研究院揭牌

  11月2日上午,合肥语音信息技术研究院揭牌仪式在安徽国际会展中心举行。全国人大常委会副委员长陈昌智与中国科技大学党委书记许武共同为研究院揭牌。省领导王三运、孙金龙、孙志刚、任海深、郭万清、倪发科及省直有关部门、合肥市主要负责同志参加了仪式。   合肥语音信息技术研究院依托中国科大和安徽科大讯飞

PLOS-Genetics:基因组研究有助于识别疾病的生活方式风险

   一种通常用于确定与疾病相关的遗传变异的研究,也能够用来识别增加疾病风险的生活方式预测因素。这是遗传学研究中经常被忽视的方面。  全基因组关联研究(GWAS)扫描整个基因组以确定与特定疾病相关的遗传变异。这项技术被用于识别与疾病原因相联系的生物学通路--细胞和遗传物质中发生的一系列行动和变化。