阿里云生物基础大模型登上Nature子刊可挖掘核酸、蛋白质之间的内在联系
6月19日消息,国际顶级期刊《Nature Machine Intelligence》发表了阿里云AI for Science的研究成果LucaOne。这是业界首个联合DNA、RNA、蛋白质的生物大模型。该大模型学习了超16万个物种的12亿条核酸序列及6亿条蛋白序列数据,不仅可以挖掘核酸、蛋白质的内部特征,还可识别核酸与蛋白质之间的联系,帮助研究人员探索更多生物系统的内在逻辑与规则。 Nature Machine Intelligence(以下简称NMI)是Nature于2019年创立的期刊,收录方向覆盖计算生物学、模式识别和计算机视觉等多个领域,期刊影响因子一直位居行业前列,是业界公认的人工智能和机器学习领域的国际顶级期刊。 据介绍,阿里云研究团队首次基于DNA、RNA和蛋白质等生命科学领域最主要的数据进行混合训练,涵盖12亿条核酸序列和6亿条蛋白序列,同时引入生物领域内基础的标签信息,让模型学习到丰富的生物信息。在模......阅读全文
阿里云生物基础大模型登上Nature子刊-可挖掘核酸、蛋白质之间的内在联系
6月19日消息,国际顶级期刊《Nature Machine Intelligence》发表了阿里云AI for Science的研究成果LucaOne。这是业界首个联合DNA、RNA、蛋白质的生物大模型。该大模型学习了超16万个物种的12亿条核酸序列及6亿条蛋白序列数据,不仅可以挖掘核酸、蛋白质
蛋白质结构和功能的基础模型
蛋白质设计程序使用在体内环境中驱动蛋白质的分子力的计算机模型。为了使问题易于解决,蛋白质设计模型简化了这些作用力。尽管蛋白质设计程序相差很大,但它们必须解决四个主要的建模问题:设计的目标结构是什么,目标结构允许什么样的灵活性,搜索中包括哪些序列,以及将使用哪个力场来分数序列和结构。目标结构蛋白质功能
广州首个基础大模型“黄埔星”正式问世
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515970.shtm1月12日,第二届粤港澳大湾区(黄埔)国际算法算例大赛颁奖典礼、第三届启动会暨大模型圆桌论坛在广东广州开发区、广州市黄埔区举办。活动当天,10个赛道共计80支队伍登上粤港澳大湾区(黄埔
香港首个自主研发基础大模型初步完成
中新社香港4月14日电 (记者 戴梦岚)第二届香港国际创科展日前在香港会议展览中心开幕。香港科技大学首席副校长兼“香港生成式人工智能研发中心”(HKGAI)主任郭毅可在展会上接受记者采访时透露,由HKGAI训练、香港首个自主研发的基础大模型已初步完成。郭毅可表示,该大模型支持中文和英语,将为香港人工
动物模型基础
第一部分 动物模型的分类一、按产生原因分类(一)自发性动物模型(Spontaneous Animal Models)是指实验动物未经任何有意识的人工处置,在自然情况下所发生的疾病。包括突变系的遗传疾病和近交系的肿瘤疾病模型。突变系的遗传疾病很多,可分为代谢性疾病、分子疾病和特种蛋白质合成异常性疾病。
专著《树鼩基础生物学与疾病模型》出版
在国家863计划课题的支持下,中国科学院昆明动物研究所联合中国科学技术大学等7家单位的专家学者共同编著《树鼩基础生物学与疾病模型》。该书较全面地介绍了树鼩基础生物学和疾病模型研究相关领域的最新进展与发展趋势,其中许多研究成果属于首次报道。 中国科学院副院长张亚平院士为本专著作序,全书分为树鼩
细胞化学基础脱氧核糖核酸生物功能
在基因组中,遗传信息存储在称为基因的DNA序列中,这个遗传信息的传递由互补的含氮碱基序列的存在得到保证。事实上,在转录过程中,遗传信息可以很容易地被转录到互补的RNA链中(mRNA)。mRNA通过翻译合成蛋白质。或者,细胞可以通过称为DNA复制的过程简单地复制遗传信息。基因组结构真核生物基因组DNA
细胞化学基础脱氧核糖核酸与蛋白质作用
所有DNA功能都取决于其与特定蛋白质的相互作用。这些相互作用可以是非特异性的,也可以是极其特异性的。还有许多可以结合DNA的酶,其中,在DNA转录和复制中复制DNA序列的聚合酶特别重要。DNA与组织蛋白(图1中白色部分)的交互作用,这种蛋白质中的碱性氨基酸(左下蓝色),可与DNA上的酸性磷酸基团结合
甲烷为外星生物基础的三大证据
地球以外的行星上是否有生命存在?其证据不可能像外星飞船降落在巴黎埃菲尔铁塔旁边那样引人注目,更可能来自对遥远行星的观测——该行星带有暗示生物活动的大气化学物质。一项发表在28日的《美国国家科学院院刊》上的新研究证明,如果宇宙中有丰富的生命,那么其大气中的甲烷或是能探测到的地球以外生命的第一个迹象。
“达尔文”大模型发布-为生物领域打造AI大脑
7月4日,赛灵力联合清华珠三角研究院、赛业生物、大湾区科创中心共同举办达尔文大模型发布会。达尔文大模型基于多元、多模态复杂数据和先进的人工智能技术,对生物领域的复杂系统建模和分析进行深入研究,为生物学产业、研究和应用发展提供有力支撑。达尔文提出进化论,阐述物种进化的基本原理,即适者生存。对应的,达尔
何大澄教授:蛋白质组学已经成为细胞生物学的基础
2013年12月8日,由首都医科大学附属北京朝阳医院、AB SCIEX公司主办的第四十期质谱沙龙活动在北京朝阳医院顺利举办,来自北京师范大学、北京朝阳医院、中科院微生物所、空军总医院的百余名专家学者齐聚一堂共同参
《机器智能》:秒级预测蛋白质结构的大模型上线
原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510009.shtm
细胞化学基础核糖核酸
核糖核酸(缩写为RNA,即Ribonucleic Acid),存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。RNA由核糖核苷酸经磷酸二酯键缩合而成长链状分子。一个核糖核苷酸分子由磷酸,核糖和碱基构成。RNA的碱基主要有4种,即A(腺嘌呤)、G(鸟嘌呤)、C(胞嘧啶)、U(尿嘧啶),其中,U(尿
面对大模型应用门槛高-如何大模型发挥更大价值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能预训练大模型的研发,面临着数据规模大、数据质量参差不齐、模型体积大、训练难度高、算力需求大等一系列挑战。在这样的背景下,如何加速大模型的产业落地,让大模型发挥更大价值?
核酸、蛋白质各种换算
同位素, 酸、碱, 蛋白质数据(Isotope Data, Acids & Bases, Protein Data)同位素数据同位素释放的微粒半衰期14Cb5,730 years3Hb12.3 years125Ig60 days32Pb14.3 days33Pb25 days35Sb87.4 day
细胞化学基础核糖核酸分类
人体一个细胞含RNA约10pg(含DNA约7pg)。与DNA相比,RNA种类繁多,分子量较小,含量变化大。RNA可根据结构和功能的不同分为信使RNA和非编码RNA。非编码RNA分为非编码大RNA和非编码小RNA。非编码大RNA包括核糖体RNA、长链非编码RNA。非编码小RNA包括转移RNA、核酶、小
智能CT基础模型助力放疗精准决策
宫颈癌是威胁女性健康的重大疾病,对于局部晚期患者,虽然标准的同步放化疗能让约70%的患者获得无病生存,但仍有近三分之一面临复发转移风险。为提高治疗成功率,临床开始探索强化治疗策略,但这些方案在改善生存的同时也带来更高的毒性和费用负担。因此,如何在治疗前精准识别出真正需要强化治疗的高风险患者,既确保他
核小体模型的建立基础和研究
人们接着用化学交联、高盐分离组蛋白,以及X衍射等方法进一步研究组蛋白多聚体的结构、排列以及怎样和DNA结合的,从而建立了核小体模型。1984年Klug和Butler进行了修正。核小体的构造可用图表示:每一个核小体结合的DNA总量为200bp左右,一般在150~250变化范围(micrococcal
核酸检测过程大揭秘
核酸检测的目的是将样本中的微量病毒DNA经过(2的35-40倍)扩增,使得检测设备可以探测读取到的浓度。 流程:医务人员将采集的样本,并经过包装、冷藏运输的诸多环境送至检测实验室。实验人员穿戴相应防护开展检测工作。 核酸检测采样具体如何操作? 1、鼻咽拭子: 采样人员一手轻扶被采集人员的
大模型基础设施如何建?首先要搭万卡规模的网络架构
“生成式AI是一个跨越式的技术,和原来的技术有了非常大的变革,可以说是划时代的技术。它最大的特点就是模型大,过去几年以每年10倍参数量的速度在增长。之前AI应用里,很多训练的任务都是单卡或单机就能完成,但在大模型时代,需要千卡、万卡来完成一个任务。”5月23日,百度杰出系统架构师王雁鹏在深圳举行的文
AI大模型“拿捏”电池寿命
作为现代生活中不可或缺的能源载体,电池的重要性不言而喻。从清晨唤醒我们的闹钟,到随身携带的手机、平板电脑等智能设备,无一不依赖于电池提供的稳定电力。此外,随着科技的发展,电动汽车、无人机等新兴领域也广泛应用了各类高性能电池,推动了绿色出行和智能科技的进步。因此,电池不仅极大地便利了我们的日常生活,还
抢抓大模型行业机会
机器人在7月6日举行的2023世界人工智能大会展会现场进行投篮表演。大会展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。 新华社记者 方 喆摄 今年以来,自ChatGPT发布后,多家企业先后发布了自己的大模型产品,业内称之为“百模大战”。与此同时,产业界对大模型的关注点也在发生变化,从
细胞化学基础核糖核酸的功能
mRNAmRNA含A、U、G、C四种核苷酸,每三个相联而成一个三联体,即密码,代表一个氨基酸的信息,故按数学中排列组合法则计算,可形成43=64个不同的密码。根据实验结果,推得64个密码与氨基酸的对应关系如下表。mRNA密码与氨基酸的对应关系64个密码中,61个密码分别代表各种氨基酸。每种氨基酸少的
蛋白质和核酸的关系
蛋白质的合成与核酸密切相关。蛋白质的氨基酸序列由基因(DNA)决定,然后通过RNA指导合成。具体可查阅遗传信息的表达相关内容。
蛋白质谱测定蛋白质的基础原理
蛋白质是一条或者多条肽链以特殊方式组合而成的生物大分子,大多数蛋白质会自然折叠为一个特定的三维结构。蛋白质的结构层次可以分为一级结构、二级结构、三级结构和四级结构:一级结构:组成蛋白质多肽链的线性氨基酸序列。二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋和β折叠
蛋白质谱测定蛋白质的基础原理
蛋白质是一条或者多条肽链以特殊方式组合而成的生物大分子,大多数蛋白质会自然折叠为一个特定的三维结构。蛋白质的结构层次可以分为一级结构、二级结构、三级结构和四级结构: 一级结构:组成蛋白质多肽链的线性氨基酸序列。 二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α
全球首个百亿级遥感解译基础模型发布
原文地址:http://news.sciencenet.cn/htmlnews/2024/10/531092.shtm
科研人员开发出RNA基础语言模型
在真核生物中,RNA转录、剪接、翻译和降解等生物学过程受到顺式调控元件、RNA结构和反式作用因子的调控。解析RNA多层次调控,对研究基因表达分子机制和设计RNA药物具有重要意义。但是,由于调控复杂和数据量不足,构建RNA调控的预测模型面临挑战。 近日,中国科学院上海营养与健康研究所研究员张国庆
人造器官模型为乙肝药物开发打下基础
乙型肝炎病毒(HBV)感染目前无法治愈,它在全球影响几亿人。由于缺乏能用于测试潜在疗法的模型,治疗领域发展缓慢。近日,伦敦帝国理工学院(Imperial College London)的科学家们在人造器官模型中测试了病毒感染,这一成功有望加速该领域研究。相关论文已发表在《Nature Commu
简述蛋白质折叠的生长模型
根据这种模型,肽链中的某一区域可以形成“折叠晶核”,以它们为核心,整个肽链继续折叠进而获得天然构象。所谓“晶核”实际上是由一些特殊的氨基酸残基形成的类似于天然态相互作用的网络结构,这些残基间不是以非特异的疏水作用维系的,而是由特异的相互作用使这些残基形成了紧密堆积。晶核的形成是折叠起始阶段限速步