“数据就是今天的石油”。当谷歌和OpenAI在生命科学领域上演新一轮竞逐,他们在豪赌一个未来,即AI将从根本上重塑生命科学的研究范式,这其中蕴藏着万亿级别的商业价值。但在生命科学和医疗健康领域,目前高质量的数据非常稀缺。就像基因测序仪对于基因组,高分辨质谱是蛋白组学的金标准。但目前基于质谱蛋白组的人群蛋白组数据采集却屡屡受阻。根本的原因在于缺乏一整套高标准化稳定性的数据产生平台。传统方法一天只能处理30个样本,千例级队列要耗时一个多月;血浆样本里的低丰度蛋白总被高丰度蛋白掩盖,能鉴定到的蛋白不过1000种左右;不同批次的数据差异太大,今天做的结果明天就复现不了…… 这些痛点不仅拖慢了数据累积的进度,更让AI大模型算法无法发挥其在生命科学和医疗保健的巨大潜力。
杭州珞米医疗科技有限公司创始人兼CEO 吴昊博士
在第12届AOHUPO大会期间,分析测试百科网专访了杭州珞米医疗科技有限公司创始人兼CEO吴昊博士。这位拥有芝加哥大学分子工程博士背景、受美国材料基因组计划资助研究蛋白质相互作用的研究者,带领团队打造的Proteonano™高通量蛋白组学标准化平台,正用“高通量、超深度、强稳定”的特性逐个破解这些难题。
从芝加哥到杭州:因“痛点”创立,为“转化”而来
珞米生命科技的成立,源于吴昊博士在实验室里的亲身体会。“我在做研究时就发现,蛋白组学要实现大规模人群队列数据采集,必须解决两个核心问题:一是怎么高效、稳定、标准地从大规模样本中采集海量蛋白组数据,二是怎么让AI大数据分析整合进药物开发和医疗保健过程。”吴昊博士回忆,当时他的团队为了处理几百个血浆样本,手动操作了近半个月,最后还因为批次差异,一半数据没法用——这不仅是他的困扰,更是全球同行的普遍难题。
2021年,珞米在芝加哥起步,由于看到中国在生物制造产业链和人才储备的优势,把总部迁至杭州,如今在美国、德国、澳大利亚均已设立分支机构,形成“立足中国、服务全球”的布局。“我们的使命从一开始就很明确:让蛋白组学改变每个人的生活。” 吴昊博士表示。珞米生命科技致力于打造全球领先的综合蛋白质组学数字化平台,通过整合生物制造、自动化与人工智能,为全世界药企和研究机构提供人类蛋白组学大数据,助力精准医学发展。
截至现在,珞米的核心平台Proteonano™已获10项技术专利,可覆盖2000个信号通路,累计处理了全球超5万个大队列样本,合作的机构里既有罗氏、礼来、辉瑞这样的国际药企,也有梅奥诊所、清华大学这样的科研临床重镇,覆盖了肿瘤、神经、免疫、代谢等8大类疾病,慢慢成了行业里“高稳定”“标准化”和“临床转化”的代名词。
Proteonano™平台:用“精准捕获+高效处理+全程质控”破局
珞米的核心产品是Proteonano™ HT Assay,主要由Proteonano™血浆低丰度蛋白富集试剂盒,Nanomation™ G1 自动化机器人,和一整套经过2000多次精心打磨的自动化工作流,每一项设计都瞄准了行业痛点。搭配不同型号质谱仪,如Orbitrap、timsTOF等,Proteonano™ HT Assay每天可完成300个样本的前处理,覆盖超过12000个人类血浆蛋白,并且具有超高稳定性,样本间变异系数低于10%。
这样的性能,已经跟国际上著名的蛋白组学公司Olink(2024年被赛默飞以31亿美金收购)和SomaLogic(2024年被Illumina收购)旗鼓相当。
Proteonano™ HT Assay高通量数字化蛋白组平台
技术壁垒:AI设计亲和探针与单分散纳米磁珠的“双重突破”
Proteonano富集试剂盒采用特殊物理化学修饰的单分散超顺磁性纳米探针(Protein nanobinder reagents),其均采用多层级复合结构设计,具有精确可控的粒径尺寸,表面化学性质稳定。通过层级结构设计与AI算法筛选的特异性蛋白亲和配体,可通过精准的纳米-生物相互作用,实现对低丰度蛋白质的高亲和力选择性结合——既能形成致密的“特异性蛋白冠”提升靶标结合效率,又能有效抑制非特异性吸附。能够同时实现蛋白亲和探针设计和单分散纳米磁珠制造两大技术,目前全球仅2家企业掌握。
基于AI设计纳米多肽探针蛋白富集捕获专利技术
“我们的试剂盒优势来源于我们三大核心模块:工业级的含数百万化学组合的修饰纳米多肽探针体系、专有优化的缓冲系统以及标准化样本制备流程。”吴昊博士补充道,可稳定实现单氨基酸分辨率的定量检测,为蛋白质组学研究提供卓越的批次间重复性,为大规模大队列研究提供稳定数据支撑,实现在癌症、神经退行性级别、慢性病、和器官衰老生物标志物发现。
性能优势:通量、深度、样本兼容性的 “三重升级”
从实际应用性能来看,Proteonano™高通量蛋白质组平台具有如下显著的优势。
超高通量、超稳检出:Nanomation™ 自动机器人具备强大的高通量处理能力,其单轮实验可处理多达96个样本,每天可完成300个样本的全流程处理,按96孔板计算,仅需约3小时。相比传统的一天仅能处理30个样本的手动操作,其效率提升了10-17倍,可轻松满足大规模队列研究的需求。同时,在CV<10%时,单分散纳米磁珠探针仍可实现高稳定性蛋白检出,稳定性远超其它商业试剂盒。
超深覆盖:Proteonano对不同生物基质(如血浆、血清、唾液、组织细胞等)的样本需求量较低,其中血浆样本仅需20uL即可实现高深度检测,单个样本单次检测高达6000种蛋白质,较传统方法提升十倍;目前已累计检出12000+种独特人类血浆蛋白。此外,Proteonano™平台不仅成功检出123种经FDA批准的循环血浆生物标志物,更在癌症标志物深度挖掘上展现强劲实力,针对各类癌症标志物,该平台检出的蛋白数量达到未富集方法的3-5倍。
超宽动态范围:与传统方法相比,Proteonano检出范围可覆盖血浆蛋白质组10个数量级的动态范围,远高于其它方法的3-5个数量级。
覆盖血浆蛋白质组10个数量级的动态范围
广兼容性:Proteonano HT Assay简化了样本预处理流程。吴昊博士表示:“冻存血浆解冻后可直接上机检测。它不仅能处理血浆这类宝贵的临床转化核心样本,还能广泛兼容组织、细胞等多种样本类型,只要是蛋白溶液形态均可适用。”
吴昊博士强调:“效率和深度之外,数据稳定才是临床转化的关键。大队列研究不是做一次就完了,得保证不同批次、不同人做出来的数据都能比较。”Proteonano平台里藏着一套 “三级质控系统”:每块96孔板都会放3-8个健康人混合血浆的QC样本,同实验样本一起富集,看富集环节稳不稳定;蛋白信号检测的时候,会穿插专门的肽段QC样本,防止仪器状态波动影响结果;最后数据分析还有专门的算法,先做方差稳定标准化,再用 Combat 矫正批次差异,最后批次内的CV能控制在10%以下,批次间也不到15%——这比行业平均水平高多了,也让多中心合作的大队列研究终于有了“统一的数据语言”。
应用落地:从阿兹海默症到胃癌,用数据证明价值
目前,珞米生命科技的高通量蛋白组平台已在多个重大疾病研究中落地,积累了丰富临床数据:
在阿兹海默症研究中,共鉴定出159个显著差异蛋白,其中142个上调、17个下调。基于这些差异蛋白,成功建立多指标联合模型,判别效能AUC高达0.952,实现了对认知障碍人群的高精度区分。
在糖尿病肾病蛋白标志物研究中,研究中共鉴定出45种显著差异蛋白,为疾病早期识别提供线索。基于这些蛋白成功构建多指标联合判别模型,实现信息整合与风险识别,模型在识别糖尿病肾病人群中表现优异,AUC达到0.949,展现出强大的临床转化潜力。
在胃癌标志物诊断中,纳入600例临床样本,覆盖多种病理类型与阶段,成功鉴定6253种蛋白,构建胃癌相关的高分辨率蛋白质图谱,为后续差异蛋白筛选、标志物发现及临床转化研究提供了坚实数据资源。
在长新冠标志物发现研究中,基于1000+例临床样本,成功筛选出一批与长新冠相关的候选蛋白标志物,为机制解析与风险评估提供新线索,助力长新冠的早期识别、预后评估与干预。
行业洞察:2500亿市场,标准化是核心竞争力
谈及蛋白质组学的行业前景,吴昊博士有着清晰的判断。“人体蛋白质组导航国际大科学计划(π-HuB)启动后,行业已经从分散探索进入规模产业化发展阶段了。”他说,“对比基因组学250亿美金的市场规模,蛋白组学的数据量更大、和疾病表型的关联更直接,市场规模至少是10倍即2500 亿美金,这是个潜力巨大的蓝海。”
但要在这个赛道里站稳脚跟,差异化竞争力很重要。“我们选择了跟Olink不一样的技术路径,他们靠两个抗体来识别一个蛋白;我们利用蛋白蛋白相互作用,结合肽段定量金标准质谱,能做无偏性研究,既能找已知标志物,也能挖新的候选靶点。”吴昊博士打了个比方,如国际某知名质谱厂商,在未使用珞米试剂盒和设备时,只能检测到1000种左右的血浆蛋白,搭配之后能检出12000种血浆蛋白,“就像汽车需要适配的发动机和汽油,质谱的性能得靠标准化的前处理方案才能发挥出来。” 珞米的平台采用“设备+试剂盒+质控”协同优化,全流程自动化让前处理发挥出最高性能。
未来规划:全球布局+数据赋能,让技术更普及
对于珞米的未来,吴昊博士有两个明确的方向。一是全球布局,“现在我们在美国、欧洲、澳洲已经有重磅合作伙伴了,包括全球最大药企礼来。未来3-5年,计划在全球超1000个站点安装Proteonano™ HT Assay平台,包括科研机构、大型药企、生物科技公司、临床诊所、第三方检测机构等。”他说,这样就能实现全球样本的标准化处理,不管在哪个国家做研究,数据都能互相比对,让跨国多中心的大队列研究更顺畅。二是大数据赋能 AI,”现在生命科学不缺好的AI模型,缺的是高质量、标准化的数据。”吴昊博士认为,他们平台产生的稳定数据,能为蛋白质组学AI 大模型提供核心训练素材,不管是优化疾病预测模型,还是加速药物靶点筛选,都能帮上忙,甚至未来能根据患者的蛋白组特征制定个性化治疗方案。 “目前我们正在全球建设4个大数据产生中心,运用联邦学习和迁移学习,整合全世界各地产生的海量数据。”吴昊表示。
“我们最终的目标,是让蛋白质组数据渗透到生命科学和医疗保健的每一个环节。”吴昊博士在专访结尾说,不管是科研人员、临床医生,还是药企研发人员,都能轻松用他们的平台和数据,“让蛋白质组学真正改变每个人的生活,这是我们从创立那天起就没变过的初心。”
“数据就是今天的石油”。当谷歌和OpenAI在生命科学领域上演新一轮竞逐,他们在豪赌一个未来,即AI将从根本上重塑生命科学的研究范式,这其中蕴藏着万亿级别的商业价值。但在生命科学和医疗健康领域,目前高......
“数据就是今天的石油”。当谷歌和OpenAI在生命科学领域上演新一轮竞逐,他们在豪赌一个未来,即AI将从根本上重塑生命科学的研究范式,这其中蕴藏着万亿级别的商业价值。但在生命科学和医疗健康领域,目前高......
“数据就是今天的石油”。当谷歌和OpenAI在生命科学领域上演新一轮竞逐,他们在豪赌一个未来,即AI将从根本上重塑生命科学的研究范式,这其中蕴藏着万亿级别的商业价值。但在生命科学和医疗健康领域,目前高......
“数据就是今天的石油”。当谷歌和OpenAI在生命科学领域上演新一轮竞逐,他们在豪赌一个未来,即AI将从根本上重塑生命科学的研究范式,这其中蕴藏着万亿级别的商业价值。但在生命科学和医疗健康领域,目前高......
清华大学生命科学学院吝易团队与杨雪瑞团队合作揭示了细胞利用相分离对蛋白质翻译进行精细的时空调控,从而维持昼夜节律周期的分子机制。相关成果以“区室化周期性蛋白质翻译精确调控生物节律(Circadianc......
蛋白质组学,是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。这个概念最早是在1994年,由MarcWikins首先提出的新名词。随着人类基因组计划的实施和推进,生命科学研究......
对食物是否鲜香判断的重要依据是其口感,决定口感好坏的因素有新鲜度、烹调方式、食物本身所含的风味物质等,但起决定性作用的应该是风味物质。风味物质在生物学上叫内源性代谢物。肌肉组织是肉的主要成分,利用蛋白......
对于人细胞中的蛋白是如何在细胞中定位的首次分析于5月11日在线发表在Science上,这项研究,揭示了在给定的一个细胞中,大部分的人类蛋白被发现存在一个以上的定位位置。基于瑞典的CellAtlas计划......
高等生物的细胞核负责储存基因组DNA,这些DNA环绕着由四种组蛋白组成的八聚体,形成碟状的核小体结构。核小体的组织影响了基因活性,因此也是科学家们关注的研究领域之一。近日,来自美国西北大学的研究人员的......
基于癌症基因组的Atlas(TCGA)计划的数据,美国的科学家联合小组已经完成乳腺癌的第一次大规模“蛋白基因组(proteogenomic)”研究,将DNA突变联系到蛋白信号并帮助确定癌症驱动基因。这......