专访李厦戎:一个在生物领域创业的数据控
李厦戎称自己为数据控,他致力于机器学习算法和分布式系统的实际应用。目前他正在生物数据领域创业,创办聚道科技(Genedock),希望用数据技术推动生命健康行业革新。李厦戎曾在中国最大的移动数据服务平台友盟工作,他作为首席数据科学家,带领团队针对移动数据特点,构建了面向数十亿移动设备的ID映射和用户画像系统。在此期间,他还结合移动广告的实际需求,开发了行为定向和CTR预估等广告策略模块。 问:你在做现在的Genedock之前是做什么工作的? 我之前在友盟,当时是首席数据科学家,做的主要是数据分析和数据挖掘,包括计算广告策略的优化,比如怎么去预估CTR(Click Through Rate,点击率),怎么样给用户做画像,从而针对用户做定向投放。从2011年底一直到今年的8月份我一直在友盟。 问:Genedock跟你之前的工作有关系吗? 我之前的工作基本上就是为上述的数据应用设计pipeline,做数据整合和预处理,构建数......阅读全文
-生物医学基因大数据:现状与展望
生物医学大数据广泛涉及人类健康相关的各个领域:临床医疗、公共卫生、医药研发、医疗市场与费用、个体行为与情绪、人类遗传学与组学、社会人口学、环境、健康网络与媒体数据。 大数据(big data)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和
各种模式生物必需基因在线数据库
Essential Genes are the genes that are indispensable to sustain cellular life. The functions encoded by essential genes are considered as a foundation
解码“基因宝藏”:最全海洋微生物基因数据库出炉
9月4日晚,华大生命科学研究院(简称“华大”)联合山东大学、英国东安格利亚大学、中国海洋大学、厦门大学、丹麦哥本哈根大学等机构,在《自然》上发表研究成果。他们通过对目前已公开的海洋微生物宏基因组数据进行分析和深度挖掘,构建了迄今为止最完整的海洋微生物基因数据库,并从中发现了大量具有应用潜力的基因资源
阿里联合生物技术公司打造基因组数据云
本报讯 近日,北京贝瑞和康生物技术有限公司与阿里云共同向外界宣布,双方将共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。此次,双方共同合作的“神州基因组数据云项目”将首先聚焦于基因组大数据在云平台上的批量计算、分析、存储,进而在基因大数据领域共同进行前沿探索。
人类肠道微生物基因集-为研究提供精准数据支持
7月7日,由华南理工大学生物科学与工程学院博士研究生李俊桦为第一作者,与深圳华大基因研究院、丹麦哥本哈根大学等单位共同合作完成的《人肠道微生物组参考基因集》研究成果在《自然—生物技术》上发表。这是“华工—华大”基因组科学创新班学子在国际顶级学术期刊上以第一作者身份发表的第二篇文章。 据介绍,人
生物数据唤醒日常家居
谈到智能物体,多数的家居用品都相当地不够智能。它们蹲在固定位置,了无生气,跟主人毫无交流。但据亚力克斯·罗瑟拉和詹姆斯·克拉厄所言,即使是最不声不响的物体也能拥有神奇的互动性,而这只是个时间问题。这些设计师称,通过身体传达出的数据,家居用品将可以与我们进行互动。 在都柏林科学画廊生命记录展的
生物信息分析数据挖掘
DNA芯片技术能够在基因组水平分析基因表达,检测许多基因的转录水平及在不同条件下的基因转录变化,显示反映特征组织类型、发育阶段、环境条件应答、遗传改变的基因谱。基因芯片产生了海量的数据,仅仅进行差异表达分析还远远不够,如何管理分析这些数据、从中挖掘信息已经成为利用这一技术的新的难点。芯片数据大量出现
科学家如何还原和挖掘海洋微生物基因数据?
·GOMC数据库为未来的研究提供了丰富的资源,包括开发新型生物技术产品、探索微生物的生态功能、研究微生物与环境变化的关系、开发新的疾病治疗方法等。基因是生命的“源代码”,其中不仅蕴藏着自然演化的奥秘,也囊括了数之不尽的生物工程资源。如何获取、分析和应用基因数据,是现代生物学的核心议题之一。近日,一支
上海生科院通过生物大数据揭示反式剪接的基因演化功能
11月2日,Nature Communications 发表了中国科学院上海生命科学研究院植物生理生态研究所李轩研究组题为The evolutionary landscape of intergenic trans-splicing events in insects 的研究论文。该工作揭示了反
生物医疗大数据如何应用?
随着生物科技和医疗技术的迅猛发展、高通量手段的成熟,生物医疗行业的大数据急剧膨胀。然而,与其它行业的数据不同,生物医疗行业的数据呈现分散、破碎、低透明度、以及意义尚等解析等特征。不象其它行业,数据具有时效性以及数据很轻、易于解析;生物医疗行业的数据普遍很“重”、信息量超大、不同的解析策略可能得出
Geneformics联手明码生物科技为全球基因组学大数据“瘦身”
美国加州森尼韦尔市,2017年2月14日——Geneformics数据系统有限公司(以下简称“Geneformics”)宣布携手药明康德集团企业明码(上海)生物科技有限公司(以下简称“明码生物科技”),正式将Geneformics世界领先的基因测序数据技术融入到明码生物科技的工作流程。Genef
生物信息学在基因芯片数据功能分析中的应用
随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era),向基因的功能及基因的多样性倾斜。通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能
生物信息学在基因芯片数据功能分析中的应用
随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(Postgenome Era),向基因的功能及基因的多样性倾斜。通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,
谷歌致力于基因数据市场,整合Tute-Genomics基因数据库
谷歌希望凭借人类基因组云端服务Google Genomics在基因组研究市场占有一席之地,如今,公司正忙于用最好的工具来填满这个工具箱。 Google Genomics是谷歌2013年推出的一项云端服务,帮助大学实验室和医院等机构将患者或科研对象的生物基因储存到云端上,推进人类基因组信息的存
缺乏数据使用指导原则,基因组数据共享遇阻
基因组数据共享将生物医学研究推向快车道,但向公共领域发布的现有数据指南一方面承认免费和无条件使用数据的重要性,另一方面还未能解决这种重要性与数据生产者首次发布数据的“权利”之间的关系。 在美国能源部联合基因组研究所负责人Nikos Kyrpides看来,这种自相矛盾导致了数据生产者和数据使用
美国推进癌症基因数据共享
美国麦利亚德基因公司(Myriad Genetics)拥有关于乳腺癌和卵巢癌的两个基因的ZL,这让它们垄断乳腺癌检测的行业多年。虽然美国最高法院在去年六月已经对这两个基因的ZL做了无效判决,但该公司仍然掌握这独有的130万份的检测数据。这些信息则使得麦利亚德公司在检测结果解释上有巨大优势。但是遗
基因芯片数据的分析方法
研究背景:基因芯片可以通过探针和荧光标记对某个时间点生物体的全部基因表达量进行检测,探针代表的基因荧光强度通过仪器转换成基本数据。这些数据的背后隐藏着很多的生物学意义,这就需要我们通过生物信息学的方法去分析和挖掘。不同实验设计方案产生的海量芯片数据,其分析方法和思路都大同小异,这里分享一个多组实验设
群众基因数据:揭示疾病病因
本月月初,来自40个国家的研究人员和提倡者成立了一个全球联盟来开启安全共享的基因组和临床数据库,目的是为了在这个时代结束时可以使人类能够利用遗传数据。 英国政府,凯萨医疗机构及美国共同努力收集和整理了大量的遗传数据。但是随着全球的联盟,有一天临床医生可以广泛使用遗传数据,全世界的研究者可以
大数据:助力判定癌症驱动基因!
目前已知超过100个新的癌症驱动基因,帮助解释了怎样的肿瘤驱动会造成:相同的癌症基因导致不同的病患! 在一项由Sanford Burnham Prebys医学发现研究所(SBP)引导下的协作研究中,研究人员结合两个公开的“组学”数据库创建一个新的目录“癌症驱动者”。当癌症驱动基因的改变造成癌症
基因芯片数据的分析方法
研究背景:基因芯片可以通过探针和荧光标记对某个时间点生物体的全部基因表达量进行检测,探针代表的基因荧光强度通过仪器转换成基本数据。这些数据的背后隐藏着很多的生物学意义,这就需要我们通过生物信息学的方法去分析和挖掘。不同实验设计方案产生的海量芯片数据,其分析方法和思路都大同小异,这里分享一个多组实验设
最大的海洋微生物基因数据库有助于药物发现
迄今对包括细菌、病毒和真菌在内的海洋微生物基因进行的最全面分析,可为研究人员发现抗生素、追踪气候变化影响和保护濒危物种奠定基础。1月16日,相关成果发表于《科学前沿》。据《自然》报道,2021年,研究人员构建了一个目录,其中包含约3亿组陆地微生物和海洋微生物的基因。现在,沙特阿拉伯阿卜杜拉国王科技大
最大的海洋微生物基因数据库有助于药物发现
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516176.shtm迄今对包括细菌、病毒和真菌在内的海洋微生物基因进行的最全面分析,可为研究人员发现抗生素、追踪气候变化影响和保护濒危物种奠定基础。1月16日,相关成果发表于《科学前沿》。据《自然》报道,
英国生物库数据开始对外开放
英国生物库数据于3月30日正式面向研究人员开放。通过这一数据库,全球的科学家都可以将近50万英国人的各种健康数据用于研究,这无疑对全球医学研究起到积极的推动作用。 英国生物库项目于2006年8月正式启动,旨在收集大量的生物样本和医学数据用于医学研究。数据收集目标为40岁到65岁的英国人,数
大数据:生物医学变革新契机
“我国目前每年医疗费用总额超过2.4万亿元,如果按照麦肯锡报告的预测,我国医疗领域利用大数据每年将节省医疗费用近2000亿元。”军事医学科学院研究员朱云平在11月29日召开的“第五届重大疾病防治科技创新高峰论坛”上如是说。 大数据影响的深度和广度仍在不断扩张。对于生物医学来说,其发展过程中积淀
生物医学大数据亟待深挖利用
图片来源于网络 “我国是人类遗传资源大国,但不是强国,随着健康中国、大数据等国家重大战略的实施,迫切需要加强对人类遗传资源的深入研究和信息挖掘。” 10月10日,人类遗传资源开发创新研究高层论坛在京召开。中国生物技术发展中心主任张新民坦承,国家人类遗传资源管理和保护涉及生命伦理和国家安全,在资
植物生物学研究数据库
实验概要植物生物学研究数据库实验步骤http://bioinf.scri.sari.ac.uk/cgi-bin/plant_snorna/home 英国 Top 植物种的snoRNA基因数据库。 综合 http://bioinformatics.psb.ugent.be/webtools/plant
微生物所发表中国微生物组数据平台
10月26日,《核酸研究》(Nucleic Acids Research)在线发表中国科学院微生物研究所微生物资源与大数据中心、世界微生物数据中心马俊才团队题为gcMeta: a Global Catalogueof Metagenomics platform to support the ar
世界微生物数据中心落户微生物所
在近日召开的第12届国际菌种保藏大会上,经过大会专家委员会评审并经世界菌种保藏联合会理事会审议通过,中国科学院微生物研究所在众多的竞争者中脱颖而出,成为世界微生物数据中心(World Data Center for Microorganisms, WDCM)新的主持单位。 W
冰岛基因公司数据挖掘计划泡汤
图片来源:基因解码公司 因采集冰岛人DNA用于发现基因和疾病之间关系而著名的基因解码公司遇到了一个棘手问题。近日,《科学》杂志报道称,冰岛负责监督数据保密性的国家机构驳回了基因解码公司的请求——该公司希望可以使用计算机方法分析该国的宗系记录,以估算28万名并未同意参与该公司的研究,
基因数据噪音或可保护患者隐私
大型基因组数据库对于科学家寻找同疾病相关的遗传变异来说是必不可少的。不过,对于贡献了DNA的人来说,这会带来隐私风险。一项2013年的研究显示,黑客能利用网络上公开可用的信息,从被匿名的基因组数据中辨别出人们的身份。 为解决这些担忧,一个由美国麻省理工学院计算机科学家Bonnie Berger