BioTechniques:大数据的可视化工具

如今,面对海量的生物数据集,人们往往感到束手无策。然而,这些TB级的数据有望带来新的假说、新的药物靶点,以及对生物系统的更彻底了解。数据可视化在其中扮演着至关重要的作用。在这一期的《BioTechniques》杂志上,Sarah Webb博士探讨了数据可视化的挑战和能力。 大数据是一个美好的概念。不过随着生物数据集的增长和变化,可视化研究人员正面临持续的挑战。哈佛医学院的Nils Gehlenborg表示,问题在于数据的规模和异质性。人类基因组包含数十亿个碱基,研究人员希望从染色体、基因甚至碱基对水平来查看。此外,还有其他类型的关联数据,比如癌症患者的性别、年龄、肿瘤类型等。 浏览基因组 在线的基因组浏览器可以帮助研究人员探索数据、寻找模型,并建立假说。目前有许多这样的工具,每个在功能上稍有不同。加州大学圣克鲁兹分校分校(UCSC)的Genome Browser自2000年上线,是探索人类基因组、各种脊椎动物的基因组以......阅读全文

药监局发布《疫苗追溯基本数据集》等3项标准

  8月26日,国家药监局印发《疫苗追溯基本数据集》《疫苗追溯数据交换基本技术要求》《药品追溯系统基本技术要求》3项信息化标准。加上前期已于2019年4月发布的《药品信息化追溯体系建设导则》《药品追溯码编码要求》2项标准,疫苗信息化追溯体系建设所需的5项标准已经全部发布实施。  统一的标准规范是药品

介绍一下-Immune-Cell-Atlas-数据集的构建过程

构建 Immune Cell Atlas 数据集通常涉及以下主要步骤:  1. 样本采集:从不同个体、组织和疾病状态中收集免疫细胞样本。这可能包括健康人的外周血、淋巴组织,以及患有免疫相关疾病患者的病变组织等。  2. 单细胞分离:使用特定的技术,如流式细胞术或微流控技术,将单个免疫细胞从组织或细胞

国际首个简牍字符检测与识别数据集正式发布

简牍是中国古代重要记录媒介,因材料脆弱及埋藏环境影响,字符模糊、缺损、布局复杂,人工识别困难。现有文献数字化技术在甲骨文等领域取得突破,但在简牍字符识别方面缺乏高质量数据集,限制了深度学习应用。近日,西北师范大学联合甘肃简牍博物馆推出国际首个面向深度学习任务的简牍字符检测与识别大规模数据集——Dee

中国长时间序列积雪面积遥感产品数据集发布

  积雪面积是研究水文和气候变化的重要因子,也是气候变化的指示器,对地表能量平衡、水体通量、水文过程、大气及其海洋循环等具有显著影响。1978年卫星数据观测表明,北半球积雪持续减少,模型模拟结果表明,温度每升高1℃,北半球积雪面积缩减100-280万平方公里。在全球升温背景下,一套长时间序列的高空间

单细胞测序基准数据集的应用场景有哪些?

单细胞测序基准数据集具有以下应用场景:  1. 算法和工具开发    - 用于测试和优化新的单细胞数据分析算法和工具,例如细胞聚类算法、差异表达基因检测方法、细胞轨迹推断模型等。  2. 性能比较与评估    - 对不同的单细胞测序分析方法和软件进行全面、客观的性能比较和评估,帮助研究人员选

时空稀疏小样本学习大规模神经形态数据集发布

近日,中科院自动化研究所研究员曾毅团队提出了一个用于时空稀疏小样本学习的大规模神经形态数据集——N-Omniglot,为脉冲神经网络的学习与训练提供了一个更具挑战性的基准。相关研究成果发表于自然出版社旗下期刊《科学数据》。 深度学习的成功在很大程度上归功于像ImageNet和COCO这样的数据集的引

药监局发布《疫苗追溯基本数据集》等3项标准

  8月26日,国家药监局印发《疫苗追溯基本数据集》《疫苗追溯数据交换基本技术要求》《药品追溯系统基本技术要求》3项信息化标准。加上前期已于2019年4月发布的《药品信息化追溯体系建设导则》《药品追溯码编码要求》2项标准,疫苗信息化追溯体系建设所需的5项标准已经全部发布实施。  统一的标准规范是药品

单细胞测序基准数据集的建立流程是怎样的?

以下是建立单细胞测序基准数据集的一般流程:  1. 研究目标确定    - 明确建立数据集的目的,例如评估特定分析方法、研究特定疾病或细胞类型等。  2. 样本收集    - 从多个来源获取具有代表性的样本,包括不同组织、个体、疾病状态等。遵循伦理和法律规定进行样本采集。  3. 实验设计

鼎湖山站入选首届优秀共享开放遥感数据集

记者从中国科学院华南植物园获悉,广东鼎湖山森林生态系统国家野外科学观测研究站(以下简称鼎湖山站)于2020年底在《中国科学数据》发表的数据论文“2005–2018年鼎湖山森林生态系统定位研究站气象数据”,近日入选2021年度优秀共享开放遥感数据集优秀数据集奖名单。 据悉,这是鼎湖山站继今年2月2

单细胞测序基准数据集的使用方法有哪些?

以下是一些常见的单细胞测序基准数据集的使用方法:  1. 方法验证和比较    - 将新开发的分析方法应用于基准数据集,并与已有的成熟方法进行比较,以评估新方法的性能优势和局限性。  2. 算法优化和调参    - 通过在数据集上的多次试验,调整和优化分析算法的参数,以获得最佳的分析结果。 

Immune-Cell-Atlas-数据集的应用有哪些局限性?

Immune Cell Atlas 数据集的应用可能存在以下一些局限性:  1. 样本代表性有限:数据集的样本可能来自特定的人群、组织或疾病状态,不一定能完全代表更广泛的个体差异和复杂的临床情况。  2. 技术偏差:单细胞测序技术本身可能存在一定的技术偏差,例如细胞捕获效率、测序深度、基因丢失等,可

中国湖泊50年数据集发布:-数量面积均有增加

   近日,中国科学院青藏高原研究所发布了中国50年湖泊数据集,并揭示了中国6大区域湖泊变化特征与潜在驱动机制,共享了中国过去50多年来大于1平方公里的湖泊变迁数据集。该数据集是目前首次基于历史地形图和超过3831景遥感卫星影像获得的长时间序列湖泊编目数据集,相较现有数据更新、更完整。  湖泊是重要

分享一下-Immune-Cell-Atlas-数据集的分析案例

以下是一个关于 Immune Cell Atlas 数据集的简单分析案例示例:  **研究问题**:比较健康个体和自身免疫性疾病患者(如类风湿关节炎)中特定免疫细胞亚型的基因表达差异。  **数据获取**:从相关数据库下载 Immune Cell Atlas 数据集,其中包含健康对照和患者的免疫细胞

推荐一些-Immune-Cell-Atlas-数据集的分析软件

以下是一些常用于分析 Immune Cell Atlas 数据集等单细胞测序数据的软件:  1. **Seurat**:这是一个广泛使用的 R 包,提供了一系列用于单细胞数据质量控制、标准化、降维、聚类和差异表达分析等功能。  2. **Scanpy**:基于 Python 的单细胞分析库,支持多种

提供一些-Immune-Cell-Atlas-数据集的使用示例

以下是一些 Immune Cell Atlas 数据集的使用示例:疾病标志物研究:比较健康个体和患有特定免疫疾病(如类风湿性关节炎、系统性红斑狼疮等)患者的免疫细胞图谱,挖掘与疾病相关的特异性细胞类型或基因表达模式,作为潜在的疾病诊断标志物。药物研发:在药物临床试验中,利用数据集评估新药物对免疫细胞

临床测序重磅成果!300多种肿瘤,突变数据集问世

  肿瘤分子分析是精准肿瘤医学的基本组成部分,它能够识别基因以及通路中所发生的变化,这是个性化医疗的关键。不同组织复发性突变的存在,加上分子靶向治疗组合的扩大,这就需要灵活且综合性的方法来分析全癌谱中与临床相关的基因。  5月8日,Nature Medicine杂志在线发表了一篇“大作”,科学家们采

研究开发单细胞空间转录组数据分析可视化平台

  单细胞测序技术是一种在单细胞水平上对基因组、转录组、表观组等进行高通量测序分析的技术。单细胞测序技术能够在组学水平揭示细胞间的异质性。单细胞水平细胞谱系追踪技术位居2018年Science 杂志评选的十大科学突破之首。常规单细胞转录组测序技术丢失了细胞在原组织中至关重要的空间位置信息,而单细胞空

数据标注优秀案例集之四十七-|-云藏搜索引擎藏文信息处理数据标注

云藏搜索引擎藏文信息处理数据标注  申报单位:海南藏族自治州藏文信息技术研究中心  推荐单位:青海省数据局  一、案例简介  藏文信息处理面临语言结构复杂、标注标准缺失、数字化资源不足等问题。本案例通过系统化数据标注技术,构建高质量藏文语料库,赋能藏文信息化行业,推动藏文自然语言处理技术的进步和实用

数据标注优秀案例集之四十四-|-产教融合创新实践-赋能数据标注人才培养

 产教融合创新实践 赋能数据标注人才培养  申报单位:山东融发数字运营有限公司、山东地源惠泽科技发展有限公司  推荐单位:山东省大数据局  一、案例简介  针对数据标注行业人才短缺、效率质量双低的痛点,通过制定人才培养标准、落地数据标注项目、提高产业交付效率,打造以产教融合为底座的数据标注产业赋能平

数据标注优秀案例集之四十六-|-AI数据标注助力中医药领域高质量发展

AI数据标注助力中医药领域高质量发展  申报单位:成都中医药大学  推荐单位:四川省发展和改革委员会(四川省数据局)  一、案例简介  为解决中医药领域转型面临的数据标注效率低、标注标准不统一、跨模态数据融合难等问题。案例通过自研中医古籍机器标注系统、构建多模态数据治理工具链、引入联邦计算保障隐私安

数据标注优秀案例集之四十五-|-数智引擎:产教融合型数据标注人才培养

数智引擎:产教融合型数据标注人才培养  申报单位:河南多鲸信息技术有限公司  推荐单位:河南省发展和改革委员会  一、案例简介  针对数据标注行业产教脱节、人才供需错位等痛点,构建产教融合型培养体系:校企联合将168学时理论实操课程与产业真实订单融合,通过“学习即生产”的沉浸式教学模式,实现产教双向

2.7万份样本采集分析-首份地球微生物多样性数据集出炉

  英国《自然》杂志10月31日发表了一篇微生物学重要论文:科学家通过分析2.7万份来自全球范围内不同环境所得的微生物样本,对细菌和古菌的多样性进行了前所未有的深入解读。该元分析属于地球微生物组计划(EMP)第一期的一部分,该计划的最终目标是表征地球上所有的微生物。  微生物生态研究的一个重要目标,

2019年科技基础性工作专项微生物领域项目数据集公布

  近日,国家微生物科学数据中心发布了由中国科学院微生物研究所、中国人民解放军军事科学院军事医学研究院、中国科学院海洋研究所等单位牵头的2019年科技基础性工作专项微生物领域项目数据集,所有公开数据通过国家微生物科学数据中心门户对国内外科学家共享(www.nmdc.cn)。此次共开放数据集107个,

美国实验室发布超大规模有机分子数据集

  美国能源部橡树岭国家实验室(ORNL)科研人员生成并发布了两个超大规模的有机分子数据集,提供了超1000万个有机分子的紫外可见光谱特性。科研人员开发了一款可扩展的工作流程软件,确保量子力学代码生成的文件得到正确处理,并使用该软件生成GDB-9-Ex数据集,再进一步扩展生成ORNL_AISD-Ex

“中国生态系统定位观测与研究数据集”丛书发布

日前,中国国家生态系统观测研究网络(CNERN)和中科院中国生态系统研究网络(CERN)在北京召开“中国生态系统定位观测与研究数据集”丛书发布会。  生态系统观测研究网络是一个数据密集型的野外科技平台,各野外台站在长期的科学研究中,积累了丰富的科学数据,这些数据是生态学研究的第一手原始科学

我国科学家首次公开了SAR图像船舶检测数据集

  近日,中国科学院空天信息研究院数字地球重点实验室研究员王超团队首次公开了SAR图像船舶检测数据集。该数据集来自于多源、多模式SAR图像。基于此数据集,该团队实现了复杂背景下的商船检测与分类一体化深度学习处理系统,在无需海陆分割的基础上,实现商用船舶的近实时自动检测与分类,为我国国产高分3号的业务

监测碳排放中国碳卫星获取首个全球碳通量数据集

  8月15日,记者从中国科学院大气物理研究所获悉,基于我国第一颗全球二氧化碳监测科学实验卫星中国碳卫星的大气二氧化碳含量观测数据,来自该所等单位的研究人员利用先进的碳通量计算系统,获取了中国碳卫星首个全球碳通量数据集。这是一个里程碑式的结果,标志着我国具备了全球碳收支的空间定量监测能力,是国际上继

岛津推出《ICPMS2030-应用数据集册食品安全篇》

  俗话说“民以食为天,食以安为先”,但近年来食品安全事件频发,无论是水俣病、含铅“麻辣小龙虾”,还是“皮革奶”、“镉大米”等都是国内外已报道的食品重金属污染事件。食品中重金属在人体中具有蓄积性,随着在人体蓄积量的增加,机体会出现各种中毒反应,其危害是多系统、多器官、多指证和不可逆的,严重危害人类健

高质量场景数据集将是人形机器人落地壁垒

机器人硬件趋同趋势显现,具备高壁垒的核心硬件长期来看将是“香饽饽”,人形机器人能力的提升有赖于软件能力的加强。高质量场景数据集会成为人形机器人落地的核心壁垒之一,谨防陷入“有多少人工,就有多少智能”的怪圈。高工机器人产业研究所所长卢瀚宸。从15世纪达芬奇绘制出世界上第一份人形机器人手稿,到如今波士顿

我国发布更新第二款全球海洋Argo网格数据集

近日,由上海海洋大学和自然资源部杭州全球海洋Argo系统野外科学观测研究站联合研制的全球海洋Argo网格数据集(简称GDCSM_Argo)在国际Argo官方网站正式发布,这是我国在国际上公开发布并定期更新的第二款全球海洋Argo网格数据集。该数据集可广泛应用于海洋、气象、渔业海洋学等领域的基础研究,