2月24日,业界首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X正式发布,并面向用户提供下载使用。该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布。
据了解,此次发布的数据集首次实现在相同时空下,车端与路端联合视角的2D、3D标注方法创新。作为业界、学界首个开源车路协同数据集,其将服务科研、产业、政府机构,有效协同各方进行车路协同的学术研究和产业落地。
据介绍,此次发布的数据集来自北京市高级别自动驾驶示范区10公里真实城市道路、10公里高速公路、以及28个路口范围,包含来自车端、路端相机和车端、路端激光雷达等多类型传感器的71254帧图像数据和71254帧点云数据,涵盖晴天、雨天、雾天、白天和夜晚、城市道路与高速公路等丰富场景。与仅包含单车端或单路端的数据集相比,该数据集提供了相同时空下车端与路端联合视角的多模态数据,并提供了不同传感器联合视角下的融合标注结果,用于更好地服务车路协同算法研究和评估。此外,数据集通过半自动自学习车路协同3D融合标注方法等创新,有效地减少了数据集构建成本。
高质量数据是车路协同自动驾驶技术的关键,能够持续优化车路协同的算法,助力自动驾驶系统迭代升级,为高级别自动驾驶的大规模推广做好安全保障。数据集DAIR-V2X的发布,将为业界学界带来海量、多模态、多视角的真实场景数据,有望促进学术界和产业界共同推进数据驱动的车路协同自动驾驶技术升级。
技术升级的尽头是“标准”。北京经济技术开发区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊表示,未来将及时利用数据转化制定一批车路协同数据标准,推动行业数据要素、接口、格式等标准统一,为示范区建设和行业发展提供参考和指导。
2020年2月,国家发改委联合相关部委出台《智能汽车创新发展战略》,将“推进智能化道路基础设置规划建设”作为国家战略任务,明确了“单车智能+车路协同”的中国特色自动驾驶路线,车路协同成为各界研究重点。基于此,清华大学智能产业研究院院长张亚勤有着自己的判断。他认为建设高等级智能网联道路是智能驾驶及智能交通的一大趋势,既保证了智能车量产的可能性,又保障了高级别自动驾驶基于场景驱动落地的可行性。
面对缺乏数据集的现实问题,清华大学智能产业研究院发起数据集建设,并将数据集对高校、科研院所、产业用户开放,可以更好地支撑科研机构进行科学研究;同时示范区真实的数据采集、多样的场景覆盖、海量的数据样本,也可以解决企业在产品开发中的切实需求。
“数据是自动驾驶、车路协同和智能交通等领域取得突破发展的原动力。”百度副总裁、智能交通事业部总经理尚国斌在发言中表示:“数据的有效积累,不仅可以对同等级的算法、算力条件下的效果做质的提升,还可以自动化地识别难题、解决难题,形成人工智能‘见多识广、越用越聪明’的正向循环。”
尚国斌介绍,百度作为车路协同数据集建设的技术支持方,后续将逐步支持发布便于用户上手和基准复现的相关工具和代码,并开展数据集相关使用培训,以支持学术界开展车路协同相关研究。
在2025年3月21日首个“世界冰川日”召开的“第三届全国冰冻圈科学大会”上,中国科学院西北生态环境资源研究院发布了中国第三次冰川编目数据集。西北研究院是我国最早从事冰川研究工作的科研单位,分别于20......
在3月21日首个“世界冰川日”召开的第三届全国冰冻圈科学大会上,中国科学院西北生态环境资源研究院发布了中国第三次冰川编目数据集。根据第三次中国冰川编目,2020年前后中国最新冰川面积约为4.6万平方千......
DNA转座子也称跳跃基因,可被用作基因工程工具。近日,中国科学院动物研究所张勇和王皓毅研究组开展了迄今为止最大规模的DNA转座子活性筛选,构建了目前最大的活跃DNA转座子数据集,极大扩展了基于DNA转......
机器人硬件趋同趋势显现,具备高壁垒的核心硬件长期来看将是“香饽饽”,人形机器人能力的提升有赖于软件能力的加强。高质量场景数据集会成为人形机器人落地的核心壁垒之一,谨防陷入“有多少人工,就有多少智能”的......
美国能源部橡树岭国家实验室(ORNL)科研人员生成并发布了两个超大规模的有机分子数据集,提供了超1000万个有机分子的紫外可见光谱特性。科研人员开发了一款可扩展的工作流程软件,确保量子力学代码生成的文......
2月24日,业界首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X正式发布,并面向用户提供下载使用。该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展有限......
2月24日,业界首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X正式发布,并面向用户提供下载使用。该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展有限......
全球高分辨率地表太阳辐射数据集近日正式上线,用户可免费下载1983年7月至2017年6月的相关高分辨率(10公里、3小时)数据。这是目前我国发布时间序列最长的地表太阳辐射数据,由中国科学院青藏高原研究......
科学数据如果孤立存在就毫无用途,因此,中国科学院大气物理研究所主办的国际期刊《大气科学进展》(AdvancesinAtmosphericSciences,AAS)正积极推动与协助充分发挥数据集应用的作......
艾伦脑科学研究所的神经科学家历时4年系统研究了小鼠视觉皮层的神经活动,并于7月13日首次公布了规模和范围前所未有的数据集。该数据可公开访问,有助于科学家理解人类大脑并为其建立模型。艾伦脑科学研究所20......