近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。
大模型一路“高歌猛进”的背后,隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估计,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。现阶段,大量的高质量语料数据存在于书籍、论文、研报、企业文档等文档之中,复杂的版面结构制约了大模型的训练语料处理及大模型文档问答的应用能力。文档解析技术的进步,让机器能够识别文档中的多种元素,更好地处理文本、表格、图像等多类型数据,还原文档阅读顺序,加速大模型训练与应用。
大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司(简称“合合信息”)联合主办了“大模型技术及其前沿应用”论坛。论坛上,合合信息智能创新事业部研发总监常扬表示,文档解析的难点在于如何准确识别文档中的各个元素,并理解其之间的逻辑关系,需要关注“物理版面分析”和“逻辑版面分析”。
据常扬介绍,物理版面分析侧重于视觉特征、文档布局,主要任务是把相关性高的文字聚合到一个区域,比如一个段落,一个表格等等,并选用目标检测任务进行建模,使用基于回归的单阶段检测模型进行拟合,从而获得文档中各种各样的布局方式;逻辑版面分析侧重于对语义特征的分析,主要任务是把不同的文字块根据语义建模,例如通过语义的层次关系,形成一个目录树结构。
此外,文档解析技术中文档元素检测、文字表格识别、文档版面分析、阅读顺序还原等任务涉及对版面元素和版面整体布局的判断,是文档处理领域典型的技术难题。
“我们研究过程中发现,真实世界的文档有着极为丰富的布局类型,没法单纯地用单栏,双栏、三栏等类别去定义。”常扬表示,近年来的开放词汇目标检测,视觉语义对齐等工作,以及生成式模型等前沿进展,将给版面分析带来新的研究思路。
2024年6月4日,中国环境监测总站组织对基于大模型的运维过程异常识别研究项目进行专家评审,结果如下:项目名称第一成交候选单位成交金额(万元)基于大模型的运维过程异常识别研究江苏新睿清智科技有限公司9......
记者5日获悉,从今年秋季学期开始,复旦大学将在2024—2025学年推出至少100门AI领域课程。据悉,学校成立AI课程建设国际战略咨询委员会、校内专家工作体系,对标斯坦福、卡内基梅隆和麻省理工三所大......
美国斯坦福大学的一个AI(人工智能)团队就抄袭中国大模型致歉。近日,由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V。但是,该模型很快被曝出与中国大模型公司面壁智能的开源成果M......
6月3日,复旦大学和上海科学智能研究院(以下简称上智院)联合举办“走进智能气象”主题活动暨智能气象创新生态联盟成立仪式,并发布了面向产业应用的伏羲系列气象大模型2.0(以下简称“伏羲”2.0)。包括复......
近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后,算力......
2024年5月24-26日,中国图象图形大会(CCIG2024)在西安召开。本次大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,陕西省生物医学工程学会、陕西省图象图形学学会......
近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型一路“高歌猛进......
近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型一路“高歌猛进......
ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(NewsCorp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《......
5月9日,面向中文医疗大语言模型的开放评测平台MedBench更新评测榜单,医渡科技大模型(评测名:HH-YIDU-Med)以综合得分61.3分的出色成绩登顶榜首,成为榜单中首个综合评分超过60的医疗......