多模态文本智能技术助力AI实现智能推理
随着人工智能(AI)深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近日,第八届中国模式识别与计算机视觉学术会议(PRCV 2025)在上海召开,“多模态文本智能大模型前沿技术与应用”论坛同期举办。来自华南理工大学、哈尔滨工业大学、南开大学、华中科技大学、小红书及合合信息技术团队的专家与学者,深入探讨多模态文本智能领域的最新技术突破与场景应用案例。如同人类需要同时调用视觉、听觉、触觉等多感官来全面理解外部世界,大模型也需要综合处理文字、图片、表格等文本信息后作出判断。“实战”应用标准对大模型的多模态内容深度整合能力提出了新的要求,语义割裂、场景理解局限、决策失误等常见的模型缺陷制约了其在行业中的应用发展。论坛期间,合合信息推出“多模态文本智能技术”方案,该方案可通过文本相关空间位置理解深层语义逻辑,实现对多模态信息的“立体化综合化理解”,赋予模型真正的文本“阅读理解”能力。多模态指利用多种不同形式或感知渠道的信息进行表......阅读全文
多模态文本智能技术助力AI实现智能推理
随着人工智能(AI)深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近日,第八届中国模式识别与计算机视觉学术会议(PRCV 2025)在上海召开,“多模态文本智能大模型前沿技术与应用”论坛同期举办。来自华南理工大学、哈尔滨工业大学、南开大学、华中科技大学、小红书及合合信息技术团队的专家与学
用AI识别AI:西湖大学研究可检测AI生成文本
虚假新闻、恶意产品评论、剽窃……ChatGPT、 GPT-4等AI大语言模型的应用带来便利,但其误用也带来一系列问题。西湖大学工学院张岳教授的“文本智能实验室”日前发布的一项研究提出一种高准确率、高速、低成本、通用的新文本检测方法——Fast-DetectGPT,无需训练即可识别各种AI大语言模型生
多模态AI系统实现肺部感染性疾病精准诊疗
近日,四川大学华西医院呼吸与危重症医学科教授李为民、研究员王成弟团队在《创新》上发表了最新研究论文,创新性开发了多模态融合模型,即Multimodal Integration,MMI模型,利用临床文本、影像图像、检验指标等多维度信息,实现肺部感染性疾病及病原类型精准预测,及时对危重症进行预警干预。不
基于昇腾AI的紫东.太初凭何脱颖而出?
9月1日,2022世界人工智能大会最高大奖SAIL(Super AI Leader,卓越人工智能引领者)尘埃落定。 三模态人工智能大模型“紫东.太初”在800多个角逐者中脱颖而出一举夺魁。此前数周,在济南举行的首届中国算力大会上,“紫东.太初”同样表现稳健,抱回“DC Tech创新先锋”奖杯。
阿里强势发力-引领AI创新潮流
在人工智能技术日新月异的今天,阿里国际AI团队再次向全球展示了其强大的研发实力与创新成果——最新版多模态大模型Ovis的发布,不仅标志着阿里在AI多模态技术领域的重大突破,更为全球AI生态的开放与合作树立了新的标杆。 Ovis作为阿里国际倾力打造的多模态大模型,其独特之处在于能够跨越多种数据模
如果AI有了身体会有多智能?
如果AI有身体,它会变得更智能吗? 答案是,会的。 近日,斯坦福大学教授李飞飞带领的团队研究发现,身体形态会影响虚拟生物Unimal在复杂环境的适应和学习能力,复杂环境也会促进形态智能的进化。 此项题为《通过学习和进化实现具身智能》(Embodied intelligence via le
生成式AI下一站:文本转视频
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498451.shtm 聊天机器人ChatGPT的爆红,让生成式人工智能(AI)成为科技领域的“当红炸子鸡”。除了如今“霸屏”的类似ChatGPT的语言模型之外,生成式AI领域还有大量其他技术:文本生成
中科院自动化所打造“紫东太初”全模态大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/5/500062.shtm 中新网北京5月6日电 (记者 孙自法)中国科学院自动化研究所(中科院自动化所)6日发布消息说,该所以其多模态大模型“紫东太初”1.0为基础,目前正在和武汉人工智能研究院联合打造全
中国科学院自动化所发布“紫东太初”全模态大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502978.shtm6月16日,在人工智能框架生态峰会2023上,中国科学院自动化研究所(以下简称自动化所)所长、研究员徐波正式发布“紫东太初”全模态大模型。徐波介绍,“紫东太初”全模态大模型是在千亿参数
“AI+大数据”推动数据挖掘走向数智化治理
5月20日,阿里巴巴副总裁、阿里云计算平台负责人贾扬清在媒体沟通会上表示,经过近20年的发展,人们对大数据的利用已从早期的数据挖掘进化为集数据分析、数据管理、数据协同为一体的综合治理,在这一进程中,大数据与人工智能(AI)技术的融合居功甚伟。 贾扬清提到,数字经济迅猛发展,不断丰富、增长的数
“紫东太初”全模态大模型开启AGI新路径
原文地址:http://news.sciencenet.cn/htmlnews/2023/5/500126.shtm“‘紫东太初’2.0全模态大模型可融入3D、视频、传感信号等更多模态数据,并优化语音、视频和文本的融合认知及常识计算等功能,进一步突破感知、认知和决策的交互屏障。”5月6日,在华为昇腾
跨模态通用人工智能平台“紫东太初”研发出炉
7月9日,中国科学院自动化研究所在2021世界人工智能大会(WAIC2021)上就人工智能的最新进展进行报告,发布了自动化所研发的跨模态通用人工智能平台——“紫东太初”。 “紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。多模态预训练模
未来智能社会什么样从AI到AI+
8月26日国发〔2025〕11号颁布了《国务院关于深入实施“人工智能 +”行动的意见》这一重要文件,其中特别强调“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”,其核心就是要积极构建“人、机( AI)与环境对齐的生态智能体系”,推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生
ChatGPT敲开了通用人工智能的大门了吗?
连日来,一路“狂飙”的ChatGPT持续引发着“话题地震”。 作为由OpenAI训练的对话式大规模语言模型,ChatGPT 以对话的方式与人进行交互。重点在于,它的回答之智能、之流畅令人意外。据媒体报道,ChatGPT不仅能在短短几秒内响应人们的问题需求,它还通过了美国部分高校的法律、医学考试
祝贺!紫东太初获世界人工智能大会-SAIL大奖
9月1日, 2022世界人工智能大会在沪开幕。开幕式上,本届大会的最高奖项SAIL奖(卓越人工智能引领者)正式发布,中科院自动化研究所和华为联合开发的全球首个三模态大模型“紫东太初”从众多国内外参评项目中脱颖而出,摘得大奖。紫东太初获SAIL大奖 大会组委会供图 SAIL奖旨在从全
OpenAI再出王炸,视频生成大模型Sora备受关注
人工智能(AI)领域的巨头OpenAI再次引发关注,其最新推出的视频生成大模型Sora因其出色的逼真度和想象力广受赞誉。相较于传统视频生成领域的平均4秒长度,Sora能够生成长达60秒的视频,这一创新无疑颠覆了行业的常规。 据OpenAI官网介绍,Sora是一种扩散模型,其生成视频的过程从看似
研究开发出新型AI医疗诊断系统
近日,中国科学院合肥物质科学研究院研究团队开发出新型AI医疗诊断系统MultiXpert。该系统能够在“零样本”条件下对胸片进行智能诊断,无需任何标注数据,甚至可识别出从未见过的疾病,使AI具备更接近医生诊断思维的能力。胸片是临床常用的影像学检查手段之一,但人工判读耗时且依赖专家经验。传统AI系统在
上海AI实验室发布书生通用大模型体系
如同人类的“五感”互相连通密不可分,人工智能的视觉、语言、音频等模态间的边界日渐融合,随着人工智能感知、交互和生成能力的快速发展,多模态大模型正推动人工智能迈进“通感”时代。 上海人工智能实验室(上海AI实验室)于近日发布书生通用大模型体系,其中,书生·多模态包含200亿参数,由80亿海量多模
阿里达摩院称其通用性AI模型参数突破10万亿
11月8日,阿里巴巴达摩院公布其多模态大模型“M6”最新进展,宣布其参数规模已从万亿跃迁至10万亿,这一数字远超谷歌、微软此前发布的万亿级模型,成为当前最大的人工智能(AI)预训练模型。 M6是达摩院研发的通用性人工智能大模型,拥有多模态、多任务能力,其认知和创造能力超越传统AI,尤其擅长设计、
全员95后!第十一届百度奖学金名单揭晓
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516684.shtm1月22日,第十一届百度奖学金颁奖典礼在北京举行,来自全球顶尖高校及科研机构的10位“未来AI技术领袖”脱颖而出,他们平均年龄仅27岁,其中8人聚焦大模型领域。百度首席技术官王海峰致辞
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
被OpenAI抢先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tenso
AI助力追踪肠内智能药丸
美国南加州大学科学家开发了一种人工智能(AI)驱动的系统。该系统可跟踪监测肠道疾病的微型器件,帮助高危人群在家中监测胃肠道健康状况,而不必到医院进行侵入性检查。研究成果发表在12日的《细胞报告物质科学》杂志上。一种可以毫米分辨率定位肠道内智能药丸的可穿戴系统细菌分解食物时在肠道中产生的气体可反映一个
边缘计算实现AI智能互联世界
在电子智能领域,所有类型的芯片厂商都不约而同的研发推出各种不同类型的AI处理器。国外大企,像高通、英伟达等,都已宣布推出用于智能手机和其他移动设备的神经引擎。例如在智能手机中添加AI功能和手机的Face ID应用等。使用边缘侧AI自行处理相比传输到云端处理更安全、私密,响应时间更快。按照整体大趋势,
告别传统课堂,《人工智能通识》如何用AI学AI
8月30日,记者从西南交通大学获悉,为积极贯彻落实国家教育数字化战略行动,以数字化开辟教育发展新赛道、塑造发展新动能,进一步推动人工智能赋能教育教学转型,学校将打造面向全校师生的人工智能通识课程《人工智能通识》,该课程是学校的首门AI课程。《人工智能通识》课程将于2024年秋季学期在线上线下同步上线
AI版“双手互搏”有多牛
日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。 什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克? 中国自动化
OpenAI制定分级标准,自称AI软件接近第二级
为了推进超级AI(人工智能),AI巨头OpenAI也制定了类似自动驾驶的五级分级标准。 7月12日,据外媒报道,OpenAI近日在全体员工会议上提出了一套五级分级标准,用于追踪其在打造能够超越人类的人工智能软件方面的进展。按照标准,1至5级分别为具有对话功能的“聊天机器人”、可以解决人类级别问
OpenAI制定分级标准,自称AI软件接近第二级
为了推进超级AI(人工智能),AI巨头OpenAI也制定了类似自动驾驶的五级分级标准。7月12日,据外媒报道,OpenAI近日在全体员工会议上提出了一套五级分级标准,用于追踪其在打造能够超越人类的人工智能软件方面的进展。按照标准,1至5级分别为具有对话功能的“聊天机器人”、可以解决人类级别问题的“推
3篇论文被国际会议收录-—腾讯医疗知识图谱研究近况分享
近日,腾讯在医疗AI领域的学术研究获得实质性进展,旗下医疗AI实验室共有3篇论文分别被KDD 2018、SIGIR 2018 、COLING 2018三个国际顶尖学术会议收录,论文的主要研究方向为医疗知识图谱中实体关系的发现和应用。在医疗领域,专业知识和病人信息均存储在复杂多样的文本中,如医疗文献、
谁会成为中国版-Sora?
鏖战一年的“百模大战”还未结束,两个海外AI巨头又给国内科技大厂出了难题。 就在春节假期的尾声,谷歌和OpenAI毫无征兆地放出了各自的 AI新“核武”。 谷歌拿出的新一代多模态大模型Gemini 1.5 Pro,将性能提升到了百万级别,完全秒杀了OpenAI的GPT-4 Turbo,暂居地
瑞智病理大模型RuiPath为临床诊断精准导航
2月18日,在上海交通大学医学院附属瑞金医院(以下简称瑞金医院)举行的2025医疗人工智能与精准诊疗发展论坛上,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。发布仪式。 在癌症诊疗中,早发现、早诊断、早治疗至关重要。然而,我国病理医生数量缺口巨大、分布不均衡,基层医院初诊符合率较低,病