多模态文本智能技术助力AI实现智能推理

随着人工智能(AI)深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近日,第八届中国模式识别与计算机视觉学术会议(PRCV 2025)在上海召开,“多模态文本智能大模型前沿技术与应用”论坛同期举办。来自华南理工大学、哈尔滨工业大学、南开大学、华中科技大学、小红书及合合信息技术团队的专家与学者,深入探讨多模态文本智能领域的最新技术突破与场景应用案例。如同人类需要同时调用视觉、听觉、触觉等多感官来全面理解外部世界,大模型也需要综合处理文字、图片、表格等文本信息后作出判断。“实战”应用标准对大模型的多模态内容深度整合能力提出了新的要求,语义割裂、场景理解局限、决策失误等常见的模型缺陷制约了其在行业中的应用发展。论坛期间,合合信息推出“多模态文本智能技术”方案,该方案可通过文本相关空间位置理解深层语义逻辑,实现对多模态信息的“立体化综合化理解”,赋予模型真正的文本“阅读理解”能力。多模态指利用多种不同形式或感知渠道的信息进行表......阅读全文

瑞智病理大模型RuiPath为临床诊断精准导航

  2月18日,在上海交通大学医学院附属瑞金医院(以下简称瑞金医院)举行的2025医疗人工智能与精准诊疗发展论坛上,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。发布仪式。  在癌症诊疗中,早发现、早诊断、早治疗至关重要。然而,我国病理医生数量缺口巨大、分布不均衡,基层医院初诊符合率较低,病

百度AI技术-智能服务覆盖出行“前中后”

语音、自然语言处理等AI技术在百度地图上的应用不断深入,9月19日,百度地图在京举办了“AI出行更简单 百度地图十一全民畅行节”发布会。 “今年百度地图与AI技术全面结合,AI技术正全方位赋能百度地图。”百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰表示,一方面,地图

百度“2022十大科技前沿发明”发布

9月20日,百度发布“2022十大科技前沿发明”,披露其高价值ZL成果。ZL显示,百度多项人工智能、自动驾驶ZL技术处于领先地位。这10项科技前沿发明依次为:跨模态通用可控人工智能内容生成(AIGC)、无人车多传感器融合处理系统、知识增强大模型、深度学习通用异构参数服务器架构、基于AI的生物计算平台

科大讯飞:AI虚拟主播“上新”

“大家好,我是你们的主播茜茜。”“我是茜茜的妹妹,西西,别忘记点‘关注’哦。”5月15日,主播茜茜牵手“孪生妹妹”亮相科大讯飞抖音直播间,这对“姐妹花”样貌相同,可却不是双胞胎——科大讯飞新推出的AI虚拟直播系统,不仅复刻刻了真人主播茜茜的外在,还赋予了其驱动的能力,从而能够实现虚拟主播实时直播。随

GPT4o为OpenAI开启超级入口

·基于ChatGPT或GPT-4o,未来人类获得信息的方式很可能会改变,GPT-4o或为OpenAI开启了一个超级入口,这可能会对谷歌带来影响。接下来,OpenAI需要判断的是在产品上的极致体验是否是刚需。“GPT-4o在交互模式上是一个巨大进步。”5月14日,蚂蚁集团副总裁、NextEvo负责人徐

聆心智能:让AI“有心、有爱”

“我奶奶会教我一些蛋糕的制作方法,现在奶奶不在身边,都没有人教我了,我学会了新的制作方法也没有人可以分享……”“你很怀念与所爱的人一起做某些事情的时光。而现在这种关系结束了,这一定很让人难受。”在北京聆心智能科技有限公司(以下简称聆心智能)近日举办的开放日活动现场,CharacterGLM超拟人大模

聆心智能:让AI“有心、有爱”

原文地址:http://news.sciencenet.cn/htmlnews/2023/8/507186.shtm“我奶奶会教我一些蛋糕的制作方法,现在奶奶不在身边,都没有人教我了,我学会了新的制作方法也没有人可以分享……”“你很怀念与所爱的人一起做某些事情的时光。而现在这种关系结束了,这一定很让

AI智能体发展提速-小企业亦可能弯道超车

 大模型持续更新迭代,人工智能产业不断向深发展。随着生成式AI产品逐渐走入人们的日常工作生活,市场对人工智能的认知进一步加深,更加高阶的AI智能体开始进入投资者视野。    当前,OpenAI正在全力布局AI智能体,另有多家国际科技巨头也在这一领域加码,国内上市企业同样瞄准这一方向,积极发力布局,相

AI教育风潮席卷中国高校-学生用AI学AI

  “What does this machine do(这台机器是干什么的)?”4日下午,西南交通大学孟加拉国留学生Zahidul Alam拍下身前吊弦疲劳试验仪器的照片。收到他的语音提问后,手机中的24小时在线“AI学伴”瞬间给出如论文般详细的英文回答。  这是西南交大首门人工智能通识课的第一课

《文本图像篡改检测系统技术要求》团体标准发布

Deepfake(深度伪造)技术野蛮生长,导致文档图像领域成为诈骗的重灾区。在韩国通讯软件Telegram上,某私密聊天室成员利用女性照片非法合成色情照片和视频,造成恶劣影响;某视频网站上,由人工智能(AI)合成的马斯克等名人为虚假投资做背书的视频泛滥成灾。为助力文档图像处理技术安全、有序发展,近日

OpenAI和谷歌再度燃起争霸烽火

谷歌Project Astra亮相发布会。 图片来源:美国Gizmodo网站OpenAI与谷歌的又一次技术交锋刚刚落下帷幕。北京时间5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。一天之后,谷歌在北京时间15日凌晨的I/

精准诊断消化道罕见病的医学多模态大模型发布

近日,首个可精准诊断罕见病的医学影像多模态大模型矩阵“明岐”正式亮相。当天,由上海交通大学主办,上海交通大学计算机学院(网络空间安全学院)、上海交通大学国际与公共事务学院、健康长三角研究院共同承办的“AI赋能精准诊疗创新发展学术会议”在上海举行,来自上海交通大学、上海申康医院、中南大学湘雅三医院等单

西安交通大学两团队在多模态法医组织病理学AI诊断领域取得重要进展

  法医病理学在司法鉴定、医疗纠纷和公共安全领域发挥着至关重要作用,鉴定人员通过案情与现场勘查、尸体解剖和组织病理学检查确定死者的死亡死因与死亡方式。不同于临床病理学的新鲜活检组织,法医从尸检中获得的组织存在不同程度的自溶与腐败改变,给显微镜下准确诊断造成诸多困难。此外,传统组织病理学诊断过程繁琐、

超高清直播与AI智能实时监控关键技术通过评价

5月29日,由广州虎牙信息科技有限公司和广州虎牙科技有限公司共同完成的“超高清直播与AI智能实时监控关键技术的研发及应用”项目在广州顺利通过由广东省高新技术企业协会组织并主持召开的科技成果评价会议。经专家评价,该成果在直播技术和应用方面达到国际先进水平。会议现场。李玛供图该项目深入研究了超高清视频直

“多模态”技术助推图像内容安全建设

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/510589.shtm

2025年,哪些全球重大科技进展值得期待?

  世界正面临着前所未有的科技进步。从量子计算到生物技术,从太空探索到绿色能源……科学与技术的发展大幅提高了效率,催生出新的商业模式和机遇,给社会、经济以及人类生活带来深刻影响。展望新的一年,科技领域有许多事件值得关注。  量子技术向商用迈进  2024年6月,联合国宣布2025年为“国际量子科学与

这个2023最火的领域,首份2024十大趋势报告来了

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515399.shtm从年初“火”到年尾,大模型让人们看到了通用人工智能(AGI)的一缕曙光。2023年,人工智能生成内容(AIGC)作为大模型应用场景之一,在短时间里完成了从简单的“Chat”到“Work

广州南沙举行“ai上未来”智能科普行

  近日,广州市南沙区科协联合广州趣丸网络科技有限公司(以下简称趣丸科技)共同举办的南沙科普游系列活动——“ai上未来”智能科普行在趣丸科技总部举行。25组亲子家庭开启了一场奇妙的AI科技之旅,让孩子们在亲身体验中感受科技的魅力,在心中种下探索未来的种子。  参观现场。王洁健供图,下同  在趣丸科技

AI智能菌落计数,“肉眼”和“大脑”都不用

  在医疗卫生,环保,食品,化工,生物产业等领域,细菌培养都是非常重要的工作.菌落数计算更是非常必要的评判指标.但是菌落的计数是一个非常繁琐且枯燥的过程.  传统人工菌落计数”四大罪状”  1、费时费力,效率低下,影响研究或是结果报告的效率。  2、可能出现人为的记忆偏差出现计数错漏。  3、存在密

全球首个孤独症AI智能体发布

在“六一”国际儿童节当天,由中国科学院杭州医学研究所(以下简称杭州医学所)牵头研发的全球首个孤独症AI智能体“StellarCare AI”(星启诶艾)在福州发布。这款聚焦孤独症“早筛-诊断-干预-保障”全链条的智能体,以分子医学和人工智能技术为核心引擎,融合多模态数据解析能力,以期为孤独症患者及其

喷涂智能皮肤用AI理解手部任务

美国斯坦福大学开发的一种新智能皮肤可能预示着有一天人们可在隐形键盘上打字,仅靠触摸来识别物体,或者允许用户在沉浸式环境中通过手势与应用程序交流。 近日在《自然·电子学》杂志上发表在的一篇论文中,研究人员描述了一种新型的可拉伸生物相容性材料,这种材料可像防晒喷雾一样喷洒在手背上,并在此集成了一个微

评测成绩比肩GPT4,商汤日日新大模型再升级

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517164.shtm近日,商汤科技发布“日日新SenseNova 4.0”,多维度升级了大模型体系。据介绍,日日新SenseNova 4.0 具备更广泛的知识覆盖、更稳定的推理能力、更优秀的长文本理解力、

谷歌I/O大会提“AI”121次,发布十余项更新及新品

·本次开发者全程两个小时,谷歌CEO共提及“AI”121次,此次开发者大会,谷歌将搜索业务做了最彻底的AI改造,还更新升级了Gemini1.5Pro版本,同时推出Gemini1.5Flash轻量化小模型。此外,推出自称效果超过Sora的生成视频模型Veo。北京时间5月15日凌晨,谷歌年度开发者I/O

2026年中国AI市场规模将超264.4亿美元

  3月31日消息,据市场分析机构IDC近日发布的《2023年V1全球人工智能支出指南》显示,中国人工智能(AI)市场支出规模将在2023年增至147.5亿美元,约占全球总规模十分之一。  IDC预计,2026年中国AI市场将实现264.4亿美元市场规模,2021-2026五年复合增长率(CAGR)

广东医科大学成功部署DeepSeekGDMU大模型

  近日,广东医科大学健康医疗大数据工程中心携手华为技术团队共同打造的“DeepSeek-GDMU”大模型正式落地。记者获悉,“DeepSeek-GDMU”大模型是国内首个基于昇腾人工智能(AI)生态的医学垂直领域智慧大脑,将为广东医科大学师生提供个性化、智能化的AI服务。  在AI技术飞速发展的当

ChatGPT的拷问:何为AI伦理、AI治理

前不久,AI聊天机器人程序ChatGPT席卷全球,完成了AI第一次大规模的自传播。作为人工智能领域的现象级应用,ChatGPT可能引发的信任、责任、伦理、法律等问题也很快引发各界关注与担忧。近年来,不少关于人工智能(AI),并和人类生产、生活关系紧密的议题被广泛讨论,诸如“如何应对AI可能对社会产生

ChatGPT的拷问:何为AI伦理、AI治理

原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494707.shtm   前不久,AI聊天机器人程序ChatGPT席卷全球,完成了AI第一次大规模的自传播。作为人工智能领域的现象级应用,ChatGPT可能引发的信任、责任、伦理、法律等问题也很快引发各

“AI+”时代-|-AI“解码”免疫系统

  人体免疫系统包含了很多有关身体健康的信息,其中的关键部分就包含在血液中。医学界提出了一个大胆设想:通过创建一个万能的血液测试,采集免疫系统与病原体之间的反应信息,绘制“免疫图谱”,从而解码免疫系统中的信息,及时在疾病恶化前筛查确诊。那么,什么样的平台能提供足够的计算力,不断通过机器学习和精准模型

大模型为深度伪造带来土壤,鉴伪技术需要跨学科合作

·鉴伪技术开发需要跨学科合作,当前的鉴伪技术以软件算法为主,未来将走向软硬一体。大模型兴起为深度伪造带来土壤,业界呼吁跨学科联合攻坚鉴伪技术。在大模型时代,人工智能合成语音与真实语音之间的界限变得越发模糊,提升与之匹配的识别技术迫在眉睫。7月23日,主题为语音深度鉴伪识别的第九届信也科技杯全球人工智

尼康显微镜人工智能(AI)模块NISA-NIS.ai在细胞荧光成...

尼康显微镜人工智能(AI)模块NIS-A NIS.ai在细胞荧光成像的应用尼康仪器有限公司将人工智能(AI)和显微镜融合,发布全新技术解决方案:显微镜专用AI模块NIS-A NIS.ai,实现高精度的成像处理和图像分析等。 集合三大功能 实现强大的技术集成NIS-A NIS.ai是尼康成像软件NIS