大模型又整活,照片也能唱歌说话

文 | 《中国科学报》记者 赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马俑,还有蒙娜丽莎、奥黛丽·赫本、孔子、鲁迅……只要一张照片和一段音频,他们就能开口说话、唱歌、来上一段Rap。还记得视频生成大模型Sora演示视频中东京街头的那位时尚女郎吗?她现在也开口“献唱”了。这一切都来源于通义实验室研发的人工智能大模型EMO—— Emote Portrait Alive(表情肖像视频)。EMO模型只需一张肖像照、一段音频,就可生成栩栩如生的照片说话(talking head)视频。4月26日,EMO模型正式上线通义APP,并开放给所有用户免费应用。目前,借助这一功能,用户可以在唱歌、热梗、表情包中任选一模板,通过上传一张肖像照片就能get一段同款唱作。EMO不同于Sora,更有别于换脸和数字替身EMO其......阅读全文

AI大模型走出“泡沫期”未来何如

  今年3月ChatGPT-4上线以来,国内科技龙头企业密集推出人工智能大模型,百度“文心一言”、阿里云“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场,呈现百花齐放、迅猛发展的态势。截至2023年10月初,国

《中医药大模型评测标准》发布

近日,中医药交叉学科和智能科学大会在中国中医科学院举办,大会主题为“AI创新中医发展、数智均衡医疗资源”。国家中医药管理局副局长、中国中医科学院院长、中国工程院院士黄璐琦表示,中医药传承数千年,积累了海量的中医诊疗医案、处方等数据,但由于中医药名词术语与一般文本差别较大,挖掘其隐藏的知识、规律和经验

两款“坤元”大模型发布

7月29日,第三届海岸带大会在山东烟台召开。中国科学院地理科学与资源研究所研究员、“坤元”大模型首席科学家苏奋振发布了两款自主研发的大模型——“坤元·感东南”与“坤元·拟千海”。两款大模型分别针对陆和海,构建起陆海智能监测与模拟技术体系。这是遥感与海洋研究融合人工智能的重要成果,有望为区域遥感精准快

8个小技巧“用好”大语言模型

用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望

通用大模型的发展路径与挑战

  当今世界,以大模型为代表的通用人工智能技术在全球范围内扮演着日益重要的角色,对推动全球科技进步和经济发展起到重要的作用。  时代的拷问也随之而至:未来通用大模型的发展路径是什么?如何构建高效、自主的算法算力?如何利用大模型等先进人工智能技术来构建新一代科学研究的新范式?  日前,第二十六届中国科

同济大学首发专属大模型ChatTJ

6月11日,同济大学推出一款专属大模型ChatTJ,现阶段着重为高招季考生和家长提供24小时全天候、不断线的咨询服务,后续将用于同济大学人才培养并拓展至学校综合事务等相关事项的常规咨询服务。这也是同济大学面向智能时代和社会需求,加快“人工智能+”步伐的又一创新探索实践。记者从同济大学获悉,ChatT

商汤大模型多个评测表现超ChatGPT

本报讯 (记者沈湫莎)商汤科技近日公布了自研中文语言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。评测显示,“商量”在这三个测试集中的表现均领先ChatGPT,实现了我国语言大模型研究的突破。      全球三大权威语言模型测评基准

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

AI大模型“源”炼造客服大脑

  2018年至今,NLP领域经历了非常大的变化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微调)的突破,NLP在预训练大模型的暴力拆解路上越走越远,这也让各行业开始相信:很多之前无法做到的场景、效果,现在可以有新的解法和落地。  智能客服,是

全球首个知识增强千亿大模型亮相

  12月8日,鹏城实验室与百度联合发布全球首个知识增强千亿大模型——鹏城—百度·文心。  为什么大模型在产学界持续走热,越来越多的技术公司入场?  如中国工程院院士、鹏城实验室主任高文所言,预训练模型赋能人工智能衍生更多的应用,而不局限于某个领域,是人工智能自身发展并作用于社会及科学创新的重要工具

人工智能的五大“视觉”难题

  近年来,图像识别水平的快速提升推动人工智能热潮形成,图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特征、医学图片等识别的准确率,而且进一步推动了安全监控、智能交通、无人机、智能制造等广泛领域的发展。但也遇到进一步发展,如可解释、可分析综合、可设计仿真等等挑战。  对此,在中国工程院信

2025年上海市“通用人工智能大模型”基础研究专项指南(第一批)发布

关于发布2025年上海市“通用人工智能大模型”基础研究专项指南(第一批)的通知各有关单位:   为加快建设具有全球影响力的科技创新中心,更好发挥上海人工智能实验室的科技创新平台作用,上海市科学技术委员会联合上海人工智能实验室发布2025年上海市“通用人工智能大模型”基础研究专项指南(第一批)。   

新人工智能模型和算法揭开肿瘤基因内在交互关系

近日,《自然》子刊 NPJ Precision Oncology发表了中国科学院大学张正军教授团队等关于一类新型人工智能AI模型和算法并应用到结直肠癌关键基因识别的研究成果。研究发现,由组织样本识别出的4个基因及其交互关系就可以完全识别结直肠癌。这四个基因使用了来自与世界不同地区不同人种不同研究目标

人工智能模型消化80小时的视频以学习手语

对于聋人和重听者来说,像Alexa和Siri这样的语音识别技术反而可能是有效沟通的障碍。研究人员利用人工智能开发了一种将手语转换为文本的工具,可能会增加聋人社区的包容性和可及性。翻译手语需要精确理解手语者的姿势,以产生准确的文字转写。巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究

3大遥感数据源接入“商汤地界”AI遥感大模型

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519533.shtm近日,商汤科技宣布携手国内头部遥感数据平台“吉林一号网”、“四维地球”、“星图地球”,升级了其“SenseEarth智能遥感云”平台的数据源。用户无需准备数据,即可通过“商汤地界”平台

刘韵洁:中国发展大模型的机会在通用行业大模型

  中国工程院院士、紫金山实验室主任刘韵洁接受采访时判断,中国发展大模型的机会在于通用行业大模型。  在日前举办的2023中国算力大会间隙,刘韵洁接受媒体采访时说,“大模型方面,美国走在前面。”中国需要在算力、数据、网络等方面,进行深入的、专家层面的研究,制定出应对措施和办法。  他坦言:“当前大模

科学家发布全球首个多模态地理科学大模型 推动地理学与人工智能深度融合

9月19日,中国科学院地理科学与资源研究所正式发布该单位联合中国科学院青藏高原研究所、自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)。大模型是指通过海量数据训练的深度学习模型,具备强大的语言理解、信息生成和处理能力。“坤元”是专注于地理科学的专业语言大模型,具

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

广州首个基础大模型“黄埔星”正式问世

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515970.shtm1月12日,第二届粤港澳大湾区(黄埔)国际算法算例大赛颁奖典礼、第三届启动会暨大模型圆桌论坛在广东广州开发区、广州市黄埔区举办。活动当天,10个赛道共计80支队伍登上粤港澳大湾区(黄埔

北大成立大模型联合实验室

  12月12日,北京大学联合字节跳动成立豆包大模型系统软件联合实验室,校企携手面向人工智能系统软件开展科学研究和技术转化,培养高素质创新型软件人才。  “以大模型为代表的人工智能技术的迭代升级,正以前所未有的速度推进。对于大模型而言,高效能、大规模的算力资源管理是重大需求,而系统软件是解决这一需求

Meta发布最新开源大模型Llama-4

  据路透社报道,当地时间4月6日,美国科技公司Meta推出了开源人工智能模型Llama 4。据介绍,该模型目前有Scout和Maverick两个版本,是Meta迄今为止最先进的模型,也是同类产品中多模态性最强的模型。  报道称,Llama 4系列采用了先进的混合专家架构,这一架构在模型训练及用户查

浪潮海若大模型业务战略正式发布

  在人工智能技术飞速发展的当下,行业大模型将如何提升城市治理与服务、赋能千行百业?浪潮云给出了自己的答卷。  4月2日,由中共山东省委网络安全和信息化委员会办公室指导、青岛市大数据局支持、浪潮云主办的“云端眺望 向‘数’而生”数字创新生态大会在青岛市成功举办。会议聚焦服务新质生产力,浪潮云正式发布

商汤大模型“商量”多个评测表现超ChatGPT

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm

大模型应用是否会复制“苹果时刻”

最近一两个月,不少哔哩哔哩(B站)用户发现,各种大模型使用教程视频越来越多了,智谱、Kimi Chat、文心一言、通义千问……业内人士表示,头部大模型厂商几乎已全部入局,仅在B站,品牌方的广告投入就是去年的3-4倍。4月底,在发布日日新大模型5.0版后,商汤科技的股价一度上涨超过30%,当周股价涨幅

PNAS:小鼠模型需慎用,基因表达差异大

PNAS:小鼠模型需慎用,基因表达差异大  小鼠被广泛用于模拟人类代谢、疾病和药物应答,是医学研究中的一个基本工具。然而斯坦福大学的研究团队指出,人类和小鼠的基因表达存在着惊人的差异,不论是蛋白编码基因还是非编码基因。这项研究发表在十一月十七日的美国国家科学院院刊PNAS杂志上。  Mic

医疗大模型智能体决策框架FRAME发布

  近日,中国科学院合肥物质科学研究院研究员丁增辉联合华南理工大学教授靳战鹏团队,提出一种医疗大模型智能体决策框架FRAME (Feedback-Refined Agent Methodology)。相关研究工作被第63届国际计算语言学年会ACL录用,博士生张一鸣与余承章为论文共同第一作者。  探寻

香港首个自主研发基础大模型初步完成

中新社香港4月14日电 (记者 戴梦岚)第二届香港国际创科展日前在香港会议展览中心开幕。香港科技大学首席副校长兼“香港生成式人工智能研发中心”(HKGAI)主任郭毅可在展会上接受记者采访时透露,由HKGAI训练、香港首个自主研发的基础大模型已初步完成。郭毅可表示,该大模型支持中文和英语,将为香港人工

讯飞星火认知大模型面向全民开放

原文地址:http://news.sciencenet.cn/htmlnews/2023/9/507872.shtm

生成式法律大模型呼之欲出

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504932.shtm7月15日,由上海交通大学主办,上海交通大学凯原法学院、智慧法院研究院、人民法院矛盾纠纷源头治理研究基地、上海市法学会公司法务研究会联合承办的“生成式法律大模型专题研讨会”成功举行。

设计基因编辑工具的AI大模型问世

  记者27日从中国农业科学院获悉,该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表于国际期刊《细胞