大模型又整活,照片也能唱歌说话

文 | 《中国科学报》记者 赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马俑,还有蒙娜丽莎、奥黛丽·赫本、孔子、鲁迅……只要一张照片和一段音频,他们就能开口说话、唱歌、来上一段Rap。还记得视频生成大模型Sora演示视频中东京街头的那位时尚女郎吗?她现在也开口“献唱”了。这一切都来源于通义实验室研发的人工智能大模型EMO—— Emote Portrait Alive(表情肖像视频)。EMO模型只需一张肖像照、一段音频,就可生成栩栩如生的照片说话(talking head)视频。4月26日,EMO模型正式上线通义APP,并开放给所有用户免费应用。目前,借助这一功能,用户可以在唱歌、热梗、表情包中任选一模板,通过上传一张肖像照片就能get一段同款唱作。EMO不同于Sora,更有别于换脸和数字替身EMO其......阅读全文

生成式法律大模型呼之欲出

原文地址:http://news.sciencenet.cn/htmlnews/2023/7/504932.shtm7月15日,由上海交通大学主办,上海交通大学凯原法学院、智慧法院研究院、人民法院矛盾纠纷源头治理研究基地、上海市法学会公司法务研究会联合承办的“生成式法律大模型专题研讨会”成功举行。

文档解析技术破解大模型语料“饥荒”难题

  近日,由中国图象图形学学会主办的2024中国图象图形大会在西安开幕。大会通过20多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。  大模型一路“高歌猛进”的背后,隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估

腾讯元宝!混元大模型推出APP版

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个

商汤大模型“商量”多个评测表现超ChatGPT

原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm

腾讯大模型上线文生视频并宣布开源

据腾讯官微消息,腾讯今日宣布,混元大模型上线并开源文生视频能力。据介绍,该模型参数量为130亿,已经在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。这也是当前最大的视频开源模型。

浪潮海若大模型业务战略正式发布

  在人工智能技术飞速发展的当下,行业大模型将如何提升城市治理与服务、赋能千行百业?浪潮云给出了自己的答卷。  4月2日,由中共山东省委网络安全和信息化委员会办公室指导、青岛市大数据局支持、浪潮云主办的“云端眺望 向‘数’而生”数字创新生态大会在青岛市成功举办。会议聚焦服务新质生产力,浪潮云正式发布

大模型应用是否会复制“苹果时刻”

最近一两个月,不少哔哩哔哩(B站)用户发现,各种大模型使用教程视频越来越多了,智谱、Kimi Chat、文心一言、通义千问……业内人士表示,头部大模型厂商几乎已全部入局,仅在B站,品牌方的广告投入就是去年的3-4倍。4月底,在发布日日新大模型5.0版后,商汤科技的股价一度上涨超过30%,当周股价涨幅

香港人工智能产业迎来大利好

记者获悉,香港数码港正全速设立人工智能超算中心,设施首阶段将于年底前投入服务。香港数码港于10月7日宣布相关算力资助详情,并于即日起接受申请。企业获机构善用算力最高可获九成资助。  为促进香港人工智能生态圈的发展,香港特区政府2024-25年度《财政预算案》拨款30亿港元予香港数码港,推行为期三年的

研究提出未来医学人工智能模型演进与关键技术

  近日,清华大学黄天荫教授、马维英教授、李京山教授等联合国内外其他研究团队在NEJM AI上发表研究文章,围绕医学人工智能模型的演进方向和关键技术展开讨论,提出了通用医学人工智能(UMAI)和通用健康人工智能(UHAI)的概念,并总结了其中的关键挑战和技术路径。  两个新的医学人工智能范式  医学

研究提出未来医学人工智能模型演进与关键技术

近日,清华大学黄天荫教授、马维英教授、李京山教授等联合国内外其他研究团队在NEJM AI上发表研究文章,围绕医学人工智能模型的演进方向和关键技术展开讨论,提出了通用医学人工智能(UMAI)和通用健康人工智能(UHAI)的概念,并总结了其中的关键挑战和技术路径。两个新的医学人工智能范式医学人工智能作为

“大”以致用,百度开放文心大模型助阵AI大赛

4月16日,2021百度认知AI创意赛“AI创意派”决赛在京举行(含线上)。在本期赛事中,百度开放了文心大模型中的知识增强百亿参数大模型ERNIE 3.0的能力,选手可以近距离感受人工智能(AI)预训练大模型(以下简称大模型)的魅力,并基于对ERNIE技术能力的理解产生全新的应用。这是业内首次将先进

中国首个海洋领域开源大模型OceanGPT正式发布

近日,中国首个海洋领域开源大模型OceanGPT(沧渊)在杭州正式发布。该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制,相较现有通用大模型能有效降低幻觉式

生成式AI时代,大模型数据安全如何保障?

在生成式AI(人工智能)时代,数据安全的出路可能会是“用魔法打败魔法”,知识产权保护也可能要提前到token(字符串)层面。4月26日,在2024中关村论坛上,人工智能企业与学者就AI大模型的数据安全问题进行了讨论。中关村论坛数据安全治理与发展论坛现场  澎湃新闻记者 秦盛 摄“在生成式人工智能时代

新型AI芯片将大语言模型能耗减半

  美国俄勒冈州立大学科研团队研发出一种新型AI芯片,成功将大语言模型的能耗降低50%。这项成果于近期在波士顿举行的IEEE定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的“绿色钥匙”。  当前,以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,因海量参

快手“可灵”大模型发布图生视频功能

  6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。  上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。  此

顶流AI大模型集结中关村科学城

  6月14日上午,2024北京智源大会在中关村国家自主创新示范区展示中心开幕,大会现场具身智能机器人Galbot和国内主流大模型展览区备受关注。  在展览区,记者看到银河通用首代具身智能机器人Galbot正忙着为嘉宾“送吃送喝”。收到指令后,Galbot自主导航到货架,通过“视觉”锁定货架上的目标

推动大模型从通用到产业化应用

  “大模型让机器在处理数据时,具有处理数据(文本)中所包含的人类知识的能力,这将给产业带来巨大的影响。”在近日召开的京东全球科技探索者大会上,中国科学院院士、清华大学人工智能研究院名誉院长张钹表示,有了大模型之后,机器完成特定任务的质量会提高很多。  “人工智能的发展与人才培养有异曲同工之处。”京

谁是最会做题大模型?“高考评测”来了

2024年全国高考的“硝烟”刚刚散去不久,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国内最权威的考试之一,高考覆盖各类学科及题型,同时在开考前属于“绝密”,非常适合用来作为考查大模型智能水平

“达尔文”大模型发布-为生物领域打造AI大脑

7月4日,赛灵力联合清华珠三角研究院、赛业生物、大湾区科创中心共同举办达尔文大模型发布会。达尔文大模型基于多元、多模态复杂数据和先进的人工智能技术,对生物领域的复杂系统建模和分析进行深入研究,为生物学产业、研究和应用发展提供有力支撑。达尔文提出进化论,阐述物种进化的基本原理,即适者生存。对应的,达尔

医药大模型:复刻生理功能-评估药物反应

原文地址:http://news.sciencenet.cn/htmlnews/2023/10/509878.shtm

阿里云推出首个域名AI大模型应用

8月8日,在阿里云万网焕新发布会上,阿里云宣布域名产品服务完成AI化系列改造,推出首个基于通义大模型的域名AI应用,并上线“.ai”等40余个全新的热门域名后缀、2000万个全球域名资源。域名是网站的地址,它就像现实生活中的门牌号,是互联网稳定运行和持续发展的关键基础资源。数据显示,中国域名保有量3

全力发展!锻造国产大模型核心竞争力

  截至今年7月底,我国累计有130个人工智能大模型问世,其中,仅今年前7个月就有64个大模型发布。不久前,首批通过《生成式人工智能服务管理暂行办法》备案的11个大模型产品获批向全社会开放服务,引发关注。大模型进入高速发展期。当前,一个重要问题是如何统筹创新发展与安全应用,推动生成式人工智能高质量发

新引擎实现大语言模型推理速度显著提升

原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm

如何规避安全风险?大模型安全评估框架发布

  当前,ChatGPT 正在引领人类进入无缝人机交互的新时代。相关业内人士指出,大规模语言模型(以下简称大模型)在新一轮快速发展同时,场景应用也暴露出一些问题,如事实性错误、知识盲区和常识偏差等。此外,大模型还面临训练数据来源合规性、数据使用的偏见性、生成内容的安全性等风险。  “要规避安全风险,

快手“可灵”大模型发布图生视频功能

6月21日,快手的视频生成大模型“可灵”再进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事。上传经典油画《蒙娜丽莎》,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流,让名画中的人物活灵活现——这正是可灵图生视频功能的生动实践。给自己戴上墨镜

顶流AI大模型集结中关村科学城

  6月14日上午,2024北京智源大会在中关村国家自主创新示范区展示中心开幕,大会现场具身智能机器人Galbot和国内主流大模型展览区备受关注。  在展览区,记者看到银河通用首代具身智能机器人Galbot正忙着为嘉宾“送吃送喝”。收到指令后,Galbot自主导航到货架,通过“视觉”锁定货架上的目标

国内首个纯自研视频大模型开放使用

7月30日,曾在今年中关村论坛期间亮相发布的首个国产纯自研视频大模型Vidu宣布在全球范围内上线,向公众提供服务,其开放了文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。据了解,Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一

上海发布“书生·浦语”大模型:评测表现优秀

“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集,对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试。6月7日,上海人工智能实验室(上海AI实验室)、商汤科技联合香港中文

紧跟形势!云从科技“从容大模型”亮相

原文地址:http://news.sciencenet.cn/htmlnews/2023/5/500910.shtm5月18日,云从科技在广州举行AI赋能数字中国产业论坛暨2023云从科技人机协同发布会。会上,云从科技董事长兼总经理周曦展示了最新的人机协同操作系统,并宣布云从科技“从容大模型”正式亮

刘聪:中国AI大模型也要走“直道冲锋”之路

原文地址:http://news.sciencenet.cn/htmlnews/2023/4/498384.shtm