视频生成器Sora让人喜忧交加

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517690.shtm ?一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora可根据这一文本内容生成逼真视频(图为视频截图)。图片来源:Sora/OpenAI继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能(AI)模型——文本-视频程序Sora。这款工具可根据简单的文本描述,生成类似好莱坞电影般的逼真而又充满想象力的视频。英国《新科学家》杂志网站在2月17日的文章中指出,对Sora的到来,人们可能“既爱又怕”。不少科学家欢呼其到来,认为它将进一步推动技术进步。但也有人担心,Sora会被别有用心之人用来制造深度伪造视频,加剧错误和虚假信息的泛滥。两大技术孵化强大功能Sora日语意为“天空”,其背后的团队之所以选择这个名字,是因为它“让人联想到无限的创造......阅读全文

谷歌I/O大会提“AI”121次,发布十余项更新及新品

·本次开发者全程两个小时,谷歌CEO共提及“AI”121次,此次开发者大会,谷歌将搜索业务做了最彻底的AI改造,还更新升级了Gemini1.5Pro版本,同时推出Gemini1.5Flash轻量化小模型。此外,推出自称效果超过Sora的生成视频模型Veo。北京时间5月15日凌晨,谷歌年度开发者I/O

快手“可灵”大模型将开放图生视频功能

当前,随着国内企业的争相入局,国产文生视频大模型迈入加速发展阶段。记者从快手方面获悉,自上周四向国内用户开放邀测后,截至6月13日,快手旗下文生视频大模型“可灵”的排队申请人数已超7万人。值得关注的是,快手“可灵”目前开放的是文生视频功能,近日还将开放图生视频功能。相比文生视频,图生视频的方式可以减

硅谷押注,生成式AI火了,让你把简单文字变成图像视频

10月9日消息,最近几年兴起的所谓“生成式人工智能(generative AI)”正吸引硅谷科技巨头和风投机构的兴趣,这种AI可以依据少量词汇在几秒钟内生成与之相匹配的图像。分析师预计,这种技术将被广泛用于各行各业,并产生数万亿美元的经济价值。虽然这些计算机程序生成的图像并不完美,比如手上出现多余的

最快量子随机数生成器面世

  由沙特阿卜杜拉国王科技大学与阿卜杜勒·阿齐兹国王科技城科学家联合主导的研究团队,研发出迄今基于国际基准最快的量子随机数生成器(QRNG),其随机数生成速度超其他QRNG近千倍。这一突破将为医疗、金融、国防等依赖高等级数据安全的领域带来革命性变革。相关研究成果发表于新一期《光学快报》杂志。  研究

OpenAI正式发布GPT4

原文地址:http://news.sciencenet.cn/htmlnews/2024/1/515804.shtm (图片源自网络)3月15日,OpenAI发布了多模态预训练大模型GPT-4,这是其大型语言模型的最新版本。与此前的版本相比,GPT-4具备强大的识图能力,文字输入限制也提升至

69个小故事读懂人工智能的历史

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519515.shtm 《人工智能极简史》,张军平著,湖南科学技术出版社2023年10月出版,定价:68元■陈德旺最近一段时间,引人注目的新闻之一莫过于OpenAI推出的Sora,通过文本输入制作出一分钟时

Sora取名源自日语?日本加速布局AI产业

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517829.shtm

Sora带来的深层次影响值得关注

原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519503.shtm

Agilent-81140A串行脉冲数据生成器

主要优点•产生高达7 GHz和13.5 GHz的脉冲、数据模式和PRB•数据、时钟和触发器的差分输出•触发器和外部时钟输入•最快转换时间

我国将起草臭氧生成器行业标准

  日前,记者从中国家电研究院了解到,《家用和类似用途臭氧生成器》行业标准起草工作组已经成立,预示着我国将对臭氧生长器制定行业标准。这项标准预计将于2011年开始相关内容的讨论,2011年年底将通过审定向工信部上报报批稿。   随着居民对健康生活的追求,越来越多的家电产品带有臭氧杀菌功能,消毒柜、

燃料电池车“SORA”驶上日本街头

    东京街头行驶的燃料电池公交车采用丰田公司生产的燃料电池车“SORA”。该车售价1亿日元,其中国家补助5000万日元,地方政府补助3000万日元,实际用户只需支付2000万日元。目前,东京都政府运营的燃料电池公交车共计70辆,在5个公交营业所投入运营。日本政府计划至2030年,全国保有1227

OpenAI发布语音模型GPTrealtime

8月28日,美国人工智能公司OpenAI发布了其所谓“最先进的语音到语音模型”GPT-realtime,以及配套的Realtime API(实时应用程序接口)。据OpenAI公司介绍,该模型在理解复杂指令、精准调用工具以及生成自然、富有表现力的语音方面表现突出,并在客户服务、教育、个人助理等多种场景

中国工程院发布2024全球十大工程成就

12月18日,由中国工程院院刊《Engineering》评选的 “2024全球十大工程成就”在京发布。中国工程院秘书长、《Engineering》执行主编陈建峰院士公布评选结果。《Engineering》肩负着促进工程科技进步、引领工程科技创新、弘扬工程科技精神的使命。从2021年开始,每年组织开展

大模型又整活,照片也能唱歌说话

文 | 《中国科学报》记者 赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马俑,还有蒙娜丽莎、奥黛丽·赫本、孔子、鲁迅……只要一张照片和一段音频,他们就能开口说话、唱歌、

ChatGPT冲击波已来,高等教育应做好准备

近一段时间以来,一种全新的人工智能(AI)语言模型引起了高等教育界内外的广泛关注。它可以模仿人类语言进行对话,针对人类的问话生成符合人类表达的反应,由此形成的对话无论是内容还是形式均与人类之间的对话几无差异。这一语言模型就是被称为ChatGPT的聊天模型。 它的出现已经开始对全球的高等教育

南开新成果可让Sora核心组件训练提速10多倍

2024年伊始,人工智能大模型ChatGPT母公司Open AI发布首个人工智能文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车”视频中可以看出,AI仍然存在着无

让Sora提速10多倍,南开团队开源MDTv2

南开新闻网讯(记者 高雨桐)2024年伊始,Open AI(美国开放人工智能研究中心)公司发布首个AI(人工智能)文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车

“AIGC塑造数字内容生产新范式”沙龙举行

4月18日,由北京市科协主办的“AIGC塑造数字内容生产新范式”科学传播沙龙在北京举办。活动邀请相关专家学者、从业人员及教育机构代表在沙龙上发言,共同探讨人工智能数字内容生产的未来发展。天云融创数据科技(北京)有限公司CEO雷涛以Sora“世界模拟器”是否会带来新的科学革命维度发表演讲,现场展示了丰

Sora很惊艳,但“实现AGI”还言之过早

原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517680.shtm

OpenAI“语音引擎”可从15秒样本复制原声

科技日报北京4月1日电 (记者张梦然)据著名科技网站The Verge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(Voice Engine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。OpenAI称,该引擎自2022年底以来一直在开发中,实际已在Cha

OpenAI开发神秘项目“草莓”提升模型智能

·使用“草莓”模型的目的是使OpenAI的人工智能不仅能够生成查询答案,还能够提前做好充足计划,自主可靠地在互联网上导航,执行OpenAI所说的“深度研究”。推理是人工智能实现或超人类智能水平的关键。OpenAI正在开发代号为“草莓”(Strawberry)的新推理技术。据路透社当地时间7月12日报

OpenAI选择“闭源”,为何反而火了“开源”

原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514533.shtm

微软正将OpenAI-ChatGPT插件引入Windows-11

ChatGPT从其采集的数据中提取知识,最晚可以追溯到2021年9月--直到现在。有了插件的支持,ChatGPT现在可以访问互联网,像浏览器一样导航到网站,并真实地采集信息。OpenAI正在建立一个ChatGPT版本的应用商店,而微软现在正将这些插件带到Windows 11。ChatGPT插件将通过

邮件曝光-OpenAI正式回击马斯克

3月5日,OpenAI在官网发布博文称,公司的使命是确保AGI能够造福全人类,并驳斥了马斯克的所有指控。Open AI这篇博文公开披露OpenAI和马斯克的关系,并将马斯克与OpenAI三位重要创始人奥尔特曼(Sam Altman)、格雷格•布罗克曼(Greg Brockman)、以及伊尔亚•苏茨克

OpenAI打包新闻集团版权训练大模型

ChatGPT再扩容,这次将加入十余家媒体的新闻内容。当地时间5月22日,OpenAI宣布与新闻集团(News Corp)达成多年期协议,将获得主要新闻和信息出版物的当前和存档内容,包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。根据协议,OpenAI将能在ChatGP

OpenAI又地震:ChatGPT负责人离职

OpenAI内部仍动荡不安,ChatGPT的两位重要负责人选择离开。8月6日,AI(人工智能)巨头OpenAI联合创始人约翰·舒尔曼(John Schulman)在X(推特)发文表示,将离开OpenAI加入另一家AI初创公司Anthropic(OpenAI的竞争对手)。舒尔曼9年前在OpenAI成立

OpenAI推出高级语音模式,支持50多种语言

OpenAI正式推出的高级语音模式,已支持50多种语言交流,此外新增五种全新的语音风格供用户选择。值得注意的是,此次更新中并未包含名为“Sky”的语音风格。此前,该语音曾被指与女演员斯嘉丽·约翰逊声音高度相似。9月25日,OpenAI在X平台上宣布,将为ChatGPT的付费用户推出全新的高级语音模式

视频图形显示

中文名称视频图形显示英文名称videographic display定  义利用阴极射线管装置扫描标本的视频互动显示系统。应用学科细胞生物学(一级学科),细胞生物学技术(二级学科)

视频光端机简介

  视频光端机,就是把1到多路的模拟视频信号通过各种编码转换成光信号通过光纤介质来传输的设备,由于视频信号转换成光信号的过程中会通过模拟转换和数字转换两种技术,所以视频光端机又分为模拟光端机和数字光端机。光端机原理就是把信号调制到光上,通过光纤进行视频传输。

升级后的ChatGPT更加人性化

5月13日,OpenAI公布了最新的人工智能模型GPT-4o,该模型通过语音模式可以为ChatGPT提供更多类似人类的互动。升级后的ChatGPT能够实时进行包含文本、音频和视频的对话,同时说话时使用的语调和措辞还能传达出强烈的情感和个性。OpenAI的最新模型提供了更像人类的对话体验。图片来源:J