直接生成16秒高清视频 我国自研视频大模型在京发布
新华社北京4月27日电(记者魏梦佳)只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

图片来源于网络,如有侵权,请联系删除
记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。
清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。
在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。
“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。
此外,Vidu还可生成如熊猫、龙等形象。
据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。
【责任编辑:王頔】
阅读下一篇:
扫描二维码推送至手机访问。
版权声明:本文由发布,如需转载请注明出处。
“直接生成16秒高清视频 我国自研视频大模型在京发布” 的相关文章
今年政府工作报告提出,“深化产学研用结合”“制定促进科技成果转化应用的政策举措”。记者采访获悉,针对产学研合作中的痛点,各方正积极探索专业科创服务经理人、校企人才联合培养、成果收益约定等新机制新模式。业内人士表示,未来还需要进一步加强合作模式创新,打通科技成果转化“梗阻”。图片来源于网络,如有侵...
时尚秀场不止在北上广,也可以在家乡的雪山边、城墙旁、古城里。4月11日,淘宝联合新华网发起“家乡时装周”活动,以许昌、天水、漳州、康定等11个独具特色的城市为支点,用服饰穿搭展现当地风土人情,鼓励大家穿出家乡的时尚风格。图片来源于网络,如有侵权,请联系删除 许昌战国袍、榆林山系户外风、晋中新中...
针对美国近期将六家中国企业列入出口管制“实体清单”,商务部新闻发言人何亚东11日在例行新闻发布会上回应称,中方注意到有关情况。一段时间以来,美方以所谓涉俄、涉军等为由,接连将中国企业列入出口管制“实体清单”。美方泛化国家安全概念,滥用出口管制措施,对中国企业肆意实施单边制裁和“长臂管辖”。这是典...
新华社武汉4月18日电(记者侯文坤)据中国科学院武汉植物园消息,我国科研人员在湖北省竹溪县发现一种铁线莲属植物新物种,经过仔细比对及核查,确认其为新物种狐尾铁线莲。相关研究成果日前发表在国际学术期刊《芬兰植物学报》上。图片来源于网络,如有侵权,请联系删除 中国科学院武汉植物园科研人员介绍,铁线...
7月26日,一场全球顶级的体育盛事将开启。随着移动互联网高速发展,大众纷纷借助短视频和直播等,表达着对于这场牵动心弦赛事到来的热切期盼。图片来源于网络,如有侵权,请联系删除 对于互联网平台来说,在强调信息和流量的新营销环境中,如何借助热点话题,更好助力品牌触达用户,成为连接品牌和消费者之间的“...
4月27日,爱因斯坦探针卫星首批在轨科学探测图像在京发布。图片来源于网络,如有侵权,请联系删除 爱因斯坦探针卫星是中国科学院牵头研制的一颗空间科学卫星,于2024年1月发射升空,主要用于观测宇宙中的剧烈爆发现象,捕捉这些转瞬即逝的宇宙“焰火”,因主要科学目标涉及黑洞、引力波等爱因斯坦相对论的重...