2024-02-16 Sora可生成60秒一镜到底视频
卷疯了,当Runway, Pika等AI视频工具,都还在突破几秒视频的连贯性时,而发布ChatGPT的那个OpenAI,突然又发布了首款文生视频模型——Sora,却已经达到了史诗级的纪录。它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且生成长达1分钟的超长视频,还是一镜到底那种。简单来说就是,AI视频要变天了!
OpenAI发布视屏生成工具Sora
60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。
OpenAI究竟是怎么做到的?根据官网介绍,「通过一次性为模型提供多帧的预测,我们解决了一个具有挑战性的问题」。显然,这是一个王炸级技术有着革命般的意义,连Sam Altman都沉迷到不能自拔,国内的技术圈也已经炸锅了,这个世界果然如你所愿,技术才是第一生产力,从来不是房地产。
Sora根据提示生成的滑雪
借助于对语言的深刻理解,Sora能够准确地理解用户指令中所表达的需求,把握这些元素在现实OfsHV世界中的表现形式。因此,Sora创造出的角色,能够表达丰富的情感!它所制作出的复杂场景,不仅可以包括多个角色,还有特定的动作类型,以及对对象//www.czybx.com和背景的精确细节描绘。
Sora根据提示生成的怪兽公司
举例:雪后的东京熙熙攘攘。镜头穿过繁忙的街道,跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。
Sora根据Prompt提示生成的东京景色
再举例:一个华丽渲染的纸工艺品珊瑚礁海底世界,到处白熊资讯网都是五颜六色的鱼和海洋生物
Sora根据Prompt提示生成的纸工艺品的海洋世界
不过,当前的模型并不完美。它在模拟复杂场景的物理效果上可能会遇到难题,有时也难以准确理解特定情境下的因果关系。此外,模型在处理空间细节,如区分左右时可能会出错,也可能在描述随时间变化的事件白熊资讯网,如特定的摄影机动作轨迹时,表现不够精确。
好在,它还并不完美。否则,虚拟和现实的界白熊资讯网限,还能区分得清吗?但是无可否认的是,可怕的事实已经就在面前:一个已经能够理解和模拟现实世界的模型,也就意味着AGI已经不远了。
原文链接:https://openai.com/sora
译文链接:https://mp.weixin.qq.com/s/93z4Ta91yLv7PB1pnBM9mg
内容版权声明:除非注明原创否则皆为转载,再次转载请注明出处。