Sora 2能否还原人们做导演的梦?

Sora 2引爆AI视频革命:狂欢之下的真实与距离国庆假期,一枚来自OpenAI的“技术核弹”让全球AI圈瞬间沸腾——新一代AI视频模型Sora 2及其配套应用Sora App正式亮相。即便采用严格的邀请码注册机制,网友的热情依旧挡不住,社交平台上满是求邀的呼声。上线仅四天,这款App便强势登顶美区App Store免费榜榜首,将ChatGPT、Google Gemini等头部AI产品甩在身后,迅速成为海外创作者、内容营销人和TikTok卖家的新宠。 社交网络随即被Sora 2构建的“AI同人宇宙”席卷:动漫角色穿梭于现实街头,游戏人物漫步在都市楼宇,就连OpenAI CEO山姆·奥尔特曼(Sam Altman)也被网友玩出新花样——他时而现身东北炕头吃饭,时而在阿里会议室畅谈“闭环”“赋能”,甚至化身外卖骑手穿梭于城市街巷。这些充满想象力的创作,直观展现了Sora 2的强大生成能力。 奥尔特曼将Sora 2誉为“创意领域的ChatGPT 3.5时刻”,这一评价并非夸张。从官方演示到用户实测,Sora 2在物理逻辑、画面连贯性、真实感和音画同步等核心维度实现了跨越式突破,多家媒体直言其“将AI视频生成推向新高度”。不过DoNews在深度体验后指出,尽管Sora 2实力强悍,但距离“现实不存在了”的终极预言,仍有明显差距。 一、创造力迸发:亮点与瑕疵并存Sora App以Sora 2为技术核心,最大突破在于内置了对话、音效与背景音乐的自动生成能力,彻底改变了传统AI视频工具“哑剧式”生成的局限,实现了音视频同步创作的完整闭环。 打开App,底部功能栏的「视频推荐」「灵感广场」「生成器」「消息」「个人主页」一目了然,垂直滑动的视频流设计让不少人直呼“AI版抖音”。其中“灵感广场”堪称创作捷径:热门作品的提示词会自动成为视频配文,用户可直接复制修改后复用,极大降低了创作门槛。 作为核心的“生成器”功能区,有两个鲜明特点:一是纯AI生成模式,不支持上传用户自制素材;二是文案与提示词合一,输入的文字直接指导视频生成。创作方式上,“图片生成视频”和“Cameo出镜秀”最为亮眼。Cameo作为用户的专属虚拟身份标识,只需录制一段脸部视频完成类似银行App的认证流程,就能生成可复用的虚拟形象。更具社交属性的是,用户可使用他人公开的虚拟形象创作,撰写提示词时点击头像即可自动填入ID,发布时系统会自动@形象所有者,形成独特的创作互动生态。 DoNews的实测颇具代表性:以奥尔特曼的虚拟形象和一张店铺图片生成视频,提示词仅为“@sama在图片场景里说集美们,耶斯莫拉”,Sora 2便自动补充台词“集美们,今天带大家来看看老姐妹的店,耶斯莫拉”,不仅与场景适配自然,口型也基本对齐,展现出强大的语境联想能力。但细节短板同样明显:生成奥尔特曼剥猕猴桃的视频时,物体交互出现明显错误;制作双人清宫吵架视频时,虽能自动生成符合场景的台词,却频繁出现台词与口型错位的问题,且多角色场景中这类瑕疵概率更高。 整体而言,Sora 2对物理世界的理解已相当出色,数字人物理效果与唇形同步基本达标,但多元素交互时的bug、生硬的AI配音以及提示词构思门槛,仍让作品带着挥之不去的“AI感”。二、理想与现实:距离革命尚有差距OpenAI在声明中明确将Sora 2定位为“最先进的视频和音频生成模型”,并类比称初代Sora是视频领域的“GPT-1时刻”,而Sora 2已迈入“GPT-3.5时刻”。从技术突破来看,其音画同步、虚拟形象复用、多镜头叙事等能力确实刷新了行业上限,但距离“重塑创意领域”和“成为新一代娱乐社交平台”,仍显力有不逮。 小旭音乐创始人、AIGC艺术家小旭的评价精准点出其核心优势:“Sora 2生成的音频真实感、清晰度远超同类工具,甚至略胜谷歌Veo 3一筹。”这种优势源于极致的易用性——复杂的视频创作被简化为“输入提示词+选形象”,尤其是Cameo功能,让普通用户仅凭几秒人脸视频就能拥有专属虚拟形象,彻底打破了专业创作的技术壁垒。 但硬伤同样突出。首先是创作限制:视频时长仅10秒,远不能满足正规创作需求;分辨率默认仅360P或480P且无法调节,横版视频还需依赖PC端生成。其次是社交属性不足,用户车车直言其娱乐性“远不如抖音”:“内容多是围绕个人虚拟形象的自娱自乐,没有话题挑战、达人生态,缺乏共鸣点,刷几条就腻了”。 更深层的制约来自版权风控。为规避风险,Sora 2会直接拦截多数真实名人、影视角色的生成请求——提及《后宫甄嬛传》的创作指令便被系统拒绝,这极大压缩了题材空间,难以产出多样化的传播级内容。反观抖音,从生活记录到创意短剧的宽泛内容边界,配合评论、合拍、话题榜等功能,构建了Sora 2目前无法企及的社交粘性。结语:技术新星的当下与未来不可否认,Sora 2是AI视频领域的一次里程碑式飞跃。它将分散的音视频生成流程整合归一,以极低门槛让普通用户体验到“人人做导演”的乐趣,这种变革性体验正是其引爆市场的核心原因。 但有限的画质与时长、同质化的内容倾向、未解决的技术瑕疵,都让它难以立刻承担“创意革命引爆者”的角色。对普通用户而言,它是新鲜有趣的创作玩具;对专业创作者来说,它还不是可靠的生产力工具。OpenAI这枚“炸场”新星,优点与缺点同样鲜明。 正如Sora 2从初代的“GPT-1时刻”进化而来,这场AI视频革命或许才刚刚拉开序幕。它的真正成熟,或许正等待着下一次迭代的突破,而其引发的技术竞赛与行业思考,已为全球AI产业指明了新的方向。