首页 景点排名文章正文

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

景点排名 2025年10月18日 16:16 0 aa

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!

编辑:香瓜

北京时间10月16日,就在Sora 2发布半个月后,谷歌火速推出了最新视频模型Veo 3.1和Veo 3.1 Fast,正面迎战OpenAI。

在官方推文中,谷歌称“Veo正在进行重大升级”,不过,从国内外各方实测来看,从Veo 3到Veo 3.1,确实如名字一样,只是进行了一次小的迭代,在画质、物理上的提升并不算大,在AI音频、自动分镜等方面都不如Sora 2,但Veo 3.1的光影效果更突出,生成速度更快。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

当OpenAI用Sora2的60秒1080P视频震撼行业时,谷歌突然亮出Veo3.1这张王牌——8秒720P自带音轨的生成能力看似保守,却暗藏杀机。科技媒体testingcatalog曝光的"火山喷发"与"赛博朋克"样本,为何与Sora2演示场景高度重合?这场对标背后,是两大巨头争夺AI视频时代标准制定权的生死局。

视频生成赛道,味道全变了。以往那种扔个词就等“开盲盒”的魔法秀时代,似乎正在被一场更激烈的巷战所取代。大家不再仅仅惊叹于AI能变出什么,而是开始掰着手指头计算,自己究竟能“控制”它到什么程度。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

过去,大家被OpenAI的Sora那长达60秒的一镜到底震撼,仿佛看到了一位全能导演。而现在,谷歌用Veo3.1给出了一份完全不同的答卷。它解决了前代模型里物体比例失调的尴尬问题,甚至还给生成的视频配上了原生音轨。这些看似细碎的更新,其实直指一个核心:夺取“创意控制权”。

两种玩法:拼积木还是开盲盒?

谷歌和OpenAI,像是在用两种截然不同的哲学来定义创作者与AI的关系。Veo3.1选择的路径是“组件化塑造”,把控制权像乐高积木一样,一块块交还给用户。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

想让一个画面动起来?没问题。你只需要提供一张开始的图片和一张结束的图片,Veo3.1就能自动生成中间丝滑的过渡动画。这种“首尾帧插值”功能,让用户从被动接受结果,变成了主动塑造过程。

它的控制力甚至深入到了像素层面。已经上线的“插入物体”功能,可以在现有场景里添加新元素,并且聪明地自动匹配光影,看起来毫无违和感。“移除物体”的功能也箭在弦上,即将推出。这几乎就是对象级别的精细编辑了。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

在视觉风格上,它同样给予了前所未有的权限。用户可以上传多达三张参考图片,让AI精准“抄作业”,确保生成内容符合特定的美学标准。对于企业用户来说,这意味着品牌的产品图片和视觉元素能够被高度一致地复现。

更狠的是,Veo3.1开放了用户上传人像照片来生成视频的能力,这可是Sora当前版本还不支持的功能。直接把具体的人物放进AI创造的世界,这控制力简直拉满了。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

而Sora走的,则是一条“整体性涌现”的路子。它更像是一位天才导演,你给他剧本(提示词),它给你一部完整的短片。它那长达60秒的生成能力,就是它最大的战略威慑,为需要完整叙事的长镜头提供了可能性。

在评测中,Sora被认为更擅长模拟那种充满动感的手持摄影运镜,能赋予画面一种独特的临场感。而在特定的美学领域,比如还原日式动画那种传统赛璐璐手绘的质感,Sora的表现也更胜一筹。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

这两种路径没有绝对的优劣。Veo3.1让你成为“剪辑师+特效师”,在创作的每一步都能精细干预。而Sora则让你更纯粹地扮演“导演”的角色,设定好框架,然后信任AI去发挥它的创造力。

钱包说话:谁能玩得起这场游戏?

对控制权的不同理解,直接催生了两种截然不同的商业模式,也决定了谁能在这场创作革命中拿到入场券。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

谷歌的策略非常明确,就是打造一个高价值的“围墙花园”。Veo3.1的定价直截了当:快速版每秒视频0.15美元,标准版每秒0.40美元,而且没有提供任何免费额度。这基本就是明说了,我的目标是那些愿意为专业工具付费的B端企业市场。

为了把这些高价值用户牢牢锁住,谷歌将Veo3.1深度集成到了自家的VertexAI云平台和GoogleVids应用中。这种云服务加创作工具的捆绑包,意图将技术优势迅速变现为稳定的订阅收入。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

OpenAI则更像是在办一场盛大的“广场派对”。在测试阶段,Sora提供了免费且无限制的生成服务。这背后的逻辑是典型的互联网玩法:用免费换取海量用户和宝贵的训练数据,快速建立起生态壁垒。它底层对微软Azure云服务的依赖,也让它的生态模式更加开放和灵活,用户的迁移成本相对较低。

不过,无论谷歌的Flow平台(Veo3.1的前身)此前积累了超过2.75亿个视频,还是Sora现在掀起的用户热潮,都像两座大山,压得中小型AI视频公司喘不过气来。有机构数据显示,行业内天使轮的融资量同比骤降了67%。巨头的价格战和生态战,正在无情地挤压着创业公司的生存空间。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

当然,这场军备竞赛也并非全是坏事。像GoogleVids这类低门槛工具的出现,客观上也让电商卖家、教师这类非专业人士获得了前所未有的视频创作能力,某种程度上实现了“视频自由”。

AI的瓶颈:导演终究还是人

尽管控制权被提到了前所未有的高度,但在AI视频的深层逻辑上,所有模型都触碰到了同一块天花板。那就是叙事的“思维链”瓶颈。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

即便是最新的Veo3.1,基础的生成时长上限也只有8秒,这让不少早期用户感到失望。虽然它可以通过延伸功能,将一个镜头拉长到惊人的148秒,但这本质上是基于前一片段的最后一秒进行“续写”,而非真正具备长时程的规划能力。

所有模型普遍存在一个共性问题,生成内容一旦超过10秒左右,就可能出现逻辑不连贯的“断片”现象。AI仍然缺乏真正理解复杂叙事的能力。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

用户的实测也暴露了这一点。在尝试让Veo3.1复现特定的舞蹈动作时,模型会莫名其妙地丢失某些动作细节,就像一个记性不好的学生。在需要保持角色多角度形象一致性时,也需要用户编写极其复杂的提示词才能勉强实现。

这恰恰重新定义了人类创作者的价值。AI的高效确实带来了冲击,比如一个10人团队能在45天内完成一部50集的漫剧。但这并不意味着人类被淘汰了,反而对创作者提出了更高的要求。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

如今,一个优秀的创作者,必须是一个出色的“提示词工程师”,懂得如何与AI沟通,并具备最终的审美决断力。

结语

AI视频的竞赛,走到今天已经不再是谁能生成更长、更清晰的视频那么简单了。真正的战场,在于如何定义人与AI的协作关系。

谷歌Veo3.1绝杀Sora2?视频AI领域迎来决战,谁能笑到最后?

是像谷歌Veo3.1那样,提供一套精密的工具箱,让创作者深度介入每一个细节?还是像OpenAISora那样,打造一个富有灵感的艺术家,让创作者只需提出宏大构想?

这场博弈没有终局,因为它最终塑造的,将是一种全新的创作范式。在这个范式里,人类提供创意的蓝图、情感的核心和关键的决策,而AI,则作为那个最高效、最听话的执行者。最好的工具,终究会像一台顺手的摄影机,成为创作者身体的延伸,而不是替代他们的大脑。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap