这几天忙着运营商“笔算培训”,剩下点时间还想把小米17的线下调研尽快完成,再拖下去,就成了烂尾工程,所以,实在没有精力去做X300的调研。但是没想到关...
2025-10-18 0
编辑:香瓜
北京时间10月16日,就在Sora 2发布半个月后,谷歌火速推出了最新视频模型Veo 3.1和Veo 3.1 Fast,正面迎战OpenAI。
在官方推文中,谷歌称“Veo正在进行重大升级”,不过,从国内外各方实测来看,从Veo 3到Veo 3.1,确实如名字一样,只是进行了一次小的迭代,在画质、物理上的提升并不算大,在AI音频、自动分镜等方面都不如Sora 2,但Veo 3.1的光影效果更突出,生成速度更快。
当OpenAI用Sora2的60秒1080P视频震撼行业时,谷歌突然亮出Veo3.1这张王牌——8秒720P自带音轨的生成能力看似保守,却暗藏杀机。科技媒体testingcatalog曝光的"火山喷发"与"赛博朋克"样本,为何与Sora2演示场景高度重合?这场对标背后,是两大巨头争夺AI视频时代标准制定权的生死局。
视频生成赛道,味道全变了。以往那种扔个词就等“开盲盒”的魔法秀时代,似乎正在被一场更激烈的巷战所取代。大家不再仅仅惊叹于AI能变出什么,而是开始掰着手指头计算,自己究竟能“控制”它到什么程度。
过去,大家被OpenAI的Sora那长达60秒的一镜到底震撼,仿佛看到了一位全能导演。而现在,谷歌用Veo3.1给出了一份完全不同的答卷。它解决了前代模型里物体比例失调的尴尬问题,甚至还给生成的视频配上了原生音轨。这些看似细碎的更新,其实直指一个核心:夺取“创意控制权”。
谷歌和OpenAI,像是在用两种截然不同的哲学来定义创作者与AI的关系。Veo3.1选择的路径是“组件化塑造”,把控制权像乐高积木一样,一块块交还给用户。
想让一个画面动起来?没问题。你只需要提供一张开始的图片和一张结束的图片,Veo3.1就能自动生成中间丝滑的过渡动画。这种“首尾帧插值”功能,让用户从被动接受结果,变成了主动塑造过程。
它的控制力甚至深入到了像素层面。已经上线的“插入物体”功能,可以在现有场景里添加新元素,并且聪明地自动匹配光影,看起来毫无违和感。“移除物体”的功能也箭在弦上,即将推出。这几乎就是对象级别的精细编辑了。
在视觉风格上,它同样给予了前所未有的权限。用户可以上传多达三张参考图片,让AI精准“抄作业”,确保生成内容符合特定的美学标准。对于企业用户来说,这意味着品牌的产品图片和视觉元素能够被高度一致地复现。
更狠的是,Veo3.1开放了用户上传人像照片来生成视频的能力,这可是Sora当前版本还不支持的功能。直接把具体的人物放进AI创造的世界,这控制力简直拉满了。
而Sora走的,则是一条“整体性涌现”的路子。它更像是一位天才导演,你给他剧本(提示词),它给你一部完整的短片。它那长达60秒的生成能力,就是它最大的战略威慑,为需要完整叙事的长镜头提供了可能性。
在评测中,Sora被认为更擅长模拟那种充满动感的手持摄影运镜,能赋予画面一种独特的临场感。而在特定的美学领域,比如还原日式动画那种传统赛璐璐手绘的质感,Sora的表现也更胜一筹。
这两种路径没有绝对的优劣。Veo3.1让你成为“剪辑师+特效师”,在创作的每一步都能精细干预。而Sora则让你更纯粹地扮演“导演”的角色,设定好框架,然后信任AI去发挥它的创造力。
对控制权的不同理解,直接催生了两种截然不同的商业模式,也决定了谁能在这场创作革命中拿到入场券。
谷歌的策略非常明确,就是打造一个高价值的“围墙花园”。Veo3.1的定价直截了当:快速版每秒视频0.15美元,标准版每秒0.40美元,而且没有提供任何免费额度。这基本就是明说了,我的目标是那些愿意为专业工具付费的B端企业市场。
为了把这些高价值用户牢牢锁住,谷歌将Veo3.1深度集成到了自家的VertexAI云平台和GoogleVids应用中。这种云服务加创作工具的捆绑包,意图将技术优势迅速变现为稳定的订阅收入。
OpenAI则更像是在办一场盛大的“广场派对”。在测试阶段,Sora提供了免费且无限制的生成服务。这背后的逻辑是典型的互联网玩法:用免费换取海量用户和宝贵的训练数据,快速建立起生态壁垒。它底层对微软Azure云服务的依赖,也让它的生态模式更加开放和灵活,用户的迁移成本相对较低。
不过,无论谷歌的Flow平台(Veo3.1的前身)此前积累了超过2.75亿个视频,还是Sora现在掀起的用户热潮,都像两座大山,压得中小型AI视频公司喘不过气来。有机构数据显示,行业内天使轮的融资量同比骤降了67%。巨头的价格战和生态战,正在无情地挤压着创业公司的生存空间。
当然,这场军备竞赛也并非全是坏事。像GoogleVids这类低门槛工具的出现,客观上也让电商卖家、教师这类非专业人士获得了前所未有的视频创作能力,某种程度上实现了“视频自由”。
尽管控制权被提到了前所未有的高度,但在AI视频的深层逻辑上,所有模型都触碰到了同一块天花板。那就是叙事的“思维链”瓶颈。
即便是最新的Veo3.1,基础的生成时长上限也只有8秒,这让不少早期用户感到失望。虽然它可以通过延伸功能,将一个镜头拉长到惊人的148秒,但这本质上是基于前一片段的最后一秒进行“续写”,而非真正具备长时程的规划能力。
所有模型普遍存在一个共性问题,生成内容一旦超过10秒左右,就可能出现逻辑不连贯的“断片”现象。AI仍然缺乏真正理解复杂叙事的能力。
用户的实测也暴露了这一点。在尝试让Veo3.1复现特定的舞蹈动作时,模型会莫名其妙地丢失某些动作细节,就像一个记性不好的学生。在需要保持角色多角度形象一致性时,也需要用户编写极其复杂的提示词才能勉强实现。
这恰恰重新定义了人类创作者的价值。AI的高效确实带来了冲击,比如一个10人团队能在45天内完成一部50集的漫剧。但这并不意味着人类被淘汰了,反而对创作者提出了更高的要求。
如今,一个优秀的创作者,必须是一个出色的“提示词工程师”,懂得如何与AI沟通,并具备最终的审美决断力。
AI视频的竞赛,走到今天已经不再是谁能生成更长、更清晰的视频那么简单了。真正的战场,在于如何定义人与AI的协作关系。
是像谷歌Veo3.1那样,提供一套精密的工具箱,让创作者深度介入每一个细节?还是像OpenAISora那样,打造一个富有灵感的艺术家,让创作者只需提出宏大构想?
这场博弈没有终局,因为它最终塑造的,将是一种全新的创作范式。在这个范式里,人类提供创意的蓝图、情感的核心和关键的决策,而AI,则作为那个最高效、最听话的执行者。最好的工具,终究会像一台顺手的摄影机,成为创作者身体的延伸,而不是替代他们的大脑。
相关文章
这几天忙着运营商“笔算培训”,剩下点时间还想把小米17的线下调研尽快完成,再拖下去,就成了烂尾工程,所以,实在没有精力去做X300的调研。但是没想到关...
2025-10-18 0
在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:香瓜北京时间10月16日,就在Sora...
2025-10-18 0
不得不说,今年荣耀在系统方面是诚意十足,虽然10月15号,MagicOS10才正式发布,但是当天晚上就有大量机型可以直接适配。不但有荣耀Magic7系...
2025-10-18 0
激光振镜控制系统产业链上游为其提供基础材料和电子元件,中游专注于系统的研发生产,下游则是广泛的应用领域。目前,上游部分材料依赖进口,中游高端市场外资占...
2025-10-18 0
如果你手握2000元左右的预算,想换一台新手机,最看重什么?对于许多小伙伴来说,答案一定是:拍照。然而,这个价位段的手机市场,往往充满了妥协。要么后置...
2025-10-18 0
文/窦文雪 编辑/子夜每一年的年底,国产手机厂商们之间都会上演一场有关年度旗舰机的较量。 vivo无疑是每年最受关注的“选手”之一,近几年,vivo常...
2025-10-18 0
2024年,一则消息震惊科技圈与汽车圈:苹果正式叫停已持续十年的造车项目“泰坦计划”,将所有资源转向生成式AI。这个曾立志打造“颠覆汽车行业”的项目,...
2025-10-18 0
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-10-18 7
发表评论