![]()
来源:南风创 作者:融智汇 百度创始人李彦宏在内部演讲中表示,像Sora这样的大型AI视频模型的投资周期太长,10年、20年可能没有商业效益。再流行,百度也不会做。这是 2024 年 10 月,即创建 ChatGPT 的 Open AI 公司推出 Vincent 视频应用程序 Sora 七个月后。今年情况非常不同。 9月30日,《空2》正式发售。仅仅14天后,百度就高调推广“百度蒸汽引擎”视频模式,与谷歌的VEO 3.1发生冲突,急于“秀肌肉”。 《空》问世时一片寂静,《空2》诞生后,所有参赛者都渴望与《空2》竞争,唯恐失去风头。中国视频的应用从沉默走向热议,李彦宏的“悔罪”被视为“一记耳光”。这些变化中,大厂到底隐藏着什么秘密?沉默虽然在李彦宏表示“百度不会这么做”的几个月后,百度开始加大对AI视频的投入,李彦宏的表态直指行业普遍的焦虑情绪。这种焦虑直接导致了Sora上市时中国各大厂商的“彻底沉默”。咱们就来说说2024年2月吧,Sora一出来,就成为了AI张开手中的王牌应用。与其他“模拟现实”的应用不同,Sora达到了“构建现实”的程度:两者的区别在于,前者只能模拟现实世界的面貌,而后者则可以按照现实的规则在数字世界中重构“现实”。例如,现实中,当我们咬一口苹果时,苹果上就会留下牙痕。 Sora 创建的视频可以重现这个细节,因为它遵循力的力量和力的接收的基本物理规则。细节是真实的基础,视频和图像需要重新审视细节主义。当时,没有其他 Vincent Video 应用程序可以做到这一点。在Sora之前,国内各大厂商也纷纷布局文森视频领域。 2023年底,百度将发布文胜视频工具“杜加剪辑”,可以捕捉最新热点话题,人工智能生成文案,一键生成视频。 ByTedance推出了类似的模型,称为Pixel Dance,阿里巴巴也推出了动画模型。然而,Sora一问世,中国主要厂商就避而远之,有的企业坚决否认自己的产品相当于“中国版Sora”。当时,主要厂商布局的重点并不在文森视频领域。他们的首要任务不是制作中国版的Sora,而是赶上GPT-4。来源:Pexels 由于当时中国的大人工智能模式距离 GPT 还很远,自然更迫切的是搞“基础设施”而不是“上层建筑”。作为人某大厂商业模式负责人曾无奈地表示,“在Chatgpt之前,大家也都有聊天机器人……关键是有没有达到那个水平。”中国主要厂商焦虑的主要原因是自家的大模型与来自开放AI和谷歌的全球领先大模型之间存在巨大差距。如果大模型的能力有限,谈论文森特视频模型确实是一种奢侈。不过,随着2025年初“质优价廉”的Deepseek机型的推出,中国主力厂商的焦虑已经彻底打消了。今年大家也看到了,主力大机型的竞争非常迅速,甚至“价格战”也已经结束。没有视频模型的人肯定会质疑大模型动力不足。截至2025年10月,中国市场已有20余种主要视频模型产品,阿里巴巴、腾讯、字节跳动、百度等均有涉足。在海外市场、广告领域除了pAI黎明之外,Google、Meta等巨头,以及Runway、Luma AI、Midjourney等初创公司都在同一个舞台上竞争。一位大型模型从业者告诉南风之窗,大型模型基础信息处理能力的提升和成本的降低,让豆宝、统一、文心等众多大型模型实现了快速增长。深度推理能力、视觉推理能力以及智能体相关技术将是未来几年主要大型模型竞争的关键。因此,根据目前的情况,也不难理解李彦宏后悔“没有做AI视频应用”并主动放弃大规模Multi-Modal模型。从文信大模4.5到4.5 Turbo,从文信大模X1到X1 Turbo,百度车型性能提升的同时,多模态能力也进一步提升,“百度蒸汽机”的推出也符合逻辑。 4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上发表题为《模型的世界与应用的世界》的演讲/来源:新华网 从技术角度看,Sora 2、Veo3.1等各大模型的视频模型正在向两个主要方向演进。一方面,视频的质量会不断提高——画面更加真实,对单词的即时理解更加准确;另一方面,用户的编辑能力得到了加强——从一般生成到局部修改、对象添加和删除,操作更加精细,翼链的感觉更加强烈。更重要的是,音频是实时生成的,完全填补了以往AI视频工具只能制作“无声电影”的缺陷。测试“一流”人工智能视频生成应用程序与测试聊天机器人非常相似。近日,不少网友纷纷测试通过“同题测试”的方式测试了Sora 2和VEO3.1的能力,最终发现两家公司的训练模型和逻辑不同:Google强调物理世界的规则,而Open AI更注重娱乐。这也意味着各家企业依靠自身特点和禀赋打造“风格化”的AI应用。 AI视频应用正在从“大爆炸”走向精细化、成熟化的时代。力争成为大平台,一旦大机型的能力赶上,“李彦宏的遗憾”就变成了一个更“现实”的问题:如何降低AI视频应用的成本,找到商业化前景? 《Sora 2》的玩法只是给变现行业带来了希望。首先是降低成本和提高可用性。 Open AI 发布的样本视频中,一名花样滑冰运动员表演猫头鹰三圈半动作,一名业余选手跌倒在冲浪板上溅起水花水花,男孩和小狗在风中奔跑,宫崎骏动画风格…… Open AI 官网发布的样本,花样滑冰运动员头上顶着猫做三轴动作 Open AI 官网发布的样本,业余爱好者摔在冲浪板上,溅起水花 Open AI 官网发布的样本,男孩和小狗在空中奔跑,动画风格 宫崎骏.尽管实际的用户生成视频与这些伟大的例子还有一定差距,但观众也看到了利用人工智能讲述伟大故事的可能性。对于用户来说,过去他们尝试写快速的文字并生成5秒的视频,但最终只有0.5秒的时间。现在他们可以直接生成由复杂镜头组成的影片剪辑,几乎不需要进行大的改动。与此同时,AI演员也跃跃欲试,准备替代真人演员。蒂莉·诺伍德 (Tilly Norwood),人工智能演员9月底在苏黎世电影节上走红,据说是受到好莱坞经纪公司的邀请。许多电影明星都很愤怒,他们发帖捍卫自己的饭碗。 AI场景与AI演员的结合,可以让垄断电影成为“短视频”,成为大众的随意创作,摆脱此前行业的垄断。蒂莉·诺伍德附和道,“如果创作者成功,平台就会成功。”各大互联网公司的财富都是靠“平台化”发家的。 Sora 2近期最大的举措就是让免费用户“一键制作视频”,将用户从网页端转移到移动端App,实现“战略下沉”。 Sora 2 非常人性化。相比Meta忙着推出vibes,OpenAI在生产上展现出了优势。该应用程序允许用户创建少于 10 秒的短视频,并在其中插入自己或朋友的图像。高度个性化和社会化设计提出了一种比简单的社交标签页更聪明的方法,这也是它迅速覆盖社交网络的原因之一。 Open AI 首席执行官 Sam Altman 在 SORA 更新信息中明确指出,它“为创作者提供了货币化机制”。很快,邀请试用结束后,Sora将快速完成编辑功能,添加用户激励机制,推出“大平台”效应。 Open AI CEO Sam Altman表示,只要90%以上的免费用户找到变现途径,看到变现前景,Sora就有机会成为像Tiktok这样的闭环平台巨头,用户创作、消费。客观地说,Sora 2可以引领AI视频的制作和传播,也促使全球新一轮生成AI视频的竞争。抖音的成功表明,同类型的“平台”永远不会太多。因此,当大机型之间的差距逐渐缩小的时候,各路AI视频厂商纷纷发力。尽快打造最大平台:最血腥的战斗已经开始。返回搜狐查看更多