2026 年 Tribeca 电影节上的 AI 短片,没有证明“机器已经会拍电影”。它证明的是另一件事:只靠通用视频模型和提示词,离片厂真正能用的流程还很远。

反常的地方也在这里。AI 视频模型的演示越来越漂亮,但一放进叙事里,问题就冒出来了:角色能不能稳定,镜头能不能接上,声音和表演能不能撑住一场戏。

Google DeepMind 与 Connie Qin He 合作的《Dear Upstairs Neighbors》被看作更接近可用工作流的样本,不是因为它更像“全自动电影”,而是因为它更不像全自动。人类艺术家仍在前面定风格、控镜头、搭节奏,AI 只是被接进了制作链条。

这才是好莱坞真正会关心的部分。

Tribeca 的 AI 短片:能看见进步,也能看见硬伤

Tribeca 这批 AI 相关作品,基本覆盖了几条常见路线。

Illuminai Studios 的《Roar》更像一组 AI 片段拼贴。单个画面可能有冲击力,但画面之间缺少电影叙事需要的连续性。

Asteria Film Co. 的《ChikaBOOM!》试图讲一个魔法学徒的奇幻故事,节奏更快,目标也更接近类型片。但视觉和声音完成度不足,观众很难被带进故事。

OpenAI 相关作品则更聪明一点。《Smoked》用 Sora 重现 Palisades Fire,远景火场有卡通感,但车内母子逃生的近景更能成立。《Mauvais Soleil》大量镜头只有几秒,唯一说话者是看不见的旁白。这些选择不是偶然,更像是在主动绕开模型不擅长的长镜头、复杂表演和稳定角色。

这不是小毛病。短视频可以靠几秒钟的奇观取胜,电影不行。电影要追问下一镜怎么接,人物为什么这么动,情绪能不能连续。

作品 / 路线做法暴露的问题对行业的提示
《Roar》AI 片段感较强连贯性弱,像素材拼贴适合实验,不像成熟流程
《ChikaBOOM!》AI 参与奇幻短片视听打磨不足类型片更需要工业控制
《Smoked》《Mauvais Soleil》使用 OpenAI 工具并规避限制靠近景、短镜头、旁白降低难度方法聪明,但仍在绕短板
《Dear Upstairs Neighbors》人类美术 + Maya 粗动画 + 定制模型协作门槛更高更接近片厂能理解的工作流

这张表里最关键的差别,不是哪个公司模型更强,而是哪条路线更像生产。

电影工业不只要“生成”。它要可控、可改、可交付。

《Dear Upstairs Neighbors》为什么更像可用案例

《Dear Upstairs Neighbors》由 Connie Qin He 与 Google DeepMind 合作。影片讲一个疲惫的年轻女性 Ada,被楼上邻居夜间噪音反复吵醒。

它的视觉起点不是一串文本提示词,而是 Yingzong Xin 的概念艺术。Xin 用 Photoshop、纸上丙烯等方式做出带有表现主义气质的图像。Google DeepMind 研究人员再用这些概念艺术训练定制版 Veo 和 Imagen,让模型更稳定地贴合这部短片的画风。

流程里还有一个很重要的环节:Maya 粗动画。

团队先用 Autodesk Maya 做粗动画,确定场景调度、角色动作和叙事节奏。之后再把这些粗动画输入 Veo,生成更统一、更精细的画面,并配合 Imagen、Veo 生成的风格化资产继续完善。

所以这不是“文本到电影”。更准确地说,它是“人类先搭好电影骨架,AI 再参与风格化和画面生成”。

这个区别很硬。

通用模型适合展示能力边界。定制模型才可能进入预算表、排期表和责任链。片厂要的不是一次生成多惊艳,而是同一个角色能不能在几十个镜头里保持一致,同一种光影能不能按导演要求调整,出了问题能不能返工。

对影视产业从业者来说,这意味着采购和团队调整都不会一夜之间改道。更现实的动作,是把 AI 放进局部环节:概念开发、风格测试、预演、粗动画后的画面细化,或者特定项目的视觉资产生产。

对关注生成式 AI 落地的人来说,这也是一个降温信号。别只看模型发布会里的长视频演示,要看它能不能被项目绑定、被团队协作、被合同约束。

对好莱坞的提醒:先别赌通用模型,先看供应链

AI 视频工具本身还不稳定。OpenAI 的 Sora 已关闭,导致长片项目《Critterz》未能在戛纳首映。这件事给片厂的提醒很直接:如果核心制作环节绑在外部模型服务上,工具一变,排期、资产兼容、交付责任都会受影响。

独立创作者看到的是另一面。

导演 Ash Koosha 用 Kling AI、Claude、Gemini 和 Nano Banana,以约 2000 美元算力成本独立完成《Dreams of Violets》。这说明低成本 AI 影像生产已经可行,尤其适合小团队表达、政治题材,或纪录与剧情混合的项目。

但它也说明了边界:成本能压低,不等于视觉语言已经突破。原文观察很直接,这部片有叙事力量,视觉上并没有带来新的跨越。

片厂管理层接下来更可能做三件事。

  • 暂缓把核心长片制作完全交给通用 AI 视频模型。
  • 在单个项目里尝试定制模型,看它能否降低返工、统一风格、压缩中间制作成本。
  • 把版权、工会规则、署名、资产归属和工具连续性写进合同,而不是只看模型演示。

美术、动画和视效从业者也要看清变化。纯执行型岗位会承压,但能给出视觉方案、镜头判断、风格控制,并且会和工具协作的人,会更接近新流程的核心。

接下来最该看的不是哪家公司又放出更长的视频,而是三个变量:片厂会不会为单个项目训练或微调模型;模型供应商能不能保证工具连续性;AI 生成资产能不能进入正式合同和工会规则。

这三件事没落地,Tribeca 的 AI 短片最多说明“可看”。还不能说明“可生产、可交付、可负责”。