10 秒钟收获影视级短片，花式运镜主体依然清晰，这个全新国产视频模型稳稳拿捏

2024-09-28 04:42 给恰网 91

10 秒钟收获影视级短片，花式运镜主体依然清晰，这个全新国产视频模型稳稳拿捏

文生视频的赛道越来越热闹了，两周一更新，一月一迭代，马斯克当模特都快要忙不过来了。真的好能卷。豆包的视频生成模型带来了全新设计的扩散模型，针对高动态的复杂场景，展现出了影视级写实度和逼真细节。用一句话来描述效果：很强，很炸裂，不敢相信自己的眼睛。

9 月 24 日，2024 火山引擎 AI 创新巡展来到深圳，重磅发布了全新视频生成模型，一次性为整个 AI 视频赛道丢下了两颗炸弹：豆包视频生成 -PixelDance、豆包视频生成 -Seaweed 两款大模型。

作为国内首批通过算法备案的基座大模型厂商，闯入文生视频的赛道并不意外。甚至也不由得让人期待：还能怎么卷？在参与实际测试这个强大的国产模型之后，我们发现它的厉害之处，绝对不止在生成影像上，而是有一个更大的生态和愿景。

语义理解、一致性重要突破，充分掌握镜头语言

生成式视频的「魔法」，来自于「魔咒」。

换句话说，模型的语义理解能力是基础。只有在精准领悟 prompt 文字内容的情况下，才能恰当地呈现出预期中的画面——得先把「阅读理解」做明白。

这次 APPSO 参与了内部测试，得到称得上是了不起的效果——还是那句话，很强，很炸裂。

▲ prompt：一只小猫穿着围裙，戴着手套，在布满泡沫的水桶里洗碗，上方是正在出水的水龙头

每一个用 prompt 指示的元素，都得到了体现，没有「读漏题」唯一的问题是：太漂亮了——我家的土猫，没有这样的高级气质。

算了，小猫咪能有什么错。从成像来看，泡沫和水流的细节都非常惊人，以及猫猫的傲娇表情也很生动。

一个小细节：水流落在小猫的头顶，然后从背后和下巴处落下，这个细节符合物理规律，足以得见模型理解能力的强大。类似的表现，在官方演示中也能看到。

▲ 官方演示

头发在风中凌乱的还原，除了体现飘动的发丝，方向跟人物的运动节奏也是一致的，符合物理逻辑。

这种高保真的能力，背后来自抖音、剪映对视频创作的理解和技术积累，通过自研的高压缩比、高还原性视频隐状态编码和解码模型，强力保证了扩散模型的高效编码与运转。

▲ prompt：树木密布的森林里，仰望天空，天空被茂密的树叶遮住，阳光透过树叶间的缝隙洒落出来。仰拍视角，明暗对比强烈

绿色调是非常棘手的色调，调好了是复古清新，调不好就是色调跑偏。这里却精准还原光线经过了绿叶和树枝的折射，所形成的光圈效果，直逼镜头。

不得不说，在经过剪映、即梦 AI 等业务场景，反复打磨和持续迭代之后，让豆包 · 视频生成模型真正具备了专业级光影布局和色彩调节能力，支持 3D 动画、2D 动画、国画、黑白、厚涂等多种风格，以及更重要的——掌握镜头语言。

炫酷运镜，无论动作怎么变，主角都是稳稳的

镜头语言的重要性，强调多少次都不为过。没有人想自己倒腾半天，只做出一个动态 PPT。

然而对于普通用户来说，专门去上个「镜头语言」培训班也没有必要：豆包 · 视频生成模型已经准备好一系列运镜方案，从变焦、环绕、平摇，到缩放、目标跟随等超多镜头语言，都可以用 prompt 完成，实现灵活控制视角。

看上去轻松，实现起来并不简单：一致性是个不小的挑战。

模型从理解指令，生成主体，再根据镜头要求，设计主体的变化和行动轨迹，这一系列步骤中，不仅需要主体面目「不变」，还需要主体根据动作和角度，适当「可变」。

▲ prompt：一只边牧穿着太空服在月球表面奔跑，跳起来追逐在浮在空中的飞盘。月光斜角度照射，打亮它的皮毛，低角度，4k 画质，慢动作

在小狗跃起时，头部、四肢都没有大变形，稳稳的，很安心。

▲ prompt：马斯克站在水稻田里，弯腰插秧，头顶戴着一个草笠，抬起头后，举手向镜头打招呼

在面对镜头讲话的十秒钟里，马斯克的表情、手臂、身体姿态都随着动作变化，但整体没有崩掉，一系列动作都非常流畅。

在处理这种「变」与「不变」的挑战中，几乎完美地保证了主体一致性，表现实在是太强大了。

当镜头有所变化的时候，道理也是一样的。在官方的演示 demo 里，有一个水下片段令人印象深刻。

镜头一个简单的变焦，对于模型来说要完成的是：前面要有精致的细节，然后主体移动，显出新主体，最后落定在新主体上，整个一气呵成的大动作。

除了出众的一致性表现，惊人的运镜能力，自然也支持多种风格，3D、2D 动画、厚涂、漫画等，还有多种比例选择，都给了用户无比自由的选择。

▲ prompt：Beautiful, snowy Tokyo city is bustling. The camera moves through a bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes