试用阿里最新的视频模型:Happyhorse

输入源是由 GPT 生成的 4x4 宫格图,展示了一对年轻情侣在不同场景(海滩、城市夜景、教堂、街头奔跑)下的瞬间。我们的目标很简单:使用AI 分镜转视频,将这 16 个静态切片转化为逻辑连贯的剧情短片。
✅ 优点:出色的视觉张力与动态连贯性 画质与光影: 视频光影质感极佳,尤其是镜子前的暖光及海边的冷暖交错,显得非常自然。 物理平滑度:镜头推拉及人物面部表情几乎没有扭曲,属于当前 DiT 架构模型的第一梯队。
❌ 痛点:弱控制力与“幻觉” 这是我们在 阿里 HappyHorse 评测 中发现的最大遗憾。模型在 Zero-shot 生成时赋予了自己过高的“想象力”。 分镜脱节: 它完全忽略了 4x4 宫格图的叙事逻辑。在严格的 *AI 分镜转视频** 任务中,它表现得更像是随机混剪,而非线性叙事。
本作品采用《CC 协议》,转载必须注明作者和本文链接
关于 LearnKu