​一句话生成丝滑的二次元视频,AI视频生成公司「鹿影科技」完成天使轮融资_ZA

一句话生成丝滑的二次元视频,AI视频生成公司「鹿影科技」完成天使轮融资_ZAKER新闻

文 | 周鑫雨

编辑 | 邓咏仪

《智能涌现》获悉,AI 视频生成科技公司 " 鹿影科技(Avolution.ai)" 此前已完成天使轮融资,由蓝驰创投和红点中国参与投资。与此同时,鹿影科技正在启动新一轮融资,所得资金将主要用于技术和产品投入,以及团队建设。

成立于 2023 年 9 月,鹿影科技将产品定位为动漫图像视频的 AI 创作与内容消费双边平台。三名联创,是均具有海外经历的年轻毕业生:

CEO 黄昭阳在香港中文大学取得了计算机博士学位,曾任商汤、NIVDIA 研究员,也是 Correspondence   Model(对应模型)视频生成架构的首创者与 Consistency   Model(一致性模型)视频加速技术引领者。

COO 兼 CFO 李倩为芝加哥大学金融政策硕士,曾任职于金浦投资、中国银河证券及百度金融。CTO 王超奇,芝加哥大学计算机博士,曾任谷歌大脑研究院,其提出的高效大模型与稀疏训练研究方法 GraSP,是该领域论文引用最高的研究成果之一。

视频生成赛道,已经涌入了一群明星玩家。就 " 大厂梯队 " 而言,快手发布了视频生成模型 " 可灵 ",百度有 UniVG,阿里则推出了可以根据轨迹生成视频的模型架构 Tora。

明星创业公司的存在感也不低,MiniMax、智谱 AI、生数科技、爱诗科技、Hidream 等耳熟能详的公司,纷纷发布了 " 类 Sora" 的视频生成模型。

其他创业者还有什么机会?黄昭阳告诉《智能涌现》,想明白这个问题,鹿影科技才有入局的底气。

在他看来,找到机会,并且在短时间内先建立壁垒的方式,无外乎两种:第一,团队在单点技术上有独特的专利或者解决方案;第二,找到大厂和明星公司还未进入的市场,深度挖掘场景需求,并利用该技术落地专属的垂类服务能力

在技术层面,鹿影科技团队在 2022 年首次提出了 LCM(Latent Consistency Model,潜在一致性)的概念,并在 2024 年基于清华大学的 LCM 架构推出了图生视频模型 Motion-I2V,以及开源了视频生成模型加速技术 AnimateLCM。

黄昭阳对《智能涌现》介绍,目前主流的几种视频生成架构(Animatediff、DiT 等)均在早期阶段,对生成模型的依赖性较高,但目前的水平不足以解决视频生成的长时和一致性难题。" 比如 Sora 中放出的 demo 中,有一个用气球代替人脸的视频,就是一种可以掩盖一致性不足的讨巧做法。" 他提到。

他认为,视频的本质是 Correspondence,也就是 " 内容 - 运动轨迹 " 的动态对应关系。一旦能够对内容和运动的对应关系进行建模,就能确保视频元素在运动过程中的前后一致性以及多镜头一致性问题。在数据端,鹿影科技建立了全球最大的 Correspondence Learning 数据集。

就具体效果而言,在运动轨迹较复杂、视角变换的情况,鹿影的 Motion-I2V 图生视频模型在运动形态的模拟和元素的一致性上,比 Pika、Gen-2 等模型的效果更好,其开源的 AnimateLCM 更是成为了 AI 创作者社区主流的创作工具之一。

AnimateLCM 的生成结果,包括文生视频、图生视频和可控视频生成。图源:AnimateLCM: Accelerating the Animation of Personalized Diffusion Models and Adapters with Decoupled Consistency Learning

在产品层面,鹿影科技选择的切入口,是面向 C 端生产者的动漫视频生成平台。

目前,考虑到下游客户的付费能力,以及模型在一致性和可控性上的缺陷,视频生成平台往往选择场景更为聚焦的 B 端场景,比如广告、游戏、影视。

为了打出差异化,黄博士告诉《智能涌现》,鹿影科技选择的优先面向 C 端二次元创作者的动漫视频生成创作平台,而鹿影科技的核心技术也聚焦在视频生成一致性与视频加速来提供良好的用户体验。

一方面,用户对于动漫生成场景要求的不是真实视频的拟真感,因此不会产生 " 恐怖谷 " 心理,反而对画面内容的张力、画风与笔触的细腻程度、画面自由的自定义能力要求很高,这正是生成式视频的优势且有价值的落地场景。

另一方面,Bilibili 的发展,以及当下 Lofter 和 QQ 在二次元群体中的广泛使用,证明了二次元创作具有广阔市场;而各类漫展在国内展出,也证明了二次元具有很强的消费性。据中研产业研究院估计,2024 年,二次元市场规模已经高达 1200 亿元。

针对动漫创作者,2024 年 7 月 8 日,鹿影科技上线了图片、视频创作平台 YoYo。

YoYo 提供了文生视频和图生视频两种动漫创作模式。在文生图模式下,平台背后的动画视频生成模型可以基于用户输入的文字 Prompt,生成可供编辑调整的多个分镜,进而将分镜扩展为具有一致性的视频。

YoYo 国内用户生成的视频。图源:YoYo

不可否认的是,工具型平台想要提高并维持用户粘性,最重要的是建立可互动、可消费的社区,形成生态壁垒。

黄昭阳对《智能涌现》介绍,在早期,PGC(专业生产者)对社区风格和生态的建立有至关重要的作用。团队与十多名动漫领域的专业生产者已经达成了合作,后续将在社区上线高质量的 AI 动漫内容。

上线未满一个月,YoYo 的创作转化率(指注册后使用工具的用户比例)就达到了 95%,并且 55% 用户会持续在次周上线使用。

全球化,也是鹿影科技的布局业务重点。目前,YoYo 的海外用户占比接近 70%,其中日本用户占到了用户总规模的 35%。

YoYo 海外用户生成的视频。图源:YoYo

黄昭阳认为,目前的平台还处在获客和规模化的 1.0 阶段,主要目标是建立市场的品牌认知,以及获得用户反馈。在 2.0 阶段,YoYo 的重心将放在完善内容的市场化供给,并在平台探索剧本共创、AI 续写等可消费的 AI Native(AI 原生)互动方式。在黄昭阳看来,这也是 AI 视频技术真正能迈向规模化的起点。

以下是投资人评价:

蓝驰创投:

鹿影科技的创始团队作为 AI native 的视频生成的前沿技术团队,基于对市场需求的深刻理解,致力于解决动漫产业创作端优质供给不足的实际痛点,并快速将模型能力产品化,积累了高质量数据沉淀。我们也会持续关注在某些细分场景能快速闭环,持续构建数据壁垒,并能持续提供超出用户预期产品的 AI 应用团队。

红点视频 :

生成赛道应用前景广阔,在众多技术探讨中被认为与世界模型引擎相关联。区别于赛道内众多参与者,鹿影科技团队另辟蹊径,以 AI 生成可消费内容为出发点,打造泛动漫领域视频生成产品,通过技术逐步推动商业性价比及商业可用性,加速 AI 在动漫领域的渗透落地,让更多的内容消费者可以低门槛的进行内容生产。我们期待鹿影科技在动漫领域贡献更多力量。

相关推荐

​穆胜:这两个奇葩CHO让我破防了_ZAKER新闻

59

穆胜:这两个奇葩CHO让我破防了_ZAKER新闻 文 | 穆胜 在学术身份之外,我从事咨询工作多年,无论是落地战略,还是重塑组织、管理人效,都会接触企业的人力资源一把手(CHO/HRVP/HRD 等...

​陈梦回应!

​陈梦回应!

196

陈梦回应! 新华社巴黎 8 月 7 日电 中国女子乒乓球队在 7 日的巴黎奥运会女团比赛中晋级半决赛。国乒队员陈梦赛后表示,希望球迷群体能正确面对赛场上的输赢,重在关注运动员在...