​字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度

字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度

过去一年,围绕着字节 AI 的几个谜团,终于都在今天被揭开了。

5 月 15 日火山引擎 Force 原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了 9 个豆包模型,其中包括通用模型 pro 版、通用模型 lite 版以及各个领域的垂类模型,并宣布正式对外服务。

这是一次很有意思的更名,我们甚至可以把它理解为是一场 " 豆包的胜仗 "。

而且一出手,直接 " 点名 " 了阿里百度,火山引擎总裁谭待在宣布豆包大模型价格时直言:" 很遗憾阿里和百度还没有 128k 可精调的模型,但我期待他们的更新。"

去年在百度和阿里率先发布大模型之后,字节迟迟未动。硅星人了解到:彼时字节内部不同的部门都在进行 AI 探索,抖音、剪映团队各自为战," 豆包 " 只是基于云雀大模型开发的 AI 产品,并成立了新部门 Flow,发力 AI 应用层。

在技术发展的早期,将不同的产品投向市场,交给用户检验的路子,我们并不陌生。经过了一年的时间,"豆包"从一众大模型产品中脱颖而出,也给字节大模型赚了一波 " 印象分 "。

从 2023 年底," 豆包 " 用户量一路狂奔,QuestMobil2024 最新的报告中显示,2024 年 3 月," 豆包 "App 月活用户为 2328.2 万,在 AIGC 类应用中排名第一。

此次全面更名,揭开了整个字节大模型内部战略的第一个谜团:未来可能将豆包团队作为主力军,着重培养。

而朱骏作为字节跳动战略和产品副总裁在原理大会上的亮相,似乎也回答了关键领导人的问题。

现场,字节旗下 AI bot 开发平台 " 扣子 " 的一位工作人员告诉我们:" 目前字节 AI 基本在火山引擎之下,产品战略由朱骏负责 "。

找到了方向也确定了领队,由此可见,字节 AI 是真的想 " 开 " 了。

豆包家族,组团应战

Grace 改名为豆包的时候,字节没少被人笑话。

但就是这个接地气的名字,如今站上了字节大模型家族的 C 位。

" 为什么叫豆包?" 朱骏在现场分享道:" 很多人来问我,为什么起这个名字?我认为一定要拟人化、首先确定下来产品起名的通用原则是,简单、好读、好记。"

会上,谭待宣布从云雀升级为豆包大模型家族,我们根据他们不同的功能,将 9 个模型分为了三大族群:

第一类是两个通用模型:豆包通用模型 pro(专业版)及豆包通用模型 lite(轻量版),专业版上下文窗口尺寸最大 128K,适配场景更加通用和全面,而轻量版则更具性价比,中小企业友好,对比 pro 版本千 tokens 成本节省 84%。

谭待介绍,像汽车的座舱模型、终端模型就更加适合 lite 版本,更轻量。通过豆包 lite,汽车厂商可以在低延迟下实现对话,支持闲聊、搜索、娱乐、导航、车控等多个座舱智能助手场景,效果要比传统语音处理高达 50% 以上,帮助用户获得新一代的智能化驾驶体验,让汽车变得更 " 聪明 "。

第二类是个垂类模型:分别包括角色扮演模型(Agent)、语音合成模型、声音复刻模型(多语种的迁移复刻)、语音识别模型、文生图模型,除视频生成模型外,基本涵盖了目前模型的使用场景,且源于云雀语音大模型的技术,很明显在语音模型上更为细分。

目前基于角色扮演模型,打造出了猫箱产品,可以打造单一的角色交互,也可以多角色之间交互发生故事,类似于星野。

第三类则是工具类模型:针对于更专业的调试领域,Function Call 模型和向量化模型。可根据不同的输入指令和情景,选择不同的函数和算法来执行相关任务,也是当前支持扣子的主力模型。

之所以经历了这样的分类,谭待讲道:" 表面上看这是技术的分型,但是实际上我们是根据企业用户的需求进行选择,参考过去企业对于模型的调用量,这是很真实的数据。"

不仅豆包增加了多个 " 影分身 ",字节的产品包也开始从"豆包"开始,出现了猫箱、星绘、河马爱学、即梦等等。

朱骏在经历了抖音前身 Musical.ly、TikTok 等多个明星产品打造,带着丰富经验的他开始操刀字节大模型的产品。

技术如何落地在产品当中?从目前的产品矩阵中,字节的大模型产品思路也逐渐浮出水面。

" 和 AI 时代之前做产品设计比较,我的个人感受是既有共性又有很大的差异。共性是用户的核心需求还是那些,差异点是,以前是在成熟的技术上想应用,只要用同理心去理解用户的需求和使用体验,就能做出一个还不错的产品。" 朱骏讲道了,在 AI 时代,他们设计产品时的变与不变。

比如让自己变好看点的需求,社交娱乐和教育学习的需求等等,都没有变,这些其实是用户场景的通用性,但满足用户需求的手段变了,满足产品的技术在快速演进,每隔三个月、半年都会发生很大的变化。而且它的能力改进往往不是线性的,隔一段时间可能就会出现一个跃迁。

在现场,我们对字节新的产品箱进行了测试,负责 " 猫箱 " 的产品人员告诉硅星人:" 目前猫箱是一个 Agent+文生图+文本能力一个综合技术能力集成的产品,但是本质上是一个 UGC 的平台,需要用户自己创造 Agent 和剧本。"

上述负责人讲道:" 通过前期的用户调查,发现这是一块新的需求,因此打造了猫箱。"

朱骏也讲道:" 为了让豆包在这种移动场景里交互更方便,像一个随身携带的百事通,我们很早投入了很大力度优化语音交互体验,包括基于大模型的 ASR 和超自然的 TTS 音色,尽量做到类似和一个真人对话的感受。"

字节 AI,变 " 厚了 "

由单点向外扩散,字节的大模型生态开始变厚。而除了模型本身和产品外,更重要的一点是谭待所强调的,这是豆包大模型第一次对外提供服务。

也就是说,豆包大模型家族全面 To B 了。

坦白讲,以前的字节并没有 To B 基因。火山引擎、飞书通过对字节本身长板能力的外化,在前几年积累了一定的客户,但是对于整个企业市场而言,它依旧很年轻。

在几天前的阿里云 AI 智领者峰会上,阿里云也强调大模型和千行百业的结合,这意味着火山引擎要在阿里云的优势战场上与其交锋。

但唯一的变量,就是大模型带来的全新的 AI 时代。火山引擎准备如何用大模型服务客户?在谭待发言的最后半段,其实放了三个大招。

第一个是低价。做企业市场,痛点永远是第一驱动力,而对于当下的企业而言,算力成本、推理成本高昂,就是最核心的痛点。在阿里云掀起了云市场的 " 价格战 " 之后,火山引擎对比了目前主流模型 token 价格,以低价为钩子,进入企业市场。

会上,谭待公布了豆包通用模型 pro-32k 和 128k 的价格,如图所示,在 32k 型号价格比行业低 99.3%、128k 型号比行业价格低 95.8%。

" 第一我们能做到,第二点是我们需要这么做。" 谭待讲道。" 技术上我们需要非常多的手段,比如模型结构优化的技巧、工程上从单机推理到分布式推理,再比如混合调度,本身我们自己的调度量非常大;第二就是推进生态繁荣,促进应用的爆发,市场有很大需求,但创新的风险很高,面临不确定性,我们必须把试错的成本降到非常低,市场的呼声就是更低的成本更好的模型。"

数字对于普通用户而言,或许没有那么形象。谭待举了个例子:" 今天如果你通过火山引擎、通过豆包大模型 1 块钱就能获得 125 万个 token,这是什么概念?《三国演义》很多人都读过,一共只有 75 万字,所以只需要 1 块钱就能处理 3 本《三国演义》的文字量。"

To B 的价格战并不稀奇,只不过没想到,是由火山引擎率先发起的。

不过谭待讲道:"To B 的业务要求长期的定力,用亏损换收入是不可持续的,未来我们也会持续通过技术降低成本以降低价格。"

价格是驱动市场的因素,但更难的是,未来大模型将以什么样的形式落地行业?

火山引擎将这个连接器的角色,赋能给了火山方舟 2.0。

会上,谭待宣布火山方舟进行全面升级,这是去年火山方舟面世以来第一次迭代。

在 2.0 生态里,火山引擎根据过去一年的客户服务经验,着重升级了插件生态。

" 不要让用户来找我们,要让我们去找用户。" 朱骏讲道。

插件是相互连接的第一道门。比如联网插件可以连接抖音头条搜索技术,实时联网信源、多模态交互等等,使用联网插件,模型一秒变 "Kimi",也在某种程度上替代了搜索的能力。

更有抖音特色的是内容插件,提供海量丰富的内容、视频理解和交互,并支持内容策略定制。内容、流量是抖音的看家本领,对于内容产品的打造是字节的一个巨大的优势,而插件就能把这样的能力对外提供服务。

RAG 知识库插件,内置了大规模高性能向量检索能力,百亿级别数据可以实现毫秒级检索,也内置了豆包向量化模型,提供更好的搜索相关能力。同时 RAG 也能保证企业数据安全的同时,为大模型提供一个外脑,让大模型在行业场景里更加专业。

插件是连接的一种形式,重点在于火山引擎正在积极通过打造底层生态和基础能力,为行业大模型落体提供基础的土壤。

当然,除了传统行业和大型企业,火山引擎也针对开发者群体,打造了 " 扣子 " 企业专业版,开发者可免费在 " 扣子 " 平台上打造自己的 Bot,无论是以纯软件的形式、外嵌飞书、微信等平台或者以 API 的形式连接终端硬件。

硅星人简单尝试了用扣子平台操纵机器狗,几乎只需要自然语言给到一些指令,就可以让机器狗在听到指令时 " 舞狮 ",解决了调试时间和技术门槛。

基本上我们可以确定,在经历了一年的混乱、整理、明确的过程后,字节 AI 的生态版图已经出现,从基座大模型到模型产品,从垂类大模型到开发平台,字节 AI 或许从今日起,才算正式启程。

相关推荐

​裁员、关店、销量暴跌,网红书店艰难求生

119

裁员、关店、销量暴跌,网红书店艰难求生 文 | Tech 星球,作者 | 翟元元 五一 假期过后,年轻人的网红打卡点 茑屋书店 北京首店的客流量明显减少。这与它 4 月底开业初期 门庭若市...

​双相情感障碍ll型的症状表现

​双相情感障碍ll型的症状表现

142

双相情感障碍ll型的症状表现 双相情感障碍ll型是一种精神疾病,其症状表现多种多样。在低谷期,患者会感到极度的沮丧和无助,常常失去对生活的兴趣和动力。他们可能会出现睡眠...

​女生说好啵是什么意思

​女生说好啵是什么意思

107

女生说好啵是什么意思 在现代社会中,“好啵”这个词汇已经成为了年轻人之间常用的口头禅。那么,女生说“好啵”是什么意思呢?下面就让我们一起来探究一下吧。 1. 表示同意或...

​女生给你好人卡,改变3个地方,让她爱上你

​女生给你好人卡,改变3个地方,让她爱上你

112

女生给你好人卡,改变3个地方,让她爱上你 女生给你好人卡,这是一个很好的机会,让你改变自己,成为她心中的那个人。在这篇文章中,我将告诉你三个地方需要改变,让她爱上你...

​女生从不主动找你,但微信秒回说明什么?

​女生从不主动找你,但微信秒回说明什么?

183

女生从不主动找你,但微信秒回说明什么? 有些男生会遇到这样的情况,女生从不主动找你,但微信却秒回。这种情况说明了什么呢?下面就让我们一起来探讨一下。 1. 女生可能对你...

​女朋友太爱生气太累了怎么办

​女朋友太爱生气太累了怎么办

59

女朋友太爱生气太累了怎么办 有些女朋友总是爱生气,让男友感到很累。这种情况该怎么办呢?下面就为大家介绍几种解决方法。 1. 沟通 沟通是解决问题的第一步。当女朋友生气时,...

​分手时恶语相向还能和好吗?

​分手时恶语相向还能和好吗?

60

分手时恶语相向还能和好吗? 分手时恶语相向,是很多人都经历过的痛苦。但是,即使在这种情况下,我们是否还能和好呢?本文将从以下几个方面来探讨这个问题。 1. 分手时恶语相...

​第一次加女生微信,聊天开场白该说什么?

​第一次加女生微信,聊天开场白该说什么?

147

第一次加女生微信,聊天开场白该说什么? 第一次加女生微信,聊天开场白该说什么?这是一个让很多男生头疼的问题。在这篇文章中,我们将为大家提供几种不同的开场白,帮助你成...

​追女生的幽默情话,打动女生的同时逗她开心

​追女生的幽默情话,打动女生的同时逗她开心

104

追女生的幽默情话,打动女生的同时逗她开心 追女生是一件很有趣的事情,但是如果只是单调的表白或者送礼物,可能会让女生感到无聊。那么如何在追求女生的过程中既能打动她又能...

​网恋没有话题聊了应该聊什么东西

​网恋没有话题聊了应该聊什么东西

199

网恋没有话题聊了应该聊什么东西 网恋是一种特殊的感情交流方式,但有时候会遇到没有话题聊天的尴尬局面。那么,在这种情况下应该聊些什么呢?本文将为大家提供几个建议。 1...

​这国总统放重话:对以色列总理发逮捕令!

​这国总统放重话:对以色列总理发逮捕令!

131

这国总统放重话:对以色列总理发逮捕令! 综合《以色列时报》和法新社等外媒报道,在哥伦比亚宣布与以色列断绝外交关系后,以总理内塔尼亚胡与哥总统佩特罗最近几天在社交平台...

​闽粤联网工程首次实现满通道能力送电

​闽粤联网工程首次实现满通道能力送电

78

闽粤联网工程首次实现满通道能力送电 日前,记者从南方电网广东电网公司获悉,5 月 11 日,闽粤联网工程首次以 200 万千瓦满通道能力送电广东,整个送电过程将持续 10 天,累计送电...