​智谱AI推出国产大模型GLM-4,性能比上代提升近60%,宣称对标美国GPT-4

智谱AI推出国产大模型GLM-4,性能比上代提升近60%,宣称对标美国GPT-4

智谱 AI 的大模型产品智谱清言(图片来源:钛媒体 App 编辑拍摄)

随着 OpenAI 即将推出 GPT-5,国内人工智能(AI)大模型正加速追赶。

钛媒体 App 1 月 16 日消息,阿里、腾讯投资的 AI 公司智谱 AI 在北京发布全新自研的第四代多模态基座大模型 GLM-4 系列,称性能相比上一代全面提升接近 60%、模型性能直接逼近 GPT-4," 特别是中文能力可比肩 GPT-4",并且该公司还公布 GLMs 个性化智能体模型等产品。

同时,智谱 AI 今天还公布一项由智谱联合生态伙伴发起的大模型创业基金 "Z 计划 ",总投入 10 亿元人民币,专门支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

智谱 AI 公司 CEO 张鹏表示,此次 GLM-4 的发布及上线,是智谱 AI 大模型研发上的关键突破。他强调,为了瞄向 AGI,公司每 3-6 个月更新一次做一次升级,上一代智谱解决的是模型能力矩阵的对标,这一次是模型能力上跟 GPT-4 做到基本对齐,"GLM-4 的基本能力已经比肩 GPT-4。"

智谱 AI 公司 CEO 张鹏

据悉,智谱 AI 成立于 2019 年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准 AI 大模型研发落地,公司 CEO 张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道 2.0。

2020 年,智谱 AI 开始启动 GLM 预训练架构的研发,致力于打造新一代认知智能大模型,专注于做大模型的中国创新,并训练出 100 亿参数模型 GLM-10B;2021 年利用 MoE 架构成功训练出万亿稀疏模型;2022 年公布 1300 亿级超大规模预训练通用模型 GLM-130B,并以此打造大模型平台及产品矩阵。

2023 年初,智谱 AI 推出千亿基座的对话模型 ChatGLM,并开源单卡版模型 ChatGLM-6B 等,部署于个人开发者和企业应用领域。6 月,智谱发布 ChatGLM2,包括 6B、130B、12B(120 亿参数)、32B、66B 等参数的模型,推理速度增长 42%。据张鹏透露,相比 GPT-4 版的 ChatGPT,ChatGLM2-12B、32B 和 66B 性能分别提升 16%、36% 和 280%。

2023 年 10 月,智谱 AI 公布 ChatGLM3-1.5B、3B 和 6B(15 亿、30 亿、60 亿)参数版本,在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升 2-3 倍。同时,基于集成自研 AgentTuning 技术,在智能规划和执行上比 ChatGLM-2 提升 1000%。另外,ChatGLM3 还利用华为昇腾生态,使算力推理速度提升 3 倍以上。同时,该公司也进行商业化探索,打造 AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型 CodeGeeX 等。

融资方面,创立至今的四年多,智谱 AI 已完成四轮融资,投资方包括君联资本、启明创投、中科创星、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss 直聘、好未来、红杉、高瓴等多家机构,去年融资额超过 25 亿元人民币。目前,智谱 AI 估值超过百亿,是国内 AI 领域独角兽企业。

公开信息显示,截至目前,智谱 AI 开源模型在 Hugging Face 的全球下载量已超过 1100 万次,GitHub 累计有超过 5 万 Stars。

此次,智谱 AI 首届技术开放日(Zhipu DevDay)上,主要公布三个重要消息:GLM-4 系列多模态模型的发布,上线全新 GLM-4 的 All Tools(所有工具)、GLMs 个性化智能体定制能力,以及发起并联合成立多个大模型开源基金、商业化进展,从而拓宽智谱 AI   GLM 系列模型生态。

首先是 GLM-4 系列模型。具体来说,GLM-4 可支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页。同时,它的推理速度更快,支持更高的并发,大大降低推理成本,而且文生图和多模态理解等方面都得到了一定增强。

据张鹏透露,在支持中文的文字写作、数学计算、逻辑推理等 AlignBench 对齐能力基准测试中,GLM-4 达到 GPT-4 的 95%-116% 的水平;中英文的指令跟随能力方面,GLM-4 基本能达到 GPT-4 的 80% 左右水平;在支持总结、信息抽取、复杂推理能力的 LongBench 基准测试中,GLM-4 128k 版本达到 81.1 分,超过了 GPT-4(71.2)。

其次,GLM-4 的 All Tools 是全新的智能体能力展示,可实现自主根据用户意图,自动理解、规划复杂指令,能力完全自动,自由调用网页浏览器、代码解释、多模态文生图、文件处理、数据分析、图表绘制等复杂任务;GLMs 个性化智能体定制功能则是支持用户用简单的提示词指令创建属于自己的 GLM 智能体,包括实现自动写代码、帮老师设计丰富有趣教学方案的教案设计师,或是能根据关键词快速生成 Logo 的画师等。

在会议现场,张鹏同时预告,GLMs 模型应用商店开发者分成计划也将同期公布。

最后是关于基金和生态部分,智谱 AI 共公布了四个基金项目:一、其联合发起了 CCF- 智谱大模型基金、SMP- 智谱大模型交叉学科基金,去年为全国 30 余所高校参与的 41 个研究项目累计提供超过 1000 万元资金和算力支持;二、今年智谱 AI 还发起大模型开源基金,提供 1000 张 GPU 卡、1000 万元现金支持、1000 亿免费 API tokens;三、智谱 AI 也将 "Z 计划 " 进一步升级,联合生态伙伴发起总额 10 亿元基金,支持大模型创业项目的创新探索,目前已公开投资了聆心智能、无问芯穹等项目。

商业化层面,目前智谱 AI GLM 系列模型与德勤、火山引擎、蒙牛、中国电信、金山软件、芒果 TV、马蜂窝、华泰证券等数十家公司合作,应用于政务、金融、能源、制造、医疗等领域,支持 10 余种国产硬件生态。张鹏透露,除了 To B 端业务落地,未来智谱 AI 还将做 To C 端超级应用,目的要把闭环做起来,给未来也留下一个可能性。

钛媒体 App 了解到,目前智谱 AI 主要销售三类技术服务:数字人 SaaS/PaaS 方案,科技情报 SaaS/PaaS 方案,以及包括 ChatGLM 系列在内的认知大模型 PaaS/MaaS 平台方案。

张鹏对外透露,2023 年下半年,公司签单客户约有几百家,2023 年整体有亿级签单额。

对于中国大模型与 GPT 的差距,据腾讯新闻深网,张鹏表示,目前两者还处于追赶、缩小差距态势,主要是国产大模型起步比 OpenAI 晚,因此需要不断积累去调整发展速度、曲线的斜率,只有算法、系统工程、数据、应用到落地等链条所有的创新累加起来,才有可能去超越 GPT。

此前张鹏曾表示,在规模和核心能力上,国内研发的大模型与世界先进水平差距约一年左右。

中国科学院院士、清华大学教授张钹却认为,大语言模型(LLM)仍存在不自知、质量不可控、不可信、不鲁棒(受提示词影响)等问题," 幻觉 " 错误也很多。然而,尽管如此,但他却依然支持大模型技术发展,他认为 AI 产业发展一直受制于特定领域、特定模型和特定任务的限制,难以做大做强,因此发展比较缓慢,而大模型给行业提供了发展通用硬件和软件的更多机会。

" 我想经过 2023 年的充分竞争,现在我们逐渐可以说进入一个决战时刻了。"张鹏表示,智谱 AI 将希望与 AI 行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力,为中国 AI 未来发展贡献绵薄之力。

(本文首发钛媒体 App,作者|林志佳)

相关推荐

​买房刚需,在哪里

117

买房刚需,在哪里 住房消费一级拉一级。 (原标题:刚需,你在哪里) 1 最近十年,北京的地产商们恐怕从没有像今天这样意识到刚性需求对他们命运的重要。 一年多以前,北京楼市...

​爱奇艺和腾讯视频盈利了,只有优酷没赶上

​爱奇艺和腾讯视频盈利了,只有优酷没赶上

197

爱奇艺和腾讯视频盈利了,只有优酷没赶上 作者|孙鹏越 编辑|大 风 从《狂飙》开始,再由《繁花》结束,可以说 2023 年是网播剧集和长视频平台爆发的一年。 同时,在 2023 年,砍...

​英特尔:AI PC,是 “牙膏厂” 的救命稻草吗?

​英特尔:AI PC,是 “牙膏厂” 的救命稻草吗?

137

英特尔:AI PC,是 “牙膏厂” 的救命稻草吗? 作为推出世界上第一款商用计算机微处理器的厂商,$ 英特尔 .US 的技术能力在行业中长期领先。正是由于过往技术面长期领先和垄断式的...

​当抖音给主播们戴上“紧箍咒”

​当抖音给主播们戴上“紧箍咒”

159

当抖音给主播们戴上“紧箍咒” 泡沫消散后,谁还能笑到最后? 2024 年 1 月 3 日,抖音宣布直播新版 健康分 处罚正式生效。这一 最严新规 既标志着抖音对直播内容的管理进入了新阶...

​鸿蒙系统,即将跨越16%生死线?

​鸿蒙系统,即将跨越16%生死线?

138

鸿蒙系统,即将跨越16%生死线? 1 月 15 日周一,华为终端官宣,1 月 18 日华为将举办鸿蒙重要活动,届时将揭秘鸿蒙生态和 HarmonyOSNEXT 进阶新篇章。鸿蒙概念再度走高,亚华电子涨超...

​110岁!“文坛寿星”马识途读书写字乐享生日

148

110岁!“文坛寿星”马识途读书写字乐享生日 1 月 13 日,著名作家马识途先生迎来他的 110 周岁生日。 110 岁生日到来前夕,马识途先生在成都家中提笔写下 福 寿 二字。和往年一样,...

​安踏在下一盘很大的棋

​安踏在下一盘很大的棋

193

安踏在下一盘很大的棋 出品|虎嗅商业消费组 作者|齐敏倩 编辑 | 苗正卿 头图 | 视觉中国 2024 年刚过不到半个月,户外品牌始祖鸟就已经上了两次热搜。 1 月 11 日,有媒体报道,原...

​张坤狂卖2个亿!葛兰减仓!

​张坤狂卖2个亿!葛兰减仓!

88

张坤狂卖2个亿!葛兰减仓! 一、 知名基金经理最新动态 张坤被迫砍仓招商银行 日前,易方达基金公告了一则《旗下基金关联交易事项的公告》显示,张坤管理的易方达优质企业三年...

​下周A股怎么走,要看明天这件大事

103

下周A股怎么走,要看明天这件大事 刚过去的交易周(1.8-1.12),A 股整体在低位震荡,但已不再像前一周那般泥沙俱下,而是多次出现冲高回落走势。 部分股指周线收出十字星,创业板...

​能赚钱的UP主,会是B站商业化的破局点吗?

​能赚钱的UP主,会是B站商业化的破局点吗?

188

能赚钱的UP主,会是B站商业化的破局点吗? 图片来源 @视觉中国 文 | 太平洋科技 在 B 站,我已经一整年没接过广告了。 一位有着近 40 万粉丝的 up 主告诉 PConline。 这并非个例,近年来...

​房地产格局再生变

​房地产格局再生变

147

房地产格局再生变 经济观察报 记者 田国宝 北京报道 对于房地产企业来说,2023 年是一个 焦灼 的年份,年初 高开 的楼市,让诸多企业再次误判形势,个别甚至采取较为激进的投资策...

​小生意大商机:卖壁纸轻松月入 10 万

​小生意大商机:卖壁纸轻松月入 10 万

200

小生意大商机:卖壁纸轻松月入 10 万 图片来源 @视觉中国 文 | Tech 星球,作者 | 陈桥辉 新年伊始, 新年待办清单壁纸 话题迅速窜上了热搜。这似乎有些意外,为何壁纸也能成为大家讨...