​银行业大模型落地,遇到五大难题

银行业大模型落地,遇到五大难题

AI 生成图片

由于银行业本身的特性,不管是政府层面还是行业监管层面对银行数据的合规性、安全性、准确性、可信性都存在较高要求,因此运用在银行业的大模型技术都是研发成熟品。从整个大模型行业来看,部分业内人士认为,银行业大模型的落地进展略滞后于整体行业。软通动力孙洪军表示,他们最初预测金融行业可能会最先大规模使用大模型,但从最终对接客户的情况来看,金融行业不如法律、招聘等行业走得快。

银行业的大模型正面临着落地困境,因此对于现阶段还未开发大模型的银行,第一步是列举出目前银行的大模型困境,并思考如何解决这些 " 桎梏 ",而不是盲目跟风训练大模型。

目前限制银行大模型发展的难题主要来源于五个方面,分别是,开发阶段的技术门槛、人员和成本问题,数据来源、数据质量和隐私保护问题,运行过程中的算力和存力配置问题,对客层面的可解释性和信任度问题,开发后的内部员工 " 恐惧 " 问题。

开发阶段的技术门槛、人员和成本问题

由于银行大模型需要进行大量数据的训练和长时间的实验,因此开发银行大模型需要长期战略发展规划,需要投入高性能设备、庞大的算力资源、长期的无回报资金以及专业的技术人员支持等,这使得该技术在开发阶段就存在很高的准入门槛。据公开财报数据显示,多家国有银行在金融科技方面投入都是百亿级别,多家股份制银行投入占比在近几年出现明显提升。

除了技术门槛高,成本高之外,最不确定的是人才的缺失,对于目前金融人工智能领域,不仅仅是技术人才的缺失,更多缺乏的是复合型人才银行大模型人才不止需要拥有人工智能领域的知识储备,还需要具备所处垂直行业的知识,也可以说即使学了大模型知识但缺乏对于行业、业务流程、数据的认知也是无法称之为大模型人才。腾讯云副总裁胡利明表示,AI 大模型的人才缺口非常之大,头部机构目前都在招一些 AI 专业相关人才,如算法博士等。

当然,银行虽然可以从大模型厂商处获得一定的技术支持,但落地到场景中还是需要银行具备一定内储人才,能够对整个大模型的场景应用进行构建、运营、规划以及创新,在内部使用中不断试验新参数、新场景,不断与外部厂商协作,共同调准、调优和调精大模型,不断拓展大模型应用的场景和效果。业内人员表示," 大模型是半生品,离成品还差得很远,必须是领域内的人一块努力才能做成成品。"大模型的应用可以解决传统效率上的问题,但是归根到底要使银行得到真正的提升还是得回归到打造一支既有技术又明白银行战略规划和需求的团队上。

数据来源、数据质量和隐私保护问题

银行内部存在海量的数据,其中包括交易数据、客户信息数据、风控数据、绩效数据等,由于对数据源头的存档要求,银行数据中包含了大量非结构化数据,如图片扫描数据,这些非标数据不仅占用了大量的存储资源,还可能产生重复记录,但因无法进行标准化整合、分析和利用,大大降低了员工和设备的运行效率。大模型的出现可以很好解决这个问题,但是它也需要大量的数据进行训练。由于存在改制、变更、优化等因素,银行积累的数据可能存在数据质量问题,包括数据遗漏、数据约束、数据安全等问题。

一是数据遗漏,也可以称为数据缺失,它包括完全随机丢失、随即丢失和完全非随机丢失,造成数据缺失遗漏的原因可能是信息暂时无法获取,人为没有记录、遗漏或丢失,数据采集设备、存储介质等设备故障等,特别是年份越久远的数据越可能出现缺失。在这样缺失的数据库背景下,训练出来的大模型可能会产生 " 偏见 ",失去部分有用信息和反馈,特别是对于特殊案例,由于数据量少,这个数据群体表现出显著的特殊性和不确定性,一旦数据产生缺失可能导致确定性成分再次降低,从而使得大模型输出的结果不准确。

二是数据约束。由于银行之间存在信息壁垒,仅仅依靠自家数据所训练的大模型可能存在 " 偏见 ",例如有些银行对公部门强但零售较弱,就可能出现对公数据较全面但零售数据缺失的现象,因此训练来的零售大模型精准度存在一定偏差。金融大模型需要大量的数据,而目前银行业之间进行数据共享存在难度,这不仅仅是公司层面的 " 不愿意 ",用户也会担心隐私信息泄露,因此目前大行的大模型准确度优于其他银行便是因为它占据了数据源更丰富的优势。

三是数据安全,能解决数据约束问题最好的方式就是数据融合和数据共享,但是这便面临着数据安全的问题。由于大模型的普世性较低,更多被理解为 " 暗箱 "、" 黑盒 ",这也是许多 LLM(大语言模型)的通病,而金融行业对于决策的容错性很低,一旦发生问题,后果则非常严重,会出现公司和客户隐私泄露、资金损失、金融欺诈等风险,因此这样 " 不可解释 " 的结果并不能给用户传递安全感,从而导致部分客户的抵制。

运行过程中的算力和存力配置问题

大模型可以将传统应用中耗时几月进行数十亿级别的文件处理压缩到一天内,这是一个百倍千倍的提升,这也同样对算力和存力进行了相应的提升要求。

首先是算力建设,对于大模型的研发来说,最大的挑战之一就是对庞大的算力基础设施的需求。训练大模型的算力平台并不是算力的简单累加,随着模型的规模的增大,低单卡算力也会被淘汰,因此伴随着大模型的升级以及算力的提升,硬件的成本也在持续上升。此外,算力平台的构建的难点在于服务器、存储、 网络等硬件设备的集成以及继承后训练设备软硬件兼容性和性能的 know-how,要搭建最坚实算力平台的方法就是自建算力,但这也存在成本高昂的缺点,目前只适用于资金实力雄厚的大型银行机构。对于中小银行而言,由于投入成本和回报率原因,更多采用算力混合部署的方式,即在敏感数据不出域的情况下,接受从公有云上调用大模型服务接口,同时通过私有化部署的方式处理本地的数据服务,但这也存在安全性低的缺点。

其次是存力建设,存储平台实现数据的高效流动,从而衔接整个大模型的开发训练和应用,没有高性能的存力性能则无法支撑大规模数据的存储、读写和传输。大模型数据集要求加载的速度,这就需要有匹配的存力支持,以避免无法将数据及时加载到 GPU 中,造成昂贵算力空转。当数据和处理文件达到一定数量时,大模型要求存储系统具备强大的元数据管理能力,这包括数据加工处理、数据调度、数据异常处理等能力。此外,高存力能够保证模型训练中断后能快速回复训练,且尽可能不出现前后不一致的现象。

对客层面的可解释性和信任度问题

大模型的决策过程往往难以解释,这使得银行难以向客户解释模型背后的计算逻辑,这也是部分客户不信任大模型不愿意托付数据的原因。此外,大模型在生产内容的过程中,可能会产生 " 幻觉 ",即由于训练数据及模型的不全面而产生事实性的错误,这更加重了阴谋论者对大模型的猜忌。目前已有公司正在尝试解决这一问题,OpenAI 公司加强了对大模型迁移学习和对抗训练,数据显示,在经过调教过后的大模型回答准确性提高了 40%。由此可见,随着模型的优化和数据库的建设和完善,大模型的准确率是可以得到大量提升的,一旦在银行端的应用回答准确率达到一定水平就可以解决客户信任度的问题。

开发后所引发的内部员工 " 恐惧 " 问题

伴随大模型越来越广泛的应用,已在银行业内掀起了一波 " 将本增效 " 热潮,这对金融行业的人员结构带来新的挑战和变革。招行金融科技高层人员分享了大模型对人的替代效应,他表示如今招行内部已建立文档信息归总的大模型,它能够对每日会议内容快速形成纪要,能够撰写高满意度的汇报文案……大模型对内部员工工作的执行效率进行了质的提升,可以说它替代了以前 " 白嫖 " 实习生和初级员工所能进行的工作。

随着越来越多工作被人工智能替代,甚至代码都可自动化,这就意味着一切与数据、编程相关的岗位都受到了大模型的 " 威胁 "。据钛媒体 APP 了解,目前许多互联网、金融科技公司正在裁员,其中包括大数据分析师、产品经理等多种与数据相关的岗位,而银行保险业则早就在裁员行列中的,这也是 " 打工人们 " 所担心的。

大模型设计的初衷是将本增效,虽然一定程度上会减少重复劳动力,但不代表完全替代人类劳动力。部分银行明确不希望大模型带来减员,如拥有 20 万网点员工的工行,它明确向华为提出,他们不希望员工被大模型取代,而应该是大模型带来新的机会,提升员工的服务质量和工作效率,同时也释放出部分员工,做更多高价值的事情。大模型发展是人员优化为目标而非人员缩减,这其中存在对公司员工和结构稳定性的考量,同时也因为银行仍存在很多机会和岗位人才缺口,这部分工作是大模型暂时无法取代的,因此这部分工作需要员工先进行开发。据钛媒体 APP 了解,重点发展金融科技银行的 IT 部门仍承担了很多工作和排期问题,存在 " 劳动力不足 " 的情况,因此大模型的出现是为了帮助员工将效率提高,更快实现需求的落地,而非裁员。

目前从学术学校层面出发,人工智能专业知识已相对完备并且学习人工智能专业的人才已比比皆是,相比之下,拥有大模型课程的学校则少之又少。市面上已有对人工智能专业的学校排名榜单,但对于大模型专业的信息却非常局限,一是缺乏开设相关专业的学校,二是学校缺乏相关专业的老师进行授课,三是缺乏系统性学习的材料。目前大模型行业的专家多是出自于传统计算机科学与技术专业,由此可见科技的发展带动人才的转型,专业并不限定职业和发展。

银行大模型的稳定和成熟还需要时间

有业内人士认为,金融大模型的热度还可能持续一年至两年,到第三年在专业领域或许会大规模涌现成熟应用,第五年后开始进入高速增长期。一项新兴技术大致都需要经历快速涌现、试错发展、监管整治、理性发展四个阶段,对于现阶段的银行大模型,技术仍处于探索和试错阶段,因此要解决上述困境并不是技术上的不可达到,而是需要时间上的尝试和积累。(本文首发于钛媒体 APP,作者|李婧滢,编辑|刘洋雪)

更多宏观研究干货,请关注钛媒体国际智库公众号:

相关推荐

​知乎AI革命:智能搜索与实时问答的融合

​知乎AI革命:智能搜索与实时问答的融合

164

知乎AI革命:智能搜索与实时问答的融合 在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角: 它是大语言模型预训练中文语料最重...

​他,华为芯片之父,直到退休都鲜为人知

69

他,华为芯片之父,直到退休都鲜为人知 文|华商韬略,作者丨张静波 近日,华为芯片的奠基人、原海思总裁徐文伟在朋友圈宣布,正式退休! 这个为华为默默操劳了 33 年的第一代创...

​宁德时代,一道“防波堤”

​宁德时代,一道“防波堤”

79

宁德时代,一道“防波堤” 作者|Eastland 头图|视觉中国 2024 年 3 月 16 日,宁德时代(SZ:300750)披露了《2023 年报》。 2023 年,宁德时代营收 4009 亿,同比增长 22%;扣非净利润 401 亿...

​2024年,中国汽车的三场关键战役

191

2024年,中国汽车的三场关键战役 文 | 新商业派 上世纪 50-60 年代,传播学者埃弗雷特 · 罗杰斯在研究美国农民使用杂交玉米种子时,发现了一个有趣的情况:不是所有人都愿意从一开...

​蔚来“降价”为何总是绕着弯儿

​蔚来“降价”为何总是绕着弯儿

119

蔚来“降价”为何总是绕着弯儿 出品丨虎嗅汽车组 作者丨周到 头图丨视觉中国 如果只是单纯的降车价,未免显得有些太缺乏技术含量了。 在 3 月初的一场沟通会上,当被问及蔚来会...

​直升机出行的时代,真的来了吗?

​直升机出行的时代,真的来了吗?

223

直升机出行的时代,真的来了吗? 本文来自微信公众号:豹变(ID:baobiannews),作者:徐鹏霖,编辑:邢昀,题图来源:视觉中国 从百色西林县开往隆林县,八九十公里,直升机约...

​上市险企保费增速放缓为哪般

​上市险企保费增速放缓为哪般

189

上市险企保费增速放缓为哪般 经济观察报 记者 姜鑫 2023 年年报正式披露前夕,几家上市险企披露了 2024 年前两个月的保费收入情况。在保费增速方面,8 家险企出现分化。 数据显示,...

​袭击者是谁?什么目的?莫斯科恐袭的关键信息

​袭击者是谁?什么目的?莫斯科恐袭的关键信息

208

袭击者是谁?什么目的?莫斯科恐袭的关键信息 当地时间 22 日晚,俄罗斯首都莫斯科 克罗库斯城 音乐厅遭恐怖袭击,截至目前已造成 143 人死亡。初步信息显示,死亡原因是枪伤和燃...

​“我,月入5000,靠积存金攒下两根金条”

​“我,月入5000,靠积存金攒下两根金条”

182

“我,月入5000,靠积存金攒下两根金条” 中新经纬 3 月 23 日电 ( 李自曼 ) 月薪三千也能攒金 无痛存金 攒金子才是硬道理 ……近期,伴随着黄金价格的上涨,银行的黄金积存业务也变...