重塑城市:AI驱动的城市模型如何改变治理
2023 年,英伟达科学家团队将 GPT-4 接入 Minecraft(「我的世界」)游戏,提出了全新的 AI 智能体 Voyager。随着 GPT-4 不停歇地探索世界,Voyager 逐渐掌握了挖掘、盖房、打猎等生存技能,同时扩充自身物品和装备,并在没有人为干预的情况下持续获得新发现。例如,如果发现自己是处于沙漠而非森林中的环境,智能体就会知道学会收集沙子和仙人掌,比学会收集铁矿更重要。
" 由此展开,我们希望有个 AI,通过给他设置改良、优化城市的任务,它便会根据当前的技术水平和城市状态提出适当的任务,相当于做城市体检和城市规划。" 腾讯研究院资深专家、教授级高级城市规划师王鹏如是畅想 AI 在城市甚至是人居环境的应用场景。
王鹏认为," 城市大模型 " 需要基于环境反馈来完善策略,将掌握的策略与反馈记入记忆,并在类似情况下重复使用,相当于落地实施,还需要在实施过程中不断深化对城市的认知,动态地修正规划和策略;因为城市的改良,没有最好,只有更好,所以它需要持续探索城市——以自我驱动的方式寻找新的任务。
在腾讯研究院发布的《生成式 AI 人居领域应用趋势调研报告》中,有资深城市规划专家认为,在 AI 发展的早期阶段,基于规则的定量建模和专家系统,对城市规划起着关键的作用。虽然深度学习的出现带来新的可能,但它仍然与这些传统方法紧密相连。然而,并非所有任务都需要大型模型,对于特定领域而言,小型模型与本地知识库的结合可能更有效。AI 在城市应用的目标,是提供针对各种场景的适当解决方案,并继续探索如何有效地结合各种工具和技术,以实现高效、经济的智能服务。
有没有可能建立一个城市大模型?城市大模型能做些什么?技术驱动将为城市治理带来什么变化?又将可能产生什么问题?基于以上问题,36 氪与王鹏进行一场深入讨论。
城市大模型挑战:超越文本数据的复杂处理需求
2023 年,随着通用大模型的快速发展,全世界看到了 AI 技术在城市治理中的潜力。王鹏认为,尽管现有的通用大模型在特定行业中应用仍有限,但它们在处理复杂系统问题上展现出了前所未有的能力。
因此,考虑发展更专业的行业大模型,如城市大模型,以支持更精细的城市管理和规划决策。这种模型可以帮助解决城市的各种问题,提升治理效率,再通过高质量数据和精调,实现真正的智能城市管理。
从具体研发角度看,截至目前,除了如生物基因蛋白质分子结构、时序时空这些特殊模态的大模型外,从零构建行业大模型没有必要,主要挑战在于算力成本。
官方数据指出,GPT-3 数据集的体量为 753GB,LLaMA4 的为 828.2GB。以 1000GB 的数据模型为例,这相当于需要处理超过 500 亿份城市总规说明书规模的文本数据,每一份说明书的字数大概是十万字。这一巨大的数据量,侧面反映了行业大模型构建时所面临的高算力成本和技术门槛。
在城市领域,一些关键的行业知识,如规划文本、政策文件、和法规规范是难以完全通过文字表达的,这些知识的复杂性超出了简单文字的范围。此外,城市领域还涉及需要通过图纸等多模态数据处理的内容,这类信息更是无法简单地转化为可直接计算的格式。因此,建立城市大模型需要处理的不仅仅是文字数据,还要涵盖多种格式和类型的复杂信息。
在训练方面,达到所谓的 " 智能涌现 ",仍然是一个未知数。一般而言,GPT3.5、文心一言、通义千问、GLM 达到 " 智能涌现 ",背后支撑的参数规模为千亿以上。这种智能涌现是处理复杂城市系统时,极为重要的能力。
然而,大多数行业大模型的参数规模通常只有百亿级别,为了保证调优的效果、效率和性价比,这样的规模是必要的。因此,这些模型虽然名为 " 大模型 ",但在真正的智能表现上,可能只能达到形似而非神似,难以满足通用人工智能的高级预期。
截至目前,出于经济性的考虑,使用 LLM 模型应用,仍难以构建商业闭环,除了需求方对技术的理解参差不齐,成本也是一个无法绕过的难题。在一落地的城市相关大模型项目中,仅 30MB 的文本数据,在百亿参数模型上训练一次的成本就接近万元,且训练效果不可预知,但该成本在未来下降的可能性较大。
相比研发出一个行业通用大模型,基于基础大模型的能力,进行应用开发,将成为行业大模型的 " 主流形态 "。
不同于以往的通用大模型,城市大模型通过精准的行业数据训练,致力于解决复杂的城市问题,如公共服务优化、城市规划和治理效能提升。这个应用,关注的不是模型本身,而是具体要完成的任务,实现技术与城市需求的高度融合。
应用场景:辅助决策、敏捷治理、政务服务
王鹏认为,相比于专业人士对于 " 大模型 " 的认知,如何统一各方参与者对于 " 城市 " 的认知,是更难的事。他认为,无论是面对信息技术厂商、人工智能技术专家,甚至是面对城市政府,这些角色脑子里的 " 城市 ",都不是规划师脑子里的 " 城市 "。
如果以商业闭环的逻辑开发城市大模型,较为合理地是应用于公共服务与公共管理领域,其背后资助方是地方政府。王鹏坦言:" 虽然大模型技术好像很高大上,但相比之下,现有应用一点都不科幻,请做好心理准备,现实就是骨感的。"
截至目前,城市大模型的应用场景有几类,包括辅助决策、敏捷治理、政务服务等。
在辅助决策方面,大模型可以通过提供数据分析、案例对比等方式,帮助决策者进行更全面和迅速的决策。例如,通过整合城市数据库,大模型可以实时回答领导的各种查询,增强决策的信息支持。
近年来,城市大脑、产业大脑等信息化项目,在一定程度上完成了一些城市数据的汇聚。因此,目前最易落地的应用场景,就是整理汇聚数据库,用大模型能力进行基于语义交互的、灵活生成的数据分析,可以实现领导随心问,大模型即时答。一定程度上是对上一代 " 领导驾驶舱 " 的升级。
王鹏表示:"AI 负责全面正确,人类负责作出艰难的选择,是决策过程中 AI 与人类分工的理想界面。"
敏捷治理方面,是利用大模型快速响应公众需求,改进传统的政府运作模式。这包括快速识别市民问题,自动化处理反馈,以及优化政策执行过程。
类似纽约市政热线 311、北京市民服务热线 12345 ——从源头上快速回应需求,对于这些问题与诉求的广泛采集与快速回应,大模型技术可以很好地提供支持,包括对问题诉求的快速识别、总结提炼、派单分发、基于过往案例经验、法规条例的处置建议。该功能同样需要一定知识输入,也可能涉及多模态大模型。
政务服务方面,大模型通过智能问答系统,提供政策咨询和办事指南。 相比于辅助决策、敏捷治理,政府服务可以理解为 G to C 服务的属性,大众更容易感知。各级政府、各相关部门及事业单位,根据法律法规,为社会团体、企事业单位和个人提供的许可、确认、裁决、奖励、处罚等行政服务。政务服务线上平台,通过打通不同部门的信息系统,打通线上线下服务,减少烦琐的手续和流程,让群众、企业更快速地办理各种事务,提高行政服务效率。
以上各场景均显示了大模型在城市管理中的潜力,但同时也需要大量的数据输入、高水平的技术支持和持续的优化才能实现最佳效果。
城市大模型的构建和应用,虽然面临诸多挑战,如数据整合、模型训练的高成本和技术门槛,但其潜在的优势和长远的应用前景是显而易见的。在未来,这些模型不仅可能在单一城市中发挥作用,更有可能在全球范围内被复制和推广,成为城市发展和管理的新常态。
通过深化行业知识的应用和技术的不断优化,城市大模型预计将引领一个更加智能和高效的城市治理新时代。
当然,相对于建立完整城市大模型的长远目标,生成式 AI 近期在人居领域已经有很多的应用。《生成式 AI 人居领域应用趋势调研报告》中就涉及了关于规划、建设、运营等环节的多个应用。
在腾讯正在建设的前海总部,正打造一个 " 人、机、环境全面友好的未来城市原型,这里将集聚一系列数字科技领域的创新实验室群及相关设施,包括以机器人、人工智能、音视频、未来网络、未来出行、碳中和等为主题的多座建筑,为企业的科学家和工程师提供集办公、研发、测试、发布、交流为一体的创新空间。同时也发起了未来城市 AI 创意设计大赛,面向公众征集更富想象力的设计。用生成式 AI,帮助所有普通人表达对未来的想象。
36 氪作者 | 宋虹姗