本报记者 李晖 北京报道
大模型正在成为推进金融业数字化的第二波浪潮。
在对新技术最敏感也最谨慎的金融业,虽然大模型的渗透仍处于初期,但没有一家机构对其“不关注”,一些大厂(大型互联网公司)甚至一度“门庭若市”。近半年来,银行、券商、保险等传统金融机构,以及金融科技公司、隐私计算类公司纷纷下场。
“今年4月我们银行领导计划拜访主要科技公司,一接触发现竟然‘需要排队’,很多大型银行、头部股份制银行是董事长、行长级别带队去调研。”一位国有大型银行技术高管向《中国经营报》记者透露。
值得注意的是,大模型除了进一步提升金融行业数字化水平之外,是否能带来质变层面的利好尚需时间检验。中国工程院院士、复旦大学金融科技研究院院长柴洪峰在今年7月的一场公开演讲中指出,从技术面看,金融数据和知识的私密性限制了共享和构建大规模数据集的能力,金融数据的多模态特性增加了模型处理和建模的复杂性。
记者采访的多位从业者认为,大模型是金融行业“必争之地”,但仍要面对技术挑战和行业特点限制。想进一步渗透到风控等金融核心业务,还需要在垂直领域精调,并经过相对完整信贷周期证明。
“塔尖技术”浪卷金融业
大模型是“大规模预训练模型”的简称,主要依据参数规模(即函数的参数数量)来定义,相对于基础深度学习的“小模型”,通常参数规模多于10亿的模型被称作“大模型”。
科技部下属相关单位发布的《中国人工智能大模型地图研究报告》显示,截至2023年5月末,全国参数在10亿规模以上的大模型已发布79个,数量仅次于美国排名全球第二。
腾讯研究院今年7月末的一项调研数据显示,国内参数在10亿规模以上的大模型数量已由5月末的79个增加至116个,其中金融行业大模型约18个。
从公开信息看,5月,大数据基础软件供应商星环科技推出面向金融量化领域的生成式大语言模型“无涯Infinity”;5月下旬,度小满推出国内首个千亿级中文金融大模型“轩辕”;6月底,恒生电子推出金融行业大模型“LightGPT”;同期,拓尔思发布包括金融行业大模型在内的产品;8月底,马上消费金融发布了首个零售金融大模型“天镜”。
而更多的银行机构则由于谨慎和保密的考虑选择“默默发力”。目前,正式披露相关消息的包括工商银行和农业银行。其中,工商银行基于昇腾AI的金融行业通用模型,实现企业级金融通用模型的研制投产;农业银行则通过自主研发推出“ChatABC”,并在行内科技问答场景进行了内部试点。
据记者了解,自然语言处理(NLP)、机器学习(ML)、计算机视觉(CV)、智能机器人(IR)等是人工智能应用最广的几个子领域。
在北京大学光华管理学院商务统计与经济计量系教授王汉生看来,算力、算法、数据构成了新范式的“三驾马车”,好的人工智能算法、模型最终要解决的是业务问题,数据模型落地最重要的是寻找应用场景。
而围绕NLP的大模型则决定了其在金融业务中的主要应用范围。从第一批披露“大模型”相关动作的金融机构来看,应用探索多集中在智能投顾、智能客服、营销渠道、保险理赔、研报撰写等业务场景。
前述国有大型银行技术高管提供的场景列表显示,该行自研的大模型目前已经应用在在线客服辅助、智能知识辅助、法律事务问答、运维知识问答、辅助分析财报、网络安全辅助分析、智能辅助公文生成等场景。从效果来看,智能客服可以持续提升问答结果准确率。
“从行业应用路径来看,科技巨头提供通用大模型,或者技术能力强的金融科技公司提供金融行业大模型,具体的金融机构基于这个行业底层模型,用自己的业务数据去做私域训练,然后做私有化的部署和应用。”度小满CTO许冬亮表示。
根据度小满官方信息,其中文金融大模型“轩辕”开源以来已经有上百家金融机构申请试用。度小满数据智能部总经理杨青透露,“轩辕”大模型2.0版本将在今年10月发布,将会进一步提高对话和金融理解等场景下的能力,实现处理更长的金融报告、研究和分析。
除度小满之外,奇富科技在2023年二季度财报中披露:通过对预训练的深度学习模型和大语言模型进行调优,使得在用户身份识别和行业识别场景下,模型理解能力提高。腾讯云在今年7月披露,其已经推出金融风控大模型。数据显示,应用后客户风控策略部署效率提升10倍。而马上消费金融也在近期发布“天镜大模型”时透露,该模型将应用于营销获客、风险审批、客户运营、客户服务、安全合规、资产管理六个零售金融最典型的场景。
核心业务有待渗透
从制约因素来看,任何AI 大模型都面临着算力需求大、训练和推理成本高、数据质量不佳、隐私和安全问题等挑战。而由于金融行业面对的监管门槛更高,对大模型在数据合规性、可追溯性、私有化部署、风险控制等方面就提出了更多要求。
据记者了解,大模型主要有两个方面需要改造,一是高达上千亿的模型参数,需要算力支持和高可扩展的调度框架;二是巨量的高质量语料训练。而仅在第一个方面,就需要数以亿元级别的投入。
“算力的成本也决定了小机构很难负担,2023年3月我们发现AI服务器市场出现几倍增长。比较幸运的是我们今年年初囤了不少卡(CPU),这也是我们在大模型风起时能够快速跟进的基础。”一家金融科技公司内部人士向记者表示。
而在数据安全方面,前述国有大型银行技术高管透露,银行的大模型业务主要基于开源数据,以及行内已有的数据进行清洗。这要求AI首先要懂本行知识,要支持多轮对话,还要能实现知识更新并对齐人类思维。而如果是引入外部合作方,必须都部署在银行本地。
在金融这种专业门槛极高的领域,所需的“巨量语料”显然不是互联网免费公开的数据,要训练出精度极高的模型,需要的是极其准确专业的知识,甚至是核心付费数据。大模型的幻觉问题(AI“一本正经地胡说八道”)在金融领域更是无法容忍的弱点。
业界倾向认同:通用的大模型往往只能解决80%的问题,而在面向行业细分领域时,还需要结合信贷传统模型在深度学习领域的积累。
马上消费首席信息官蒋宁认为,通用大模型和金融大模型存在本质区别。目前,大模型还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信,以及基础设施的能力四大难题。“生成式模型不能做解释,但是金融大模型最主要的模型叫作判别性,它需要做决策,包括交易决策。”
事实上,当前银行广泛使用的“大数据”风控模型也是伴随互联网贷款业务的发展,历经五年时间,逐步由形式风控走到实质风控,由联合风控走到独立风控,由内部质疑走到广泛接受。从这一逻辑来看,“大模型”显然也需要经过数据的积累周期、完整的信贷周期、市场的接受周期等过程,才可能真正放心地投入到银行信贷的核心环节。
“大模型在金融行业的落地路径需要通过大数据的整合、大算力的合作,在垂直领域精调模型,以小规模算力打造轻量级推理模型。”在光大信托数据公司总经理祝世虎看来,目前大模型在金融领域的应用主要集中在智能客服、智能运营、智能办公等领域,后续应该更多地应用于风险管理、资本管理和监管科技等方向,且对于传统风控难以捕捉的、由小尺度风险传导至大尺度风险的风险刻画,也可能是大模型的优势之一。
“但需要注意,大模型是社会整体生产力级别的提升,会产生‘双刃剑’的效果,即机构在风控、反诈领域性能提升,而黑产、诈骗团伙等也可能会使用这些能力,攻防双方未来可能会在更高科技维度上去对峙。”祝世虎向记者进一步表示。