2025-04-30 来源: 《银行家》2025年第4期
作者:吴永飞 沈 宇 魏文术 王彦博
原标题:大语言模型实现判别式AI在数字金融中的应用研究
随着大语言模型(简称“大模型”)技术发展,人工智能时代已逐渐从判别式AI走向生成式AI,各金融机构纷纷积极探索大模型技术应用场景。商业银行在日常经营管理过程中,存在大量判别式AI任务,通常需要建模工程师根据业务需求构建机器学习模型。本文提出将生成式AI和判别式AI相融合的技术方案,利用大模型的推理能力对需求进行拆解,自动化地开展判别式AI模型的构建。实证结果表明,该方案在保证建模效果的同时,能够有效提升建模效率、降低成本,为商业银行实现判别式AI模型构建,积极推进数字金融发展,提供了新的解决思路。
金融判别式AI的技术发展
金融永远不变的核心本质是风控,其实质是运用现代数字技术将数据算料通过算力、算法等新型基础设施平台加工成为智能,从而判别风险,降低由业务参与各方信息不对称性带来的业务不确定性。数字经济时代下,为快速实现数据价值的深度挖掘,加快银行数字化转型,商业银行运用人工智能机器学习技术防风险、拓市场、保合规,实现经营管理的降本提质增效,银行已经构建了大量判别式AI模型,在智能风控、精准营销、智慧经营、依法合规等领域全面推进数字金融发展。例如,在智能风控方面,判别式AI模型广泛应用于信贷业务的反欺诈、反洗钱、风险评价、风险预警等业务判别;在精准营销方面,判别式AI模型为各层级客群的产品推荐、价值提升、流失预警等业务提供决策支持;在智慧经营和依法合规方面,针对机具设备布放优化、客服运营问题判别、制度分类等场景,判别式AI模型也在持续发挥作用。
大模型技术通过其问题理解和生成能力,能够为商业银行智能风控、精准营销、智慧经营、依法合规等领域的判别式AI模型构建与使用提供新技术方案。本文基于大模型实现判别式AI任务,使用户仅需运用自然语言,无需人工编写代码,即可完成判别式AI模型构建,有效提升了建模效率、提高了建模质量、降低了建模成本。
大模型在数字金融领域的应用发展
近年来,随着生成式AI的不断发展,大模型相关技术也在不断升级迭代,持续助力金融领域的数字化转型与智能化发展。目前,在数字金融领域的应用过程中,所涉及的大模型相关技术主要包括提示词工程(Prompt Engineering)、检索增强生成(Retrieval-Augmented Generation,RAG)和智能体(Agent)等。
提示词工程是通过设计和优化输入内容,引导大模型生成符合用户需求的输出,无需对大模型进行调参。好的提示词可以激发大模型在文本生成方面的创造力,发挥大模型的创作优势。提示词工程在银行数字金融领域的应用场景丰富多样,通过优化提示词设计,能够显著提升大模型在不同业务领域的效率和准确性。在办公自动化方面,用户可以通过提示词工程技术,将生成会议纪要、演讲稿等需求输入给大模型,大模型依靠其强大生成能力为用户提供相关文档生成服务,提升办公效率。在产品创新方面,用户可以通过提示词工程技术,将产品的内容、优化方向和市场需求等输入给大模型,随即大模型能够生成产品优化的建议以及相关说明,助力银行快速响应市场需求进行产品迭代创新。
RAG技术通过动态检索相关信息来增强语言模型的生成能力,提升内容生成的准确性和相关性。通过RAG技术,能够有效解决大模型在数字金融领域的知识局限性和幻觉问题,同时保障数据安全。RAG技术在商业银行各业务领域应用广泛。在运营管理智能客服场景中,以银行产品信息和客服历史回复相关数据形成向量数据库,当用户对产品进行提问时,通过大模型RAG技术基于相关向量数据库的信息进行回复,从而优化服务质量,提升客户满意度。在法律合规合同审查分析场景中,将业务部门送审文本、后台储存的历史合同等信息构建向量数据库,当客户有相关合规问题时,通过大模型RAG技术定位信息,生成符合银行内部数据逻辑的反馈。在普惠金融客户营销筛选场景中,将客户工商经营状态、纳税状态和社保缴纳状态等多源数据信息构建向量数据库,当需要对客户进行筛选时,通过大模型RAG技术对向量数据库中的数据进行判断,能有效过滤掉不满足营销基本要求的客户。
Agent是一个感知环境、处理信息并采取行动以实现特定目标的软件程序或系统,它能够在金融领域实现高效、精准的业务处理和决策支持。一个Agent需要具备问题拆解能力、根据环境调用相关工具作出策略的能力以及记忆能力。在风险管理场景中,利用Agent问题拆解能力对风险预测任务进行规划,使用数据分析工具对用户的信用数据和市场动态进行实时分析,准确预测相关风险,提升风险防控能力。在工单智能分析场景中,利用Agent问题拆解能力对工单异常原因分析报告生成任务进行规划,使用数据分析工具对异常工单进行分析,生成话务工单异常原因分析报告,提升工作效率与决策质量。在资产配置和产品组合场景中,利用Agent问题拆解能力对合理资产配置任务进行规划,使用数据查询和分析工具对客户的风险偏好、持仓历史及产品收益表现等信息进行分析,实现自动化、智能化的资产规划、配置比例以及持仓诊断,为客户量身定制专业、合理的资产配置方案。
大模型实现判别式AI应用研究
技术总体方案
本研究依托一个基础大模型,结合提示词工程和RAG技术打造一个可以进行自动化构建判别式AI的Agent。该Agent实现判别式AI模型构建的具体流程如下。
首先基于特征数据及其元数据构建支撑RAG检索的增强知识库,然后根据建模工程师的经验构建提示词模板,提示词中应当包括客户期望对数据的处理方法、构建模型期望选用的算法和模型评估指标等信息,用户只需要与大模型进行自然语言交互请求大模型执行建模任务,大模型即可自动将任务进行拆解,根据具体问题进行思考,编写相应的数据读取、数据处理、模型构建、模型评估等代码,而后调用本地代码解释器完成代码运行,得到建模结果,最后完成整个建模任务,并将模型评估指标返回给用户。具体的流程如图1所示。
图1 大模型Agent实现金融判别式AI模型构建的工作流程图
场景描述
一家企业决定关闭或停止营业时,通常会经历一个正式的法律程序,即“注销”。这不仅表明该企业将不再继续参与市场竞争,同时也意味着它可能会给债权人带来经济损失。从商业银行的视角而言,如果贷款对象出现企业注销的情况,则极有可能导致不良贷款的发生。鉴于此,构建企业注销风险预测模型可以有效识别具有潜在风险的客户,并采取预防措施,降低风险。本文以北京地区新一代信息技术产业企业为例,旨在基于大模型技术实现金融判别式AI,构建企业注销风险预测模型。
本文所使用的数据集包含8个自变量和1个因变量(是否为注销企业),样本量为2433,其中坏样本(即注销企业)占比为19%。建模数据具体的自变量名称如表1所示。
表1 企业注销风险预测自变量特征名称表
建模效果评估
本文通过上述构建的大模型Agent实现了判别式AI模型构建。首先面向宽表数据加工及其元数据构建RAG知识库,然后通过提示词工程向大模型发送指令,让其根据数据及业务描述进行数据处理,并构建判别式AI模型(本研究指定构建逻辑回归、决策树、随机森林和GBDT算法模型),提示词中同时包含了期望使用的模型评估指标(由于本研究应用场景是判别式AI分类任务,故使用AUC、KS、Recall和Precision作为模型评估指标)。而后,大模型根据强大的推理能力对需求进行拆分,完成相关代码编写,并调用本地代码解释器自动化运行,得到建模结果。最后,大模型将结果以表格的形式输出给用户。各个模型的建模结果如表2所示。
表2 大模型Agent实现的企业注销风险预测模型评估指标情况
实证结果显示,通过大模型技术构建的判别式AI模型在保证建模效果的同时,具有以下优势:
建模效率提升与成本节省。在传统建模过程中,大量的人力成本被用于模型构建等重复性工作,通过引入大模型技术,这些任务实现了自动化处理,从而提升建模效率。经测算,运用大模型技术实现判别式AI模型构建可提升工作效率约30%。未来,商业银行基于大模型技术广泛构建各业务条线所需要的大量判别式AI模型,将会有效节省人力成本,实现可观的经济效益。
提升建模工程师的建模质量。在传统建模过程中,建模工程师的能力水平参差不齐,导致所构建的模型质量存在差异。通过大模型技术实现判别式AI模型构建能够建立标准化的建模流程,有效提升建模的整体质量,从而减少因个人能力差异导致的模型效果不佳等问题。
解放建模工程师的“双手”,实现算法提质。通过大模型技术实现判别式AI模型构建,不仅提升了建模效率和质量,还能解放建模工程师的“双手”,从而使建模工程师有更多的时间和精力去深入理解数据逻辑和业务逻辑。通过大模型技术实现判别式AI模型构建,可以构建大部分经典机器学习和深度学习模型,建模工程师可以将更多的时间用于研发新的模型和相关算法,提升建模工程师的整体技术和业务水平,更进一步提升算法建模的质量。
结语
本文基于大模型技术能力,结合提示词工程与RAG等技术,打造了自动构建判别式AI模型的Agent,它能够有效分析用户需求,自动完成数据拆解、建模代码编写和代码调用。实证结果表明,使用大模型技术实现的判别式AI模型与建模工程师构建的模型效果一致。同时,基于大模型的技术方案能够提升建模效率,节省人力成本,降低代码编写的错误率,提高建模质量,促进建模工程师提升对数据与业务的理解以及提升算法研究能力水平。大模型实现判别式AI的应用前景广阔,随着人工智能技术的持续进步,未来将进一步探索大模型实现判别式AI相关技术,例如,使用大模型提取或生成高质量的数据特征和样本,以提升模型构建效果;使用知识蒸馏技术,以提升机器学习模型的可解释性。相关研发将有助于更好地赋能商业银行判别式AI建模场景,推进数字金融新发展。
(本文受北京市科技计划项目〔Z241100001324024〕支持)
(华夏银行数字金融管理部刘小伟,龙盈智达〔北京〕科技有限公司徐奇、张月、杨璇、冯琳和曹晓峰,百硕同兴科技〔北京〕有限公司余浩和林建军,以及北京智谱华章科技有限公司薛大山和王海强对本文亦有贡献)
作者单位:华夏银行股份有限公司
责任编辑:张志敏