2025-09-30 来源: 《银行家》2025年第9期
作者 | 李悦 徐奇 宋大为 王彦博
当今时代,人工智能(AI)已经成为推动社会进步和经济发展的关键力量。特别是在金融领域,AI的应用不仅关乎金融服务的质量和效率,更是防范金融风险、促进金融创新的重要手段。量子科技作为推进AI发展的新质生产力,对于解决小样本学习(Few-shot Learning,FSL)问题颇具成效,其在金融行业展现出巨大应用潜力。本文创新性地将量子K最近邻(Quantum K-Nearest Neighbors,QKNN)算法应用于商业银行智能风控场景。该算法的核心思想是将经典K最近邻(K-Nearest Neighbors,KNN)算法中计算距离的方法使用量子态距离进行替换。实证分析结果表明,在样本量很少且“坏”样本量极少的情况下,QKNN算法能够实现良好的判别式AI建模效果。这为商业银行解决小样本学习问题提供了量子AI解决方案。
小样本学习应用研究
在数字化浪潮中,互联网技术的快速发展和广泛应用,给各行各业带来了数据量的爆炸性增长,这加速了人工智能技术发展。何清等(2014)指出,大数据环境下神经网络等仿生计算模型的提出,使机器能够通过参数优化模拟人类认知过程[1];而孙志军等(2012)提出,深度学习的层次化特征学习机制不仅实现了对生物神经系统的功能模拟,更直接推动了数据挖掘范式从浅层分析到深层语义理解的变革[2]。尽管这些领域在大数据背景下正发展成熟,但人工智能与人类智能仍存在差距——人类能从小样本数据中快速学习并进行准确判别,而机器在小样本学习上泛化能力较弱。因此,小样本学习能力对于人工智能技术发展至关重要。
小样本学习的目标是,在样本量极少的苛刻环境下,通过模型训练得到具有较高泛化能力的判别式AI模型。一直以来,关于小样本学习的研究始终是国内外相关领域研究者的关注热点。2022年3月,周梦等人在神经网络算法中加入专家经验规则[3]来解决小样本学习问题,与其它方法相比,融合专家知识的神经网络能够提高模型精度。2022年5月,吴永飞等人面向产业数字金融风控领域,提出运用关联规则挖掘技术进行建模[4]来解决小样本学习问题,得到了较好的建模效果。2022年10月,吴永飞等人面向银行智能风控领域,开展基于量子神经网络算法的小样本学习技术应用研究,并提出了小样本学习技术发展的“6M”框架方法论[5]。2023年3月,吴永飞等人将量子支持向量机算法应用于银行小样本学习智能风控领域[6],实证分析结果表明基于SMOTE样本增强的量子支持向量机算法模型应用效果良好,在相应的模型评估指标上优于其他机器学习算法模型。
量子K最近邻算法技术方案
K最近邻(KNN)算法是由Cover和Hart在1968年提出的,它是一种在二分类(或预测)任务中被广泛使用的机器学习算法。KNN算法的核心思想是当有一个待分类(或待预测)的新样本出现时,通过特定的距离度量方法(如欧几里得距离、曼哈顿距离等),去计算这个新样本与训练数据集中各个样本之间的距离,并从已经算好距离的训练样本中,挑选出距离新样本最近的K个样本,从而决定该新样本的类别(或预测值)。
量子K最近邻算法金融应用研究
业务理解及数据理解
本文参考《数字金融领域小样本学习技术创新》[5]一文中提到的银行业务场景,并采用文中所描述的“加盟平台型”数字金融业务数据。本文进一步聚焦相关业务数据中的物流类客群,从之前的数据集中进一步提取了相关数据样本,开展QKNN量子智能风控算法建模的数据准备:按照近年来产品类型为个人经营性贷款且贷款额度在50万元以下、贷款利率在8%以下、还款期限为3-6个月,且借款人在该银行的累计经营性贷款总金额不超过500万元、贷款逾期不超过2.5个月、借款人信用卡总授信金额大于50万元、正常贷记卡共享额度不超过40万元,同时借款人的央行信用评分在675-935之间,提取相关样本作为实证分析数据开展建模研究。对经过上述条件筛选出的数据样本集,定义“坏”样本为逾期10天及以上的样本,“坏”样本占比约5%。该数据样本集共包含10个解释变量,其中包含历史逾期类变量2个、历史额度类变量4个以及时间和查询类变量4个。
实证分析结果
本文运用QKNN算法,对银行智能风控小样本学习问题进行研究。为进一步验证算法模型的有效性,本文针对相同数据集同时构建了K最近邻、逻辑回归、决策树、随机森林、XGboost和神经网络等经典算法模型,并将模型结果进行对比分析。本文将数据集按照1∶1随机划分为训练集和测试集,并针对训练集样本量从40递增至70的情况进行模型验证。为了排除模型结果的偶然性,在每个验证样本量下采取50次随机抽样进行模型的训练和测试,根据大数定律,多次抽样数据形成模型平均评估指标(AUC、KS、Recall)。不同样本量不同模型的评估指标结果如表1和图2-4所示。
实证分析结果表明,基于AUC、KS和Recall模型评估指标,训练集样本数量从40到70逐步递增的过程中,QKNN算法模型效果均优于经典机器学习的K最近邻、逻辑回归、决策树、随机森林、XGboost和神经网络算法模型,同时,在训练集样本量大于50时,QKNN算法模型评估指标AUC稳定在0.7以上,展现出量子AI对解决小样本学习问题的有效性。
结语
本文立足商业银行业务实践,面向智能风控典型业务场景,创新运用QKNN算法模型对小样本学习问题进行研究,并将此方案与不同的经典机器学习算法模型进行对比。实证分析结果表明,QKNN算法模型在AUC、KS和Recall模型评估指标上较经典机器学习算法模型有着明显的提升。本文为商业银行解决小样本学习问题提出了新思路、新方案,为金融数字化转型、智能化发展提供了强有力的量子AI技术支撑。
作者单位:美国纽约大学文理学院、龙盈智达(北京)科技有限公司、北京理工大学计算机学院
责任编辑:魏敏倩