1.背景和建设目标
近年来,随着图计算领域技术的快速发展,知识图谱应用已渗透到金融业务的各个层面,并日益成为金融科技的“底层支撑”。随着近年来金融数据的爆发式增长,传统风控系统逐渐无法满足业务需求,而知识图谱技术利用在风险识别能力和大规模运算方面的突出优势,通过创建本体模型,根据实体间关系形成关联数据网的图谱形式,描画个人、企业等各类实体的基础信息、金融行为、关系网络等综合画像,串联大量多源异构数据,挖掘数据深层价值。
在传统的风控运营中,尽管传统的专家规则和机器学习模型在减少欺诈损失方面起到了很重要的作用,但随着科技的发展和黑产产业链的日趋成熟,欺诈手法也在不断升级,有组织的、大规模的、团体性的作案方式屡见不鲜,传统的风险防控手段也无法及时、准确地评估客户风险,进而无法有效应对新型的欺诈手段。
兴业数金自2021年天网工程知识图谱赋能场景上线以来,在知识图谱技术的应用上持续探索研究,实现了在观察视角上从“个人维度”到“全局关系”的转变,反欺诈手段由“由点到面”的提升,个体隐藏关联欺诈风险“由浅到深”的挖掘,为我行智能化风控提供重要基础。
2.知识图谱平台实施路线
2.1 平台规划与建设
经过市场调研分析,一个完整的知识图谱平台,需要具备如下基本能力:
1. 图形化的数据建模能力:能够通过图形化界面快速构建图谱模型。
2. 高效的数据存储和查询能力:能够快速存储和查询大规模的图数据,提供高性能的查询和遍历功能。
3. 灵活的图计算分析和挖掘能力:能够应用相应的图算法对大规模的图数据进行快速的分析和挖掘,支持知识的推理,提供可视化的图谱分析与展示功能。
4. 开放的API和工具集:需要提供丰富的API和工具集,以便快速构建场景应用以及与其他业务系统集成。
兴业数金遵循图计算服务平台的基本能力要求,打造了一套全行级的知识图谱平台应用体系,如下图所示,基于图数据库的底座支撑,搭建图计算及图谱应用平台,构建关联关系网络,以可视化技术,图算法为基石,提供全方位的图设计、图搜索、图分析、图规则、团伙识别、图探索等功能,满足行内各业务条线对于关联关系特征、规则及模型的快速开发及优化需求,提供一站式图构建、图计算和图应用等服务开放能力,以支撑兴业数金各业务场景应用,帮助业务快速发现风险点、可疑团伙和关联关系,实现“人机结合”形式的智能化分析、研判和决策,有效提升了风险防控及管控水平。

“1+N”模式,一个平台支撑多个场景,降低图谱构建和运维成本
通过构建全行通用统一的知识图谱平台,实现各业务条线的场景图谱的集中管理和知识复用。平台通过低代码、配置化方式实现数据接入、实体关系抽取和图谱更新,并支持批量构建、实时更新多种场景,高效完成图谱构建与更新。同时,提供任务调度管理、图谱评价等运维功能,帮助运维人员快速识别图谱中异常数据及任务。
统一存储配置中心,兼容适配多种图数据库
平台采用组件化、插件化的可插拔架构设计,通过对图查询和图计算的抽象层设计,可快速兼容适配多种图库如JanusGraph、Nebula等,各场景图谱也可独立配置其特有的存储方案,以适应不同场景图谱对图数据库的个性化需求,实现各图谱的数据权限安全隔离。
构建分布式图挖掘引擎,支撑百亿级关系图分析挖掘
基于分析挖掘的深度应用需求,平台内置子图抽职、关系推理补全、群组挖掘、图指标计算等各类图挖掘函数及任务模板,同时包含几十种通用、自研高阶图算法及特定场景图挖掘模型,可实现在百亿级关系图规模下完成各类复杂图挖掘任务,有效支撑行内风险传导分析、团伙挖掘等场景。
2.2 落地应用场景及实践成果
2.2.1 信贷申请反欺诈图谱
基于信贷申请的进件数据、客户数据、人行征信数据以及逾期标签、历史客户贷后表现等数据,再结合外部的三方数据如多头借贷数据、外部黑名单、外部欺诈评分数据等,通过数据清洗加工、融合处理,然后再利用知识图谱平台进行知识抽取,构建信贷申请反欺诈关联图谱。以可视化关联分析工具形式,集成到审批系统和风控决策平台,供调查人员进行关系圈的洞察和匹配关联,发现中介包装、虚假进件等聚集和交叉关联模式和结构,为业务决策分析提供工具支持。同时,基于知识图谱关联指标,构建团伙识别模型、关联规则策略,共同为信贷事中检测和事后分析的业务赋能,进一步提升反欺诈调查效率和风险感知侦测能力。
基于所构建的信贷申请反欺诈图谱,以关系拓展和挖掘为核心,对实体及其关系进行直观的可视化展示,同时结合图计算引擎为用户提供多维度、多层次的分析模式,支持单一个体的画像、关联路径分析到群体的集中性识别、关系演变分析,帮助用户快速完成数据探索、关系挖掘、案件调查等任务,实现数据到智慧、智慧到决策的转变。
申请反欺诈通过引入知识图谱技术,大大提升了风控效果,不仅有效帮助业务部门识别出多种隐性风险,如中介包装、中介代办、虚假进件等聚集和交叉性关联风险模式,挖掘出数百个风险团伙,解决传统通过规则或模型手段无法快速识别的风险问题,而且还提高了业务人员的风险案件排查分析的效能。
2.2.2 企业关联关系图谱
融合行内企金工商客户多源业务数据,如对公CRM、ECIF、银行核心、对公信贷等数据源,并结合行外企业工商相关数据补充,进行数据清洗、知识抽取、知识加工、知识融合,构建全面的对公企业关系图谱,深入挖掘企业客户股权/投资关系、集团派系、企业上下游产业链、资金链、产品链上的金融服务需求,实现基于知识图谱技术的企业关联洞察、集团派系授信管控、关联风险识别、客户营销等业务应用。
通过融合行内外相关对公企业数据,建立企业360度全景视图,全方位展示企业工商信息、高管信息、上市信息、经营状况、关联关系、风险事件等等,实现企业客户的多维关联洞察。
基于所构建的企业基础关系,通过知识推理技术挖掘企业间的隐性关联关系,按照行内集团统一授信管理办法认定标准,利用图谱挖掘技术深入挖掘符合规则的全部企业,形成基于企业客观全貌的关联族谱。
基于行内客户抵质押物、连带保证等信息,全面梳理担保关系,挖掘普通担保、相互担保、循环担保等担保圈链,识别异常担保类型和担保链路,以全面掌握企业的担保风险状况,有效防范和化解担保圈贷款风险。
采集信贷系统、核心交易流水、贸易融资系统上下游企业信息,以群组的形式直观展示企业产业链信息,分析企业在产业链中的地位及主营业务,发掘优质的企业客户,根据产业链客户需求营销供应链相关产品;分析上下游企业间的担保及应收应付账情况,根据行业特征及时推送风险及产品营销信息。
通过构建对公企业图谱,充分应用企业间的关联关系,有效挖掘潜在客户商机,捕获并及时防范隐匿的关联风险,全面提升存量客户价值,助力对公业务不断向前快速发展。
3.知识图谱平台应用未来发展方向
离线场景大规模图数据的高效处理能力和实时场景高并发、低延时的图计算能力或是未来知识图谱建设的重点和难点。而图数据库对以上能力的建设起着至关重要的作用,图数据库大规模数据存储能力和查询能力以及实时图更新、实时图计算的能力自然是未来图数据库能力选型的关键所在。
另一方面,近年来以图神经网络为代表的图学习技术掀起了研究热潮,通过学习节点和边之间的关系,从图数据中提取有用的特征和模式,可用于预测、分类、聚类和异常检测等任务。图学习技术有助于解决过往机器学习算法可解释性低等问题,如何解决图学习在内存、硬件方面的瓶颈及大规模图深度学习的难题并应用于金融场景产生业务价值,是知识图谱未来探索的另一重要方向。
作为一项典型的金融科技创新技术,知识图谱在反欺诈、反洗钱、反套现和精准营销等众多场景中拥有广泛的应用。随着业务的发展和技术的成熟,兴业银行将在知识图谱应用场景上继续深入研究,为银行业务带来“由点到面”的提升,实现个体隐藏关联欺诈风险“由浅到深”的挖掘,为风险管理智能化发展战略提供重要帮助,为我行数字化转型的建设与增速提供了重要能力基础。

