21世纪经济报道记者边万莉 北京报道在金融行业数字化趋势下,数据对于金融行业的业务决策、风险控制等起着至关重要的作用。同时数据隐私也空前重视,金融领域对数据的管控也更为严格,因此也更需要通过技术手段解决数据孤岛问题。
为克服数据不易流通共享的障碍,打破数据价值释放的壁垒,隐私计算成为关键的技术解决之道,有助于实现“数据可用不可见,数据不动价值动”。星云Clustar的CEO陈沫在接受21世纪经济报道记者采访时表示,“联邦学习作为一种创新的人工智能技术,帮助金融机构实现多方数据融合,同时也能保护数据隐私与安全的一种方法。”
打破数据孤岛、保障数据安全,隐私计算成解决之道
目前,隐私计算技术主要包含三大技术范式,分别为联邦学习、多方安全计算、可信执行环境。其中,联邦学习以理解为两个或以上的参与方共同参与,在保证原始数据不出本地的前提下,协作构建并使用深度学习的模型的人工智能技术。
在原理上,是通过构建一个计算网络,客户可以在自己的终端使用本地数据对模型进行训练,并将模型的更新内容进行上传汇总,将不同重点的模型更新进行融合,实现预测模型优化。陈沫总结,“联邦学习就是数据不动模型动,在数据不出本地,实现联合建模和推理。联邦学习在金融场景中的实战表现,如反洗钱、信贷风控以及营销等等。”
反洗钱的应用。据陈沫介绍,反洗钱传统做法是使用规则和模型,利用银行自身的数据,来判断交易是否为洗钱活动。由于数据维度和样本的不足,传统方法得出的策略和模型的优化空间有限。
他进一步指出,利用联邦学习技术,便能够在银行之间,银行与其他机构之间进行基于数据的反洗钱协作。机构间通过交换加密参数,联合计算建模,解决反洗钱样本少、数据质量低的问题,形成一个稳健、特征丰富的智能模型,通过调用联合建立的模型,不用集合各方数据,银行就能大大提高反洗钱能力。
信贷风控的应用。陈沫表示,“为了提高信贷风控及反欺诈的决策能力,我们构建一个叫做安全数据网络的平台,汇聚各方数据资源,在满足法律、监管合规的前提下,运用多方数据对信贷人群进行差异化和精细化的画像,满足银行或其他金融机构在信贷风控及反欺诈等业务场景的建模需求,同时还能推动其他信贷策略应用的科学化部署,如风险定价、额度管理、贷后管理和预警管理等。”
金融展业方面。在以保护用户隐私和数据安全为前提,基于金融机构的样本数据,可以通过联邦学习引入“一方+三方”进行多方数据联合建模丰富用户特征维度,如行业标签、兴趣偏好、行为习惯等,构建360度的用户画像。从而实现对目标用户的精准定位,实现金融展业的目的。
陈沫认为,隐私计算可以解决金融产业中数据跨机构互联互通的安全性难题,降低隐私泄露风险,在不泄露各方原始数据的前提下,帮助从事数字化转型与智能化应用过程中的银行、保险公司、互联网金融机构等实现跨机构、跨部门的数据安全融合、联合风控建模、联合营销筛选等,提升金融智能的准确性及完备性。
隐私计算实力高低关键在技术优势和生态能力
目前,随着市场对隐私计算相关技术和厂商的需求不断增加,各类隐私计算算法和系统纷纷涌现,市场空间和格局初步显现。从哪些指标来判断一家从事隐私计算相关业务的公司实力如何呢?对此,陈沫向21世纪经济报道记者表示,“一方面,需要具备技术优势,这主要体现在行业认可度;另一方面是生态能力,主要指开放合作的心态和服务效果。”
他进一步解释道,行业认可度是从监管测试和标杆客户两个纬度来衡量。比如,中国信息通信研究院联邦学习产品能力评测,国家金融科技测评中心(银行卡检测中心)联邦学习金融应用评测等。同时,客户自然会挑选出一批技术工程化做得比较好的公司,标杆客户也是公司实力的一个体现。一定程度上,最早进入行业的公司具有先行优势。因为它的技术特点未来可能就是标准化组织里要推的东西。
在陈沫看来,“技术上永远没有谁更厉害,就是我比你快,我比你提前半年给用户用,你就要晚半年。因为先做出一些新的东西给用户先尝鲜,发现不错就会放在标准化里面。友商就会去学,这里面又会出来两三家,会有引领和带动行业的能力。”
生态方面。陈沫表示,“生态力量就是开放合作的心态和服务能力。所有生意本质上是人与人的生意,彼此之间有信任感和认同感的时候,公司的合作就形成了。因此,还是要强调生态的能力。”
值得一提的是,隐私计算技术的发展并不是一蹴而就、一劳永逸的。陈沫告诉21世纪经济报道记者,算力是其中的一个攻克难点。假设一个明文数据是一个bit(注计算机中最小单位)。为了让这个数据不泄露,同时也能够算出里面的东西,隐私计算就需要把它变成1000个bit。但是从信息的角度来讲,没有增加任何的信息,但是负载非常大,以前要一秒完成的,现在变成了1000秒。
“问题就来了,这事值得做吗?”陈沫进一步指出,“因为要隐私,而付出了巨大的算力代价。如果不做算力加速,就无法满足场景的实际需求。这便需要更好、更新的解决方案。在这方面,星云Clustar借助自研高性能算力加速硬件以及网络通信技术一定程度上解决了这个问题。通过软硬件相结合的方式,让隐私计算的效率较之前提升了100倍,满足了行业近两年对算力的需求。”
陈沫表示,展望未来,隐私计算有可能成为面向未来的底层技术之一。所有出去的数据都是隐私的,没有人能够看到,但厂商依然可以提供服务。我们希望数据安全融合变得可行有道,最大化挖掘数据价值;希望打破数据孤岛,拓展数据智能应用的边界,为更多场景赋能。