我们的记者李惠从北京报道
在数据要素化趋势下,数据孤岛等一系列制约金融机构数字化转型的瓶颈,有望迎来解决的契机,这也推动新技术服务提供商加紧进驻。
央行科技司近日披露,已组织北京、江苏、浙江等14个地区的商业银行、清算机构、非银行支付等开展金融数据综合应用试点。其核心是探索人工智能、大数据、物联网、私有计算等新一代信息技术,在安全合规的前提下推动金融数据高效治理和安全共享,实现跨行业数据融合应用,充分激活数据要素潜力。
《中国经营报》记者从央行北京管理部获得的一份文件显示,上述试点由央行分支机构推进,将于6月中旬关闭。“我们已经向合作银行申请了试点项目。如果入选,有望取得更重要的商业示范效应,有助于吸引更多合作伙伴和投资者。”一位上海隐私计算服务提供商高管告诉记者。
记者了解到,如何让数据要素合规流动是目前金融行业面临的巨大痛点,也蕴含着无限的创新可能,这就使得主要解决数据共享安全问题的“私有计算”成为一项关键技术。尽管技术和市场仍处于早期阶段,但大型工厂和初创企业都渴望尝试,这与两年前区块链启动时的势头非常相似。此时,被业界称为“人工智能最后一公里”的赛道将成为大规模市场,相关技术范式是否会成为数据元素化过程中的“技术基石”也备受各界关注。
赛道火热
根据今年4月发布的《腾讯隐私计算白皮书2021》的定义,隐私计算是由两个或两个以上的参与者共同计算,参与者通过协作对双方的数据进行联合机器学习和分析,而不泄露各自的数据的技术和系统。
Wingfang Jianji CEO罗真给人的印象是,从2019年到2020年初,私人计算赛道上的竞争对手寥寥无几。“一个很小的市场,大家都互相认识,但今年已经飙升到几百家了。”他说。
“市场规模起步很快。”星云Clustar副总裁徐震负责设置星云的私有计算技术场景。他发现,自今年年初以来,一些银行已经在私人计算技术基地的第一阶段投资了数百万美元。此外,这种技术服务在大多数外部数据交易中的渗透率保守估计为10%。以去年数据交易市场100亿元的市场规模来看,隐私计算今年至少可以占据10%的份额。
“过去,我们讨论金融机构的隐私计算,主要集中在概念和理论上。今年,金融机构带着场景的需求来到我们这里,深入隐私计算的业务解决方案。”富数码科技合伙人兼高级总监黄告诉记者。
自去年以来,除了最初布局隐私计算的几家服务提供商之外,许多区块链公司也开始转向这一方向。“除了底层密码技术具有一定的通用性之外,更重要的是有更多的私有计算应用场景和更好的业务。”一家行业第三方智库表示。
富数科技、星云Clustar、方毅健树是业内三家知名的第三方隐私计算服务商,分别面向金融和医疗领域——,这也是目前隐私计算应用最广泛的两个场景。记者了解到,金融机构、运营商、政务和医学研究是目前隐私计算技术的主要应用方向,金融场景约占市场的70%至80%。
此外,巨头们也在加紧布局。记者注意到,国家工业信息安全发展研究中心近日发布的《中国隐私计算产业发展报告(2020—2021)》显示,我国隐私计算专利申请数量
65809416410381" mention-index="0">微众银行。而赛道风起亦有其特殊的政策背景和技术背景。
首先是政策驱动。2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,将构建数据要素市场上升为国家政策。在黄奉孝看来,数据作为新的生产要素,其性质在发生质变。这也推动了整个行业的技术重心从“数据获取与存储”升级到“数据开放共享”。“过去十年的数据安全重在防御,未来十年的数据安全重在流通。从各地政府到银行,响应政策进行创新探索的动力都在增长。”
而在技术侧,则是算力性能的快速迭代。由于涉及多方计算,此前隐私计算的性能较慢,一个联邦学习模型训练下来往往需要几个小时。但去年以来,密文训练和明文训练的差距不断缩小。中国信息通信研究院(以下简称“信通院”)云计算与大数据研究所近期披露的数据显示,2020年隐私计算整体速度只比明文计算慢25倍,隐私计算技术已接近产业化。
合规压力倒逼金融机构
但对于金融机构而言,合规压力的驱动可能更为迫切。近年来,在《数据安全法》和《个人信息保护法》即将落地的预期压力下,数据流通市场生态发生深刻改变。
据记者了解,在数据共享过程中,此前的数据市场遭遇了买方和卖方的断裂,“不给做不了,给了不允许”成为金融机构使用数据时的巨大痛点。
合规压力之下最终会导致业务需求倒逼。一位大数据行业资深从业者告诉记者,目前跨机构的数据流动遇到了瓶颈,很多外部数据金融机构在引入时有顾虑,间接导致风控迭代停滞。“一家持牌消费金融公司因为此前遭遇外部数据源切断,针对某一业务的风控模型不再奏效,必须收缩业务,导致去年放款量下滑了20%。”他透露。
前述隐私计算服务商高管告诉记者,以风控场景为例,金融机构此前想要接入外部数据源时,通常有几种方式:第一种是金融机构把数据样本拷贝到数据源方,或者部署在数据源进行;第二种是数据源把一些字段的明文信息给金融机构,机构通过调整API接口形式来使用;第三种是双方把脱敏后的数据放到一个地方建模,缺陷是性能不好、脱敏后数据失真;第四种是机构直接调用一些信用评分来做模型。
实际上,上述方式或多或少都存在合规瑕疵,在个人隐私保护背景下都有需要规避的部分,而隐私计算解决的就是这类数据的安全流动。
黄奉孝发现,去年以来,金融流量市场的获客途径比如短信营销、分销任务量、信息流等,特别是短信营销开始渐渐弱化。“找第三方大数据公司根据标签选人后,以一个‘莫须有’的名义给用户发短信这种粗暴模式应该要退出历史舞台了。”据他透露,目前营销业务都需要满足至少两个条件:一是最终触达的用户必须由该用户所在的平台执行,这是用户归属权的原则。二是金融机构的投放效果数据可与广告平台的特征数据、点击数据等进行联合建模以优化投放模型。而这种涉及多方的联合营销则很需要隐私计算技术。
解决的问题日渐清晰,但银行也不是全无顾虑。许振告诉记者,银行更关注安全性和技术的成熟度,整体看目前大行、头部股份行要比腰部股份行和城商行接受程度高,零售、风控等对外部数据需求多的银行部门比其他部门需求大。隐私计算的方向和技术路径很多,星云Clustar则选择了用全栈技术来服务金融客户。目前整个行业还在不断摸索,从技术迭代到场景的落地能力都在明显加强。
记者还注意到,虽然市场内隐私计算厂商的业务激增,但相关金融机构招标项目名称直接以“隐私计算”命名的项目并不多。
罗震告诉记者,目前隐私计算仍包含在数据安全和数据应用的大范畴内,单独提出需求的项目有限,而在招标过程中有隐私计算能力的解决方案比较受认可,可以作为一个亮点被加进去。未来,针对“隐私计算”的招标应该会越来越多。
虽然隐私计算仍处于发展早期,但其盈利模式的空间颇被看好。据黄奉孝透露,传统的IT服务以卖软硬件为主,而隐私计算盈利模式是软件费用+基于这个生态做数据流通费用。“比如服务商帮某家机构做完部署后,再通过自身平台跑数据,其则有机会从中分润。”这也是目前很多投资机构看重这一赛道的重要原因。
如何跨越“大孤岛”
隐私计算的出现和走俏是源于数据流通到了瓶颈——算力即使无限增加,在有限、狭窄的数据喂养下难有实质突破,而数据跨行业、跨部门的横向打通后,爆发的收益则不可估量。
不过,由于目前隐私计算的门类颇多、路径不一、服务商众多,其在快速突破上下游造生态的过程中,如果生态与生态、厂商与厂商之间的技术路径未打通,则不仅给金融机构的选择决策带来很大难题,还很有可能形成数据“大孤岛”——这就指向了不同技术范式之间的互联互通问题。
目前,隐私计算领域的行业标准制定仍处于早期。去年12月,央行出台《多方安全计算金融应用技术规范》。同月,信通院成立“隐私计算联盟”,这一联盟成员数量目前已超过70家。
今年5月,国家金融科技测评中心(银行卡检测中心)公布了首批通过多方安全计算金融应用技术测评的产品,来自蚂蚁集团、华控清交、微众银行、矩阵元、富数科技五家公司的六款产品通过测评。
在信通院云大所所长何宝宏看来,这一技术还处于发展早期,距离大规模商业化落地仍有一定的差距。他在近期向媒体表示,由于隐私计算技术复杂且常呈现“黑盒化”现象,大部分用户对隐私技术难以理解和信任。法律法规未对隐私计算地位进行明确定位,相关法律、标准、规则缺失,数据审计、保险等配套产业仍不完备。此外,通用的平台收费机制等商业化落地模式尚未形成。
值得一提的是,央行对金融数据综合应用试点的推动有望加速机构接受这一技术的热情。一位清算机构业务人士透露,已经收到央行金融数据应用试点的相关文件。“技术是一个手段而已,最后的核心还是在于保证所有信息使用是合法合规的。我们今年年初重点围绕小微企业信贷和国内银行尝试做一些数据整合,主要分三步走:即建立大数据平台;把自己的数据打通并赋能银行机构;尝试建立一个生态或者体系。”