央视“3·15”晚会刚刚落幕,隐私泄漏成为今年最受关注的消费话题之一。“人脸识别未经许可恶意采集顾客数据”、“大量求职简历流入黑市遭倒卖泄漏”、“假冒手机清理类的软件诱导下载窃取隐私”,被曝光的三大案例一致指向消费者的信息安全与隐私保护困扰。
数字经济时代,数据成为新型生产要素,企业想要最大化的挖掘数据价值却面临数据壁垒制约,在保护体系不完善的情况下,便可能引发恶意泄漏、窃取等数据安全问题。但技术的使用始终需要遵守边界,合乎公共利益。如何打破"数据孤岛"壁垒并兼顾建立公众对数据流通与协作的隐私保护信心,实现数据价值挖掘和隐私保护的正和博弈,隐私保护计算为此提供了行之有效的解决之道。
融合了密码学、机器学习、分布式计算等技术体系的隐私保护计算技术,可以在保护各参与方数据隐私的前提下,完成多方参与的联合计算任务,促进多方数据可信协同,打破数据孤岛,提升数据价值。
一、隐私保护计算为数据价值释放的突破口
隐私保护计算是当前最热门的技术方向之一,其能够在不泄漏原始数据的前提下完成多方联合计算任务。它解决了互不信任的参与方之间协同计算的问题,能够保障数据安全、合规的共享使用。因此,这一技术特性让隐私保护计算受到了大型金融机构、科技公司、政府部门等各行业的广泛关注。
隐私保护计算的常用技术路线包括秘密分享、混淆电路、不经意传输和同态加密等。基于隐私保护计算技术,能够支持多方数据共享、联合查询、联合运算、联合建模、联合预测等隐私计算模式。
其中,以数据安全性要求较高的金融领域应用为例。隐私保护计算技术的设计需综合考虑三方面的要求:参与方的数据安全得到保护、计算精度达到要求、效率满足实际生产需要。利用隐私保护计算技术,可支持多种范式的多方联合计算,主要包含:联合查询、联合运算和联合建模。
1、联合查询
基于不经意传输技术,实现隐私数据联合查询的应用功能,查询过程中保护数据方的源数据(除查询结果外)隐私,同时保护查询条件不对外泄漏,支持多检索语句和多结果返回,同时保证查询结果真实有效。联合隐私查询可用于黑名单匹配、多头借贷信息共享等场景。
2、联合运算
基于多方安全计算技术,包含秘密分享、混淆电路、不经意传输、同态加密等技术路线,完成四则运算、统计运算、比较运算、矩阵运算和复杂运算等特定多方计算任务,保护各方的数据隐私,同时确保各方的计算结果一致性。在支持亿级大数据量的基础上,有效平衡精度和误差指标,满足金融级的应用要求。多方联合运算可用于跨机构用户信用评分、跨机构统计计算等业务场景。
3、联合建模
从技术角度来看,多采用联邦学习作为多方联合建模的底层技术路线,包括三种模式:各参与方在共有样本的特征维度进行信息扩充的纵向联邦学习;各参与方在相同特征空间中通过样本维度扩充提升模型性能的横向联邦学习;应用于各参与方特征维度、样本维度重叠均很小的联邦迁移学习。金融机构的基于联邦学习的应用以纵向联邦建模为主,实现跨机构的特征维度数据融合。
从参与方的角度来看,一般包括两种模式:有可信第三方(有时也称协调方)和无第三方参与。一般来讲,在整个训练过程中,第三方承担着生成公私钥对、分发公钥、解密被加密结果等角色,因此会获得一些计算相关信息,这些信息是否会暴露其他参与方的数据隐私,与算法本身的结构有关。
但如果第三方与任何参与方勾结作弊,就很可能会导致数据隐私泄漏和模型暴露。所以,有可信第三方的模式必然存在一个信任假设的问题,必须要保证此第三方是绝对诚实可信的,才能保障数据隐私安全。而无可信第三方的联合建模可以在发起方和参与方两方直连,实现建模过程中的模型参数端到端加密互换,完成联合安全建模。显然可见,无第三方的联合建模在金融领域的应用空间更为广阔。
综上所述,隐私保护计算是为了数据价值释放,带来实际的业务价值。它是数据业务需求引领下的一轮技术升级,需要根据不同数据业务场景,在众多底层隐私保护计算技术中选择合适的一种。
二、隐私保护计算的实践探索
凭借在安全多方计算、联邦学习、同态加密、分布式等多个技术方向的融合探索,RealAI推出业内首个企业级隐私保护机器学习平台RealSecure(RSC),该平台具有以下特性:
1、联邦AI编译器
通过以底层数据流图的视角揭示机器学习算法与对应分布式联邦学习算法的联系,实现传统机器学习生态与联邦学习生态的一体化,企业可以直接复用现有积累的人工智能团队经验和经验,完成技术体系无感切换升级,保障算法模型无缝对接现有业务体系。
2、联合安全计算
RealSecure融合了隐私求交、多方安全计算、同态加密、差分隐私、匿踪查询多个技术体系,可支持联邦样本对齐及联邦特征工程,无第三方参与,实现建模过程中的模型参数端到端加密互换,安全可控地完成多种联合计算范式,规避数据泄漏风险。
3、高性能高可用
RealSecure通过融合多种底层计算加速技术并对大规模分布式训练场景进行通信优化,从计算和通信两个方面大幅提升运算效率,实现秒级别联邦建模与毫秒级别匿踪查询和多方计算,保障联合建模商业场景下高性能高可用。
4、联邦安全监控
RealSecure将联邦算法协议抽象为中间层表示(IR),以数据流图的形式直观展示加密过程,保证协议安全可控直观可验证。
隐私保护计算技术在当下恰逢其时而且前景深远,为释放数据要素价值提供了全新可能。RealAI作为安全人工智能的领跑者,在业界率先将隐私计算、联邦学习等技术应用到金融等行业,并推进相关行业标准的制定,未来将持续助力构建数据安全连接的基础设施。