随着国家数据战略的深化推进,数据成为影响社会经济发展的要素。同时随着《数据安全法》、《个人信息保护法》等治理新规的加速落地,平衡数据利用与安全合规成为数据资源建设的重要方向。在数据融合应用和隐私保护的双重驱动下,隐私计算热潮迅速兴起。
隐私计算开辟了一种全新的数据协作模式,在不泄露数据原始信息的前提下,对数据进行分析计算,实现数据所有权和使用权的分离,避免流通过程中的数据资产损失和隐私信息泄漏。从明文直接传输的数据流通1.0阶段,隐私计算模式是数据流通3.0阶段。
虽然热度持续攀高,但隐私计算行业仍处于初期阶段,市场环境和商业规模都还不够成熟,隐私计算的商业前路几何?12月10日,由雷锋网主办的数据安全与隐私计算论坛上,瑞莱智慧RealAI首席架构师徐世真带来《隐私计算助力构建AI新基建》的主题演讲,从AI发展的视角出发,为研判隐私计算的未来趋势提供参考思路。
瑞莱智慧RealAI首席架构师徐世真
隐私计算是AI能力的重要补充与延伸
隐私计算通常与AI紧密结合,徐世真表示,从技术角度看,隐私计算是AI能力的重要补充。AI高度依赖数据基础,规模化且多样化的高质量数据,能够训练出效果更好的模型,隐私计算通过解决数据的“链接”问题,为算法的持续进化提供数据补充。
相应的,在落地AI应用的过程中,要加大对数据的拓展,往往倒逼企业使用隐私计算。随着越来越多的数据被收集和利用,数据风险和隐私保护已成为AI系统在开发和应用过程中面临的一项挑战。9月26日,国家新一代人工智能治理专业委员会发布《新一代人工智能伦理规范》,其中数据与隐私安全内容贯穿了人工智能管理、研发、供应等特定活动的具体伦理要求。
瑞莱智慧RealAI定义AI新基建
产品层面来看,复制性低和通用性差是当前隐私计算产品化面临的一大局限。徐世真提供了两方面的解决思路,一是尽量从规范成熟、少定制化的需求场景切入,二是将隐私计算嵌入现有的成熟产品,比如隐私保护数据库、隐私保护大数据分析引擎。后者思路下,在与AI技术能力的结合中,隐私计算可看成AI中台2.0,即在原有机器学习平台中添加隐私计算功能模块。
“这也是用户理想的隐私计算产品形式,对外依旧输出AI建模能力,用户操作层面几乎无感,在使用原有机器学习建模技术的同时,底层已经通过密码学、MPC技术实现了隐私保护功能。”徐世真表示。
某种程度上,AI也可看成隐私计算的上层应用。徐世真介绍道,隐私计算目前不存在场景通用解决方案,单一技术路线无法适配所有场景。实际应用中,隐私计算无法与上层应用解耦,不同技术路线之间也无法解耦,多数情况下,用户需要的仍是AI相关功能,AI也因此成为牵引隐私计算的一项核心需求。
AI模式为隐私计算发展提供两大路径参考
徐世真看来,现阶段隐私计算的商业化落地仍面临四大挑战。
第一,生态壁垒。目前各厂商隐私计算技术互不相通,也无法互相连接,解决数据孤岛问题的过程中反而带来技术孤岛的问题,这意味着需要上层进行大量集成。
第二,计算性能。密码学操作的引入、分布式通信问题,以及同态加密导致计算性能慢,难以支撑大规模数据训练。
第三,安全性。从知识产权保护的角度,各家厂商不会公开底层协议,导致协议不透明的问题,难以审计。
第四,可用性。目前的隐私计算技术服务商不具备数据生态、数据链接的能力,无法提供开箱即用的数据和解决方案,用户的应用成本和难度增加。
徐世真表示,结合AI发展历程,隐私计算的未来发展可借鉴两大经验。首先技术路径方面,基于底层数据流图的编译器路线将推动技术的兼容互通;性能优化当前可通过优化底层密码库来实现,未来仍需借助新硬件;提升安全性需要抵御密码协议层和应用层的恶意攻击。
其次在产业路径方面,隐私计算需要逐场景落地,根据不同的场景需求采用合适的技术路线,比如多方安全计算效率高、安全可证明,但通信量大、仅支持简单计算逻辑;联邦学习支持复杂机器学习,但主要面向建模场景;TEE路线具备较好的性能和算法生态,但依赖硬件厂商硬件可信性和用户接受数据集中式处理。
立足于AI视角,瑞莱智慧推出了业内首个编译级隐私保护计算平台RealSecure,底层以编译器架构与全同态加密为核心突破,实现与传统算法的自动编译和一键适配,性能领先业内平均水平数十倍,同时基于底层数据流图,与构建事前、事中、事后的全方位安全评估体系,实现可追溯、可验证的高安全级别。
隐私保护计算平台RealSecure
面向场景需求,瑞莱智慧打造了“平台+数据+服务+场景”的一体化隐私计算解决方案,引入运营商、支付等数十种外部数据源,推动隐私计算从功能论证阶段迈向业务落地闭环,实现对金融、政务等不同业务场景的快速赋能。
隐私计算仅仅是企业合规建设的一环
隐私计算不仅仅是技术行为,也是企业合规性组织建设行为。但在市场早期阶段,用户对于隐私计算的应用模式及场景理解通常存在误区。比如在合规性方面,企业往往想要的是端到端安全,公众意义上符合法律规范的全流程安全,包含数据采集、匿名化、使用授权机制等。但隐私计算仅仅解决数据流通、模型训练/预测过程中的安全问题,与用户预期存在偏差。
徐世真强调,隐私计算仅仅是企业合规建设的一环,需要在法律法规的框架下进行。目前瑞莱智慧与中伦律师事务所展开战略合作,充分发挥双方资源优势,在数字经济时代针对人工智能、数据交换等新场景下应用与监管机构强监管要求的合规法律与技术体系建设,为企业提供咨询服务、体系建设等服务。
另一方面,徐世真表示,虽然政策监管出台,但让企业单纯为“成本项”的安全投入买单往往是有难度的。本质上隐私计算虽然解决了数据“能”拿出来的问题,但没有解决让企业共享数据的意愿问题。
这里的关键在于数据价值的闭环,充分释放数据价值,使得各个数据参与方从中获益,将“成本项”转为“营收项”,才能让用户产生持续性的意愿度,开放数据的特定使用权来参与后续数据流通,推动持续性的数据流通。这一过程通常需要企业内优势业务部门的配合和印证。
徐世真表示,AI技术能够有效解决数据流通的意愿问题。AI技术具有强大数据处理与分析能力,是实现数据价值的关键技术,隐私计算则解决了数据安全流通问题。通过“人工智能+隐私计算”的深度结合,能够在实现跨业、跨域数据安全融合的基础上,实现数据价值的深度挖掘与释放。