隐私计算面临的挑战与发展趋势浅析

作者:中国信息通信研究院云计算与大数据研究所 王思源 闫树 责任编辑:程琳琳 2022.01.21 09:12 来源:通信世界全媒体

通信世界网消息(CWW)隐私计算是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,能够保障数据在流通与融合过程中的“可用不可见”。近两年来,在政策驱动和市场需求共同作用下,隐私计算技术、产业、应用迅速发展。一方面,数据流通需求不断加强,机构间数据流通成为促使数据要素市场化配置、充分释放数据要素价值的重要环节;另一方面,不断实施的法律法规使得数据的安全与保护,特别是数据流通过程中的合规性,成为持续稳定的市场需求,而不再是短暂的监管应对行为。在此基础上,政策纷纷出台促进隐私计算技术产业发展。

隐私计算技术在不转移或不泄露原始数据的前提下实现数据融合“可用不可见”的特点,有助于在满足合规要求的前提下充分挖掘数据价值。该特点呼应了国家颁布的《数据安全法》《个人信息保护法》中提出的安全合规要求。隐私计算作为一项备受关注的技术,有助于各方履行法定的数据安全保障义务,也有助于践行“最小、必要”原则,防止数据滥用。

 隐私计算面临的挑战和难题

目前,隐私计算技术正处于快速迭代的发展阶段,可解决企业和机构面临的数据合规难题,为数据安全制度落地提供有力的技术支撑。然而,隐私计算在安全、性能和数据的互联互通等方面仍存在挑战,这些难题在一定程度上制约了隐私计算的推广和应用。

安全性挑战影响市场信任

隐私计算产品与其他的数据处理产品不同,其本身承载着保护隐私数据安全的重要功能,技术服务厂商与产品使用者都应谨慎对待隐私计算产品的安全性挑战,而算法协议安全、开发应用安全和安全共识正成为当前隐私计算应用亟需解决的问题。

算法协议尚无法实现绝对安全。一方面,隐私计算产品的算法协议差异化较大,难以形成统一的算法安全基础。隐私计算产品所使用的算法协议多种多样,各自的协议安全基础也不相同:多方安全计算、同态加密等密码学算法基于数学与密码学基础,联邦学习等隐私机器学习安全基于机器学习理论、差分隐私和相关密码学协议,可信执行环境则更多依赖于硬件厂商的安全技术。另一方面,隐私计算产品安全协议依赖安全假设,仍存在安全风险。隐私计算产品的安全基础通常会建立安全假设,以此为基础进行协议和算法的设计,比如假设硬件提供商的可信性、假设计算参与方会遵循协议流程、假设多个参与方之间互不共谋等。但实际上这种假设并不一定完全成立,往往需要通过博弈论、现实约束等方法进行加强。

开发应用安全同样存在挑战。在假定算法协议安全达成的情况下,一方面隐私计算产品面临生产化过程中产生的安全问题,例如密码学算法通常遇到的侧信道攻击、错误注入攻击,硬件通常遇到的侵入式攻击,或者类似其他信息系统遇到的恶意黑客攻击。对于隐私计算产品的要求是在整个计算的过程中保证绝对安全,而“木桶效应”会导致最薄弱的环节成为产品最易被攻击的部分。另一方面,第三方机构的介入也会引来安全风险。在实际使用中,诸如证书管理中心等任何第三方机构的介入,有可能打破技术信任的完整性,引入不确定的风险因子。

安全性共识有待形成。隐私计算的核心逻辑是通过数学原理、密码学原理和硬件技术建立技术保障机制,让多个数据参与方在技术信任的共识下开展协同计算。但是,隐私计算涉及的隐私保护技术和算法非常多,且算法的复杂度、性能、优势场景等各不相同,隐私计算参与者很难通过直观的方法验证所用产品的安全性。业界有待建立涵盖主流隐私计算产品的系统性安全分级标准。同时,现实应用中的信任共识通常难以达成,使得隐私计算技术的部署和使用也进展缓慢。

性能瓶颈阻碍隐私计算规模化应用

密文计算需要更大的计算和通信负载,导致遇到性能瓶颈。在保证了参与节点的可用性之后,隐私计算依然面临计算和网络性能的限制。为了保证计算过程的安全性,隐私计算理论上要比明文计算付出更大的计算和存储代价,比如同态计算的密文扩张规模可达1到4个数量级。而考虑到隐私计算是一种多方同步计算,性能的瓶颈会出现在最薄弱的环节,即计算或通信资源最受限的参与方将限制整个计算平台的性能。

同步性和可用性对隐私计算参与方的资源要求较高。隐私计算产品通常由多方共同运行,因而与其他的数据处理方式不同,多主体的特性,决定了对产品的同步性与可用性均有所要求。隐私计算一般是为解决多个数据源因隐私问题而无法进行跨数据源明文数据处理的问题,这种情况下,需要多个数据源或计算节点同时在线、同步计算、实时通信,当出现一方因网络或计算资源不足无法继续参与的情况时,可能会引起整个计算过程被迫停止。因此,保障同步性和可用性是隐私计算面临的重要挑战之一,尤其是在大规模应用的情况下。

互联互通壁垒或使数据“孤岛”变“群岛”

对于数据提供机构和数据应用机构而言,普遍存在与不同机构合作时需要部署不同的隐私计算平台的问题,导致系统建设重复和运营成本增加。由于不同的隐私计算平台是基于各自特定的算法原理和系统设计实现的,且目前闭源的平台很多,平台之间很难完成信息的交互;因此计算平台之间互联互通的壁垒成为了隐私计算面临的新挑战,或使“数据孤岛”变成了“数据群岛”。

算法原理的差异性给互联互通带来挑战。隐私计算常用技术方案涵盖多种多样的具体算法,这些算法在设计之初的底层数据加密、数据计算的逻辑、数据交互的流程上,就已经截然不同,在理论层面上的协议连接或混用都存在较大的互联互通挑战,至于技术方案层面的连通问题就更是困难重重。

系统设计过程中的功能组件多样性增加互联互通成本。为了使隐私计算协议可以应用于生产环境,技术服务厂商需要开发相应的通信模块与加密组件,以及数据、任务、模型、节点管理等诸多功能组件。这些组件均是不同的技术服务厂商结合自身技术积累和场景应用而实现的,存在很大的差异化。这导致不同厂商间的隐私计算平台在功能组件层面就难以实现互联互通,为用户的部署增加成本,并且存在重复建设的情况。

 隐私计算发展趋势展望

随着大数据发展和应用的不断深入,市场各方对跨源、跨领域、跨用户的数据流通共享需求日益增大,隐私计算技术在近几年得到了广泛关注和迅速发展,在金融、电信、医疗、政务等场景也开展了应用试验。然而,隐私计算技术要实现大规模的落地应用,仍需要在性能、技术融合、安全等方面进一步提升,并且在一些非技术因素上形成相关配套。

算法优化和硬件加速将成为隐私计算可用性提升的重要方向

隐私计算普遍借助密码学技术实现多方协同计算,效率是影响其能否被广泛应用的一个重要因素。例如,隐私计算联合建模的耗时是传统集中式机器学习的数十倍甚至数百倍,联合统计的耗时也是传统集中式明文计算的数百倍。因此,隐私计算平台在实际落地应用中需要关注性能的优化,以提升可用性。

性能由算法协议、计算流程、系统架构、数据规模、软硬件环境、网络带宽等多种因素共同决定。在算法优化层面,一些常用的方式包括:算法加速,尽可能地降低子模块耦合度,对算法流程重新进行深度编排;通信加速,最大程度地减少节点间通信次数及通信量;代码加速,使用更底层的语言(例如C/C++)构建基础算子,通过调整字符串和循环体等方式降低计算开销。在硬件加速层面,通过新的密码学技术和算法协议,结合硬件加速技术(如GPU、FPGA、ASIC加速)和专有算法实现硬件,加速计算量较大的环节和步骤,也能够有效提高性能。

此外,在工程化层面也需要进行大量的优化工作,例如做好计算流程的调度,在数据的读取、加密、传输、计算、解密、存储等各个阶段实现最优化,进而将整体性能提升到最优状态,以满足高吞吐、低时延以及某些特定场景的实时性要求。

多元技术融合有望拓展隐私计算应用边界

一方面,隐私计算分支技术间的加速融合可以满足更多应用场景。以联邦学习为例,与多方安全计算融合能够满足对等网络无可信第三方的联合建模应用需求;与差分隐私融合能够增强对梯度参数的保护程度,进一步防止中间梯度信息泄露;与可信执行环境融合能够提升隐私数据或模型的安全等级等。这些不同隐私计算技术相互融合能够发挥技术的最大优势,更好地满足业务场景的多样性需求。另一方面,隐私计算与区块链等其他领域技术的融合拓展了应用边界。例如区块链可应用到隐私计算各个环节,实现全闭环的安全和隐私服务——隐私计算各流程的操作和处理记录上链保存,可实现记录的防篡改;基于区块链解决数据共享参与者身份及数据可信问题,能够在一定程度上避免主观作恶、数据造假等;此外,区块链还非常适合隐私计算多边信任关系建立,例如使用联盟链来建立隐私计算群体激励机制,通过多个标准化智能合约为参与方提供可信服务。安全审计智能合约的引入,使得隐私计算在保护隐私数据的合规性方面更加容易验证,将合规监管变成一种服务。

标准体系制定有望助力隐私计算应用落地

当前,国内外众多标准化组织已开始制定或发布以框架和功能为主的隐私计算相关技术标准。通常隐私计算产品只能以自证清白的方式证明其安全性,对隐私计算产品的安全问题难以全面、系统、有效地评估。此外,隐私计算的算法具有多样性和复杂性,普遍需要繁杂的交互和计算流程,使得某些隐私计算技术缺乏可解释性,降低了隐私计算产品需求方的接受度,增加了评估难度。

一方面,完善的隐私计算相关标准有助于产品规范的形成。隐私计算的安全性规范化过程,可引入安全专家的建议,并通过安全性验证技术、审计、形式化证明等方式,使行业需求方在选择隐私计算平台时有据可依,降低对隐私计算的安全性顾虑。同时,不同应用场景中的安全需求具有多样性,而隐私计算的性能、准确性与安全强度往往也是强关联。因此隐私计算需要进行安全等级划分,在产品开发和实际落地应用中,形成安全与性能、准确性的平衡。另一方面,成熟的检测和验证手段有助于产品落地应用,隐私计算产品的安全性,除了需考虑算法协议安全性、通信安全性、密码安全性、系统安全性等常规的安全性问题,还应确保应用算法逻辑的安全性,尤其是针对应用算法逻辑实时生成的场景(例如基于多方安全计算基础算子的组合实现多方联合统计分析场景),需要新的技术手段实现自动化的安全检测、识别与预警。

多方生态融合有望推进隐私计算行业发展

隐私计算的发展需要法规体系、技术体系、应用体系等多方生态的融合。一是法规体系需加速完善,作为数据安全治理和建设的顶层指导,有助于更好地理解安全场景与需求,进而有利于将隐私计算技术实际落地与应用。全球各国已纷纷颁布相关法规,对数据安全与隐私保护相关问题进行严格规范与引导,例如欧盟的GDPR、美国的CCPA、中国的《网络安全法》和《数据安全法》等。二是应用体系需进一步加强,目前在金融、电信、医疗、政务等行业,存在成功的隐私计算应用案例,实现了基于隐私计算的数据安全开放共享,但多数领域仍处于试点应用阶段,还未进入规模化推广,需要“产学研用”各界加强隐私计算布局。三是开源协同加速隐私计算技术迭代,技术开源已经全面渗透到信息技术的各个领域,微软、谷歌、Meta(原Facebook)、腾讯、阿里、百度等全球知名巨头都在积极拥抱开源。隐私计算作为保障跨机构数据安全合作的关键基础,也注定包含开源模式。开源的成本优势不仅体现在技术复用、降低开发门槛,还体现在问题发现和修复的敏捷性上,具有快速迭代优势。隐私计算未来的发展趋势必将是开源平台与自研平台并存,形成既开放又独特的多元生态。

在健全完善的法律法规、丰富多样的应用实践、成熟可用的开源技术等多方生态共同作用下,隐私计算行业将迎来蓬勃发展,隐私计算平台有望成为数据合规流通基础设施的关键一环,在保证安全的前提下持续有效释放数据要素价值,促进数字经济高质量发展。


通信世界网版权及免责声明:
1、凡本网注明“来源:通信世界全媒体”及标有原创的所有作品,版权均属于通信世界网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非通信世界网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
发表评论请先登录
...
热点文章
    暂无内容