翼方健数护航联合利华黑客马拉松,为挖掘潜质AI提供新思路
随着新一轮科技革命和产业变革的深入发展,数字化转型已经成为时代趋势。在此进程中,全球数据保护法律法规愈加成熟,机构面临数据合规监管的压力远超以往。而从应用层面来说,面对需要用数智化方法解决困境的诉求日益增加,企业亟需引入新的AI解决方案,但如何验证是否真正解决,并且用最科学、公平的方式选出优秀模型,是众多企业都面临的难题。不少企业开始通过AI大赛的方式来鼓励对某些场景的AI开发,并从中找到优秀且合适的解决方案团队,抛出“橄榄枝”,这一方法或将成为遴选AI解决方案的有效方式。
而隐私安全计算加速这一模式的成功实践。该技术近日入选由全球知名市场研究机构IDC发布的《IDC TechScape:全球行业生态使能技术,2022》“变革型”技术曲线。入选“变革型”技术曲线,是该技术被认为从根本上改变了当前困境的理想实践,并且将彻底重塑市场和投资策略,可能创造新的商业及市场机会,并带来新的企业和消费者能力。
近日,在由联合利华举办的2022黑客马拉松中,是融合了以隐私安全计算技术模式的一次成功实践。为了更好地保护参赛者模型安全和主办方及数据提供方的数据安全,并通过更加科学、公正的方法筛选出优秀模型,联合利华引入了翼方健数的隐私安全计算技术和“AI Validation”解决方案护航本次大赛。
隐私安全计算赋能AI优秀模型鉴别
何为隐私安全计算?联合利华又是如何借助隐私安全计算技术,在确保数据安全的同时,赋能AI优秀模型鉴别的呢?
隐私安全计算,通常是指在保证数据提供方不泄露原始数据的前提下,对数据进行处理和计算,最终只输出数据的计算结果。它可以保障数据在流通和融合过程中的“可用不可见”,实现数据所有权和数据使用权之间的分离,从而较大程度上避免了原始数据的泄露。
此次在联合利华主办的黑客马拉松大赛中,结合翼方健数“AI Validation”解决方案,在比赛中建立数据使用黑箱机制,基于主办方提供的基础数据以授权审批的方式,通过智能算法进行计算,既保护参赛者模型IP,同时保护主办方提供的数据隐私安全,能够让参赛者使用未经传统删减式的脱敏处理而更贴近真实场景的数据对模型进行训练和测试。通过隐私安全计算让数据提供方和模型提供方在安全、隐私问题上没有后顾之忧,从而实现真正AI价值能力输出。
同时在此项目过程中,针对计算环境比较一般或者经费有限的情况,而没办法在一定时间内完成数据到模型的高校学生参赛者,翼方健数可提供平台服务,基于隐私安全计算的信任假设,提供高质量、可流通的数据共享,为AI Baseline模型提供预训练数据集,为参赛者提供可信的数据流通调试环境。
不仅是大赛,“AI Validation”解决方案也可以应用在AI需求方的招标选择上。当前,越来越多企业采购项目中也会涉及对AI模型应用的选型和采购。在大部分采购流程中,通常的做法是要求各AI供应厂商描述算法原理,或者视频展示,无法量化地验证各AI厂商技术上的优劣。
对于没有AI的背景和经验的招采主体来说,很难从算法描述上评估不同算法的优劣。这对参与投标的中小企业而言尤其不利,在技术上即使有好的算法和模型,也很难获得基于模型本身的公平竞争机会。并且在实际操作过程中,AI供应商的模型往往也需要在企业的私有数据上做进一步训练才能达到较好效果,但这会导致一些企业数据安全风险。如果利用上述提及的“AIValidation”解决方案,无论是从比赛场景中评选出更优秀的参赛作品还是在AI需求方实际招标过程中,都可以公平公正选出合适的供应商,同时保护了数据和模型的安全,从而也确保模型的优劣有可量化指标作为参照,增加其公正性。此外,AI Validation在不同细分的AI场景中,基于统一标准的数据集,来验证AI供应商的算法模型,最终将测评结果作为选择优质AI供应商的重要技术参数。
在大赛或者招采的过程中,这一模式也有助于提升参与度。由于在AI Validation方案中,数据和模型均不可见,除了验证结果外,所有的中间结果都被销毁掉,因此可以避免测试数据或者参与机构模型的任何泄漏,测试数据和模型的隐秘性及测试公正性得以保证。安全和公正的对待,提升了参与方的意愿度。
此前,翼方健数的AI Validation已为某地卫生医疗管理部门、智慧园区完成AI供应商遴选。通过隐私安全计算的方式,既保护了园区需求方的数据,也保护了AI企业的模型,并最终得到了双方都满意的结果。这在以前是做不到的,但现在通过隐私安全计算可以实现,可以说是一种具有里程碑意义的模式。
隐私安全计算为企业数据资产保护及合规使用提供技术支持
伴随大数据时代的来临,数据已经成为重要生产要素,数据创新、数据驱动业务发展的模式正成为主流,企业普遍处于数据饥渴的状态,大量收集存储数据。但另一方面,全球数据黑产的成熟运作正极大地威胁到企业的数据安全,如何防止数据泄漏,成为企业无法回避的问题。
放眼国际,多国已通过立法保护数据和隐私,如1996年美国颁布实施的《健康保险可携性和责任法案》(HIPAA)要求建立国家标准,以保护敏感的病人健康信息在未经病人同意或知情的情况下被披露;2018年5月25日欧盟正式实施了《通用数据保护条例》(简称《GDPR》),同年6月美国通过《加州消费者隐私法案》(简称《CCPA》)。此后,印度、新加坡、加拿大、日本等国家也相继出台数据合规方面的相关法案。
立足国内,我国自1984年《宪法》便规定公民的通信自由和通信秘密受法律的保护,开始了对个人信息保护的规制;2016年《网络安全法》出台,为网络数据安全的保护提供了立法制度的支撑;2021年1月1日起正式实施的《民法典》也明确了隐私和个人信息保护相关规定;2021年《数据安全法》、《个人信息安全保护法》相继施行,标志着我国向完善和深化个人数据保护方面迈出了重要一步。
联合利华作为领先的美妆及个人护理用品、家庭护理用品、食品饮料和冰淇淋的提供商之一,对数据合规建设及隐私保护领域十分重视。此次在2022黑客马拉松项目中选择携手翼方健数,也是看重了其在大数据和隐私安全计算领域的创新技术能力及成功建设数据平台的经验,能够为企业提供有关数据资产保护、数据合规使用的技术支持。
翼方健数基于隐私安全计算技术,为某科学园区打造的生物医学信息平台。其中,隐私安全计算满足了企业数据使用的合规诉求,以分享数据价值而非明文数据本身为前提,通过技术确保共享安全性以及访问灵活性,让企业从一开始就在理论上与合规性风险绝缘。上述平台根据国际数据安全及治理标准而建,包括美国的《健康保险私隐和责任法案》(HIPAA1996)中所要求的创建标准,以确保病人的敏感健康数据不会在未经其同意或知悉下披露。通过这样的形式,合法合规地发挥数据作为资产的价值,实现了更为有效的国际间数据供需对接和交流合作。
就本次技术和模式上的创新合作,联合利华相关负责人指出:“引入隐私安全计算技术是今年的一个重要决定,翼方健数在隐私安全计算和人工智能验证领域的丰富经验和成功案例,让我们对本次赛事的成功举办更有信心,同时也为联合利华在数据合规使用上打下良好的技术基础。”
翼方健数首席科学家张霖涛表示:“与联合利华此次合作,无疑是打开了隐私计算与人工智能应用的新局面。翼方健数希望通过技术和产品服务,帮助客户真正收获数据作为资产带来的收益。我们也将发挥自身对于数字化转型的认知和核心技术优势,帮助客户设计并落实好数字化转型的每一步。”