刘洋表示,经过长期接触后,对FATE的逻辑回归和XGBoost算法流十分认同,因此也开始加入FATE开源社区建设,提出了优化建议——利用对称的仿射密码替代Paillier密码,将训练时间提升70%以上,从而给同态运算“减负”。未来合作企业在应用优化过后的FATE版本时,可以有效降低数据运算的时间成本,提升企业在AI时代的技术竞争能力。
行业负重前行 数据安全迫在眉睫
AI应用场景中,将多方数据中心式合并处理的传统合作方式,存在着严重的隐私泄露问题,这一症结甚至成为了企业大规模应用AI的关键阻碍。
在刘洋看来,破局关键仍在于数据安全问题的解决,即数据privacy和utility的折衷问题。具体来说,数据要想安全的从孤岛分享出去,必须经历某些“蒙面”操作:通过密码学工具将有效数据转换成乱码,privacy保住了,但密钥在谁手中,极大的影响数据的utility;用噪声混淆原始数据也可以,例如差分隐私,噪声越大,越保证privacy,但使用者拿到数据发挥的utility越低。怎样在privacy和utility中寻求一条折衷之路,是数据安全流通的关键问题之一。
未来理想的状态是,任何数据使用者能够在自由流动和聚合的分布式数据之上,进行高效的数据挖掘操作,而丝毫感觉不到隐私保护的羁绊。在MPC(Multi-party Computation,多方安全计算)领域,目前行业还停留在混淆电路、可信计算等解决方案,虽然支持的计算任务具有一般性,但需要额外的硬件支持,学习成本较高,阻碍了规模化应用的同时,也不利于安全数据联盟的形成。
而联邦学习在具有普适性的联邦框架中,针对每一种或每一类机器学习算法进行订制化的隐私保护改造,使它们的使用无异于经典的中心式机器学习模型。相比之下,联邦学习在稳住成本的基础上,确保了易用性。刘洋称,对于企业而言,联邦学习提供的解决方案更具吸引力;对于行业而言,更便捷的操作将吸引更多开发人员的投入,从而推进安全数据联盟的构建。
FATE生态×腾讯云 数据安全未来可期
今年5月初起,FATE和腾讯云神盾沙箱就开始进行业务往来和技术交流,目前神盾沙箱的核心计算模块由FATE提供。在搭建平台过程中,双方紧密合作。刘洋在采访中表示,团队在使用FATE框架、算法时,会将有效建议贡献到FATE开源项目中,参与开源社区建设。