进入大数据时代,各行各业都在探寻利用数据挖掘,推动技术变革和业务创新,而在数据共享中相伴而生的隐私泄露、数据滥用等问题,正引发监管机构关注,包括金融业、医疗健康等数据敏感行业对于数据共享中的安全需求也日益上升。IDC数据显示,预计2018-2022年的五年间全球信息安全市场年复合增长率(CAGR)达25%。

为了破解数据共享中的安全问题,互联网公司走向前列。蚂蚁金服推出的共享智能就凭借多年金融实践和广泛应用,独树一帜,成功帮助金融等相关行业逐步解决隐私泄露和数据滥用的数据共享难题,为大数据在更多领域的深度应用保驾护航。

共享智能有四个基石性的研究方向,分别是多方安全计算,可信执行环境,差分隐私,以及联邦学习。

多方安全计算和可信执行环境侧重解决计算过程中的数据安全问题,差分隐私侧重保护计算结果里的隐私泄露,而联邦学习擅长解决大数据孤岛带来的人工智能算法收敛性及效率问题。单独的一个方向并不能解决多方数据可用不可得的问题,共享智能的研究既包括推动这四个基础方向的进步,又包括对这四个方向的融合创新,从而提供满足不同实际需求的多种产品与服务。

对于数据孤岛问题, 目前业界涌现了像隐私保护机器学习PPML、联邦学习、竞合学习、可信机器学习等诸多解决方案,但大多仅利用了上面提到的一部分技术,可应用的数据共享场景相对有限,且基本处于学术研究阶段,缺乏生产环境落地,方案的可行性有待观察。

相比之下,蚂蚁金服的共享学习兼容多种安全计算技术,并且支持多种机器学习算法和使用场景,具有更加广泛的应用前景。基于蚂蚁金服自身的业务场景特性,并聚焦于在金融行业的应用,从17年开始,蚂蚁金服就一直在共享机器学习方向进行探索和研究。经过多年技术积累和实战检验,蚂蚁金服共享智能选择了结合TEE与MPC的两条路线,脱颖而出,其共享智能架构实现了较好的完备性、易用性和稳定性的目标,能够为行业解决数据共享中的安全痛点。

例如,在完备性方面,蚂蚁金服共享智能实现功能完备和场景完备,目前主要是支持风控和其它AI典型场景,具有比较全面的算法支持,覆盖了线性模型、树模型、深度学习、图神经网络等各个方向;在易用性方面,着眼于更好的推广这种建模技术,同时又能“屏蔽”一些底层技术(可信执行环境、多方安全计算等),降低企业的学习使用成本;而在稳定性方面,实现了共享智能计算的集群化,并且支持远程运维。

与此同时,蚂蚁金服在牵头标准、技术应用等多个领域结出累累硕果,进一步提高了用户对共享智能的信心,为共享智能技术大规模落地打下坚实基础。经过多年技术积累,发布论文超过10篇,获得专利超过80余项,在标准立项方面,也已在IEEE共享智能和ITU-T MPC国际标准、CCSA共享智能行业标准以及AIOSS / AIIA共享智能联盟标准方面进行同步推进。在创新奖项方面,在2019中国人工智能峰会上,共享机器学习获得“紫金产品创新奖”,在2019年全球人工智能创业者大会上,共享智能获得“应用案例示范奖”。目前,蚂蚁金服共享机器学习技术也已在银行、保险、商户等行业成功落地诸多场景业务。

通过在业务中打磨出的金融级共享机器学习能力,蚂蚁金服沉淀下来一套数据共享场景的通用解决方案,并有望加速向行业开放。随着共享智能技术和用户心智的同步进化,可以预见,未来,共享智能的大规模落地将很快得到实现,特别是对数据驱动和隐私保护有强需求的金融科技和医疗科技。蚂蚁金服共享智能的持续成熟,将为银行、医疗等行业机构,提供更加专业的风控管理,推动智能风控在相关领域的发展。