联邦学习又称联邦机器学习(Federated Machine Learning),是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
联邦学习基于分布在多个设备上的数据集构建机器学习模型,同时防止数据泄露。联邦学习可以避免未授权的数据扩散并解决数据孤岛问题。
传统的数据集中处理模式存在很多弊端,由于人们需要把数据集中起来进行处理,需要收集和传输数据,在这个过程中可能会侵犯隐私、泄露数据,可能会产生数据的集中和垄断。
为了改变这种集中处理数据的模式,联邦学习应运而生。和传统的机器学习算法要求集中处理数据不同,联邦学习把算法发到所有数据拥有者手中,在本地对数据进行学习,然后对所有学习的结果进行整合,得到最终结果。形象地说,如果传统的机器学习是把数据“喂”给算法,那么联邦学习就是让算法去主动觅食。
最早把联邦学习技术投入应用的是谷歌。2017年,谷歌推出了一款基于安卓手机的联邦学习程序。它通过将算法程序发送到每个用户的手机上,回收反馈信息,从而获得想要的分析结论。在看到谷歌的实践后,国内的大型互联网企业很快认识到联邦学习的价值,腾讯旗下的微众银行、阿里巴巴旗下的蚂蚁金服[2]陆续推出了与之类似的技术解决方案,并将它们应用到实践领域。在这些大型互联网企业的推动下,目前联邦学习技术已经开始在金融、保险、电子商务等领域得到应用,而其潜在的应用前景相当可观。在一些行业研究机构发布的报告中,这一技术甚至已经被誉为“推动人工智能下一轮高潮的重要力量”,以及“数字时代的新基础设施”。
联邦学习虽然解决了由数据集中所带来的很多问题,但它本身又会引发很多新的问题:(www.xing528.com)
·企业要参与联邦学习,就必须贡献数据,并没有完全解决数据孤岛问题。
·对于硬件可能会提出要求,实现存在难度。
·如何处理对参与者的激励。
·为造假和攻击留下了漏洞。
·给市场竞争带来负面影响,加强了平台公司的作用。
·带来了知识产权问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。