(一)以规制平台自身而不是平台经营者为核心
传统规制平台的法律责任框架以规制平台经营者为核心。起初,许多国家的法律都要求平台经营者对侵权行为有明确的认知。随着互联网技术的飞速发展,以知晓为基础的责任承担方式在实践中遇到诸多问题,一些法院在司法实践中开始摆脱知晓因素的约束,以注意义务的违反作为平台经营者承担责任的基础。然而,随着大数据与人工智能技术的发展,以平台经营者为核心构建的责任体系显然不能应对商业现实的挑战。在大数据与人工智能技术背景下,规制平台自身显然比规制平台经营者更为有效与有价值。
在大数据与人工智能背景下,平台具有强大的自我学习与延展能力,传统的平台不断发展出新的模式。在此种情况下,仍以平台经营者为核心规制平台经济无疑与商业现实严重不符。现今的平台以数据与算法为核心构建,平台经营者可能既不是算法的设计者,也不是数据的商用化者,其可能仅仅是算法与数据的使用者、收集者。而现今平台的许多责任是数据与算法所引发的责任,其与平台经营者没有多大关系,比如由于数据与算法偏差,导致平台在对某个人进行画像时存在偏差,平台经营者对此并无多大过错,此时要求平台经营者承担责任并无法律依据。传统的经营商责任规则只能解决平台经营者可以控制行为的责任,如对知晓的侵权行为没有采取措施阻止,其不能解决平台经营过程中因为信息偏见与误导给他人造成的损失。有研究表明,在社交媒体平台中持续向用户输入负面信息将影响用户心情,从而可能损害用户健康等。如果算法设计本身存在问题,而平台经营者又不是算法设计者,此时平台可能会以不知晓算法偏差、错误为由要求免于承担责任。然而,让消费者来承担相关后果无疑损害了消费者利益。
因而,现行以互联网平台经营者为核心的体系已不能适应以大数据与人工智能为基础构建的平台,必须构建以规制平台本身构架为基础的平台责任体系。而平台构建体系的核心就是数据与算法。
(二)以规制平台的数据与算法为核心
飙升的数据和信息流现在产生的经济价值高于全球商品贸易。[12]数字数据越来越多地融入营销战略中;它是大多数平台的核心资产。要求用户数据以换取免费服务是大多数平台获取原始数据的主要手段。除了这些原始数据外,平台通常还通过数据挖掘、处理、大数据分析等获取更适合其特殊需求的数据。平台不仅自己收集用户数据信息,还与第三方数据收集公司合作,在其他平台上或通过APP收集数据。据统计,Google应用程序商店中88%的免费应用程序将与Google共享相关数据。Facebook上大约43%的APP与Facebook交换数据。即使用户没有Facebook账户,Facebook也可以从某些应用程序接收高度敏感的个人信息。[13]其他平台(如Twitter、Amazon和Microsoft)也与该平台的外部用户共享和交换数据。[14]多年来,Facebook为一些全球最大的科技公司(如Microsoft、Amazon、Yahoo!)提供了比其披露更具侵入性的用户个人数据访问权限。[15]大多数第三方数据公司都能够跨平台和应用程序收集数据并集成数据。通过分析收集的数据,数字平台和第三方数据公司可以清楚地描述用户的个性特征。实际上,所有平台提供商都会跟踪其网站上的用户活动,并收集用户的个人、行为和其他数据,使得揭示用户的习惯、社交关系、品味、思想、观点、能量消耗、心跳,甚至睡眠模式和梦想的数据点与其他数据点的关联性更加巧妙、广泛且精确。然后,计算机对所有内容进行排序、分析和使用,以优化和定位高度个性化的广告,供用户在线查看。从行业的角度来看,数据永远不会太多。[16]如今,普通消费者不可能知道如何收集和使用他们的数据,也不可能逃避收集其个人数据。数字平台获取原始数据和间接数据的能力存在巨大差距。一些平台具有使用大数据和算法来获取用户间接数据和业务数据的强大能力,而一些平台获取数据的能力有限并且必须从第三方购买数据。
收集数据只是数据货币化的第一步。收集的数据必须进行处理、汇总、分析,然后商业化,以便为平台经济利益相关者创造利润。数据处理和聚合的能力决定了平台的商业模式。通常,大多数平台的商业模式通过处理所获取的数据并将数据应用于相关区域来获得利润。数据处理是通过一个过程将原始数据转换为有意义的信息。根据欧盟《通用数据保护条例》第4.2条的规定,处理是指“对个人数据或个人数据集进行的任何操作或一系列操作,无论是否通过自动化方式,如收集、记录、组织、结构、存储、适应或通过传播,传播或以其他方式提供,对齐或组合、限制、删除或销毁的变更、检索、咨询、使用、披露”。从广义上讲,数据处理包括以下6个阶段:数据收集、数据准备、数据输入、数据处理、数据输出/解释和数据存储。数据聚合是数据和分析之间发生的步骤。数据聚合在组合、处理和聚合数据时增加数据的价值。数据聚合是一个过程,在此过程中,数据以基于报告的汇总格式进行搜索、收集和呈现,以实现特定的业务目标或流程和/或进行人工分析。
仅凭数据无法保证平台的成功。分析数据的能力对于平台而言也很重要。大数据和大分析具有相互促进的关系。如果公司无法快速分析数据并对其采取行动,那么大数据的价值将会降低。算法的学习能力随着处理更多相关数据而增加。具有大量数据的简单算法最终将优于具有少量数据的复杂算法。部分原因在于算法有机会通过反复试验来学习。另一个是看到大数据集的相关性。[17]此外,算法通过反复试验来学习,并从更大量和更多种类的数据中找到模式。随着平台收集更多用户数据,其算法有更多实验机会。通过数据的收集、聚合、处理和分析,数据最终成为一种有价值的特定信息,可以在商业领域中轻松探索。[18]
数据商业化意味着将数据转换为新的收入来源。实际上,数据本身越来越成为商品。但是,有效货币化数据的能力而不仅仅是囤积数据可以成为数字经济中竞争优势的源泉。通过处理所有可用信息,从而监控和分析或预测竞争对手对当前和未来价格的反应,竞争对手可以更容易地找到他们可以达成一致的可持续的超竞争价格均衡。[19]从理论上讲,公司可以同时采用多种方法来实现数据货币化。(www.xing528.com)
以电子商务平台为例,平台通过整合、处理消费者提供的数据信息,并将其提供给相应的数据经纪人,买方使用该数据信息从目标广告服务中获取利润。平台还通过探索综合信息向消费者推荐新用户,以扩大用户规模,从而产生更多数据和更多广告收入。此外,用户数据具有固有的可扩展性,可以非常低的成本轻松扩展到其他相关领域。平台可以快速构建一个相对独立的数字平台生态系统。阿里巴巴在非购物领域快速扩张和成功的主要原因是它能够整合消费者数据并将其应用于相关领域。此时的关键资源是数据,不仅仅是针对广告,而且还要优化产品和服务本身,拥有最多数据的公司不仅仅处于主导自己行业的最佳位置,也准备好接管相邻的田地。此外,如果这些公司编制有关用户的政治敏感信息并调解他们的内容体验,他们也是强有力的政治角色。平台的核心资产是数据。平台从本质上讲是数据收集、整理与商业化平台。因而,从规制有效性角度看,控制了平台数据就控制了平台。
除了数据,算法也是规制互联网平台必须考虑的要素。算法是设计良好的可计算的过程,它把某个值或某些值作为输入并产生某个值或某些值作为输出。换句话说,算法是完成某个特定的设计良好的任务的路线图。[20]算法是计算机科学领域最重要的基石之一。算法决定了用户使用Google搜索的结果,算法决定了新浪微博向用户展示的话题,算法决定了Netflix向用户推荐的电影,算法决定了用户QQ对话窗弹出的横幅广告等,这都意味着“算法在统治世界”。[21]就平台而言,算法决定了平台的商业模式。不同的互联网平台从本质上讲就是不同的算法模式。数据是重要的。但是,没有正确方法的数据只是噪音。因而,算法对于平台的发展至关重要。特别是在人工智能的环境下,深度学习算法日益获得广泛应用。
平台算法是平台发展的基础,算法决定了平台的商业模式与发展基础。而数据是平台发展的核心资产,没有数据,算法就没有可供利用的资源,对于自我学习的算法而言,也缺乏了修正错误与改进算法的基础。因而,数据与算法构成了平台发展的核心。从规制有效性角度看,只有有效规制数据与算法的应用才可能有效规制平台的发展。
(三)以促进算法正义与数据正义为目标
算法与数据规制的目标为何?传统规制互联网平台经营者责任的规则强调从主观的注意义务角度规制其责任,要求平台经营者承担一定的管理、合作等注意义务,很少涉及算法与数据的规制问题。平台法必须从平台自身的结构与模式出发,强化对算法与数据的规制。算法与数据的规制核心就是必须坚持算法正义与数据正义。
尽管作为一个发展中的理念,数据正义的含义远未定型,但“数据反歧视”和“数据透明”必然是题中之义。[22]“数据透明”要求数据的收集、处理必须公开、同意,不存在数据黑箱。从平台规制角度看,“数据透明”原则意味着平台的数据收集行为必须是公开的、获得明确授权的。未经许可的数据收集行为不符合数据正义的要求。此外,对于数据处理与加工行为而言,未经许可不应对数据主体的数据信息进行加工处理,即使获得许可,也只能在许可范围内进行加工处理。对于“数据反歧视”原则而言,平台的数据收集应该是全面的、不带偏见的,不能恶意收集数据主体的负面数据信息。另外,加工数据时应全面客观分析数据信息,在算法设计时,要考虑数据输入与输出的全面性、完整性,要保障数据主体的异议权。此外,数据安全也应是算法正义的应有之义。没有数据安全,就没有个人隐私,个人就可能成为网络环境下“裸体的人”。因而,在数据收集、存储、传输、处理、使用等活动中必须坚守数据安全原则。
算法正义要求算法具有透明性与解释性,避免算法偏见。对于算法歧视,应要求算法设计者不将自己的偏见嵌入算法系统。算法结果建立在数据之上,基础数据的不完善将直接影响算法输出的科学性。因而,算法设计者应力促通过算法获得数据的准确性、全面性。对于通过算法输出与输入的数据,应要求数据全面、完整、非歧视。此外,对于人工智能等深度学习算法,由于系统的自主学习、决策能力很强,它的开发者无法预测最终将输出什么结果,那么“黑箱”的存在将不可避免。对此,应强化算法设计者对算法的解释性阐释,应禁止完全不能解释的算法的应用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。