首页 理论教育 计算传播学:算法揭示隐私奥秘

计算传播学:算法揭示隐私奥秘

更新时间:2025-01-19 工作计划 版权反馈
【摘要】:无论何种说法,囚徒们所处的环境对于监视者而言都是透明的,他们能够清晰地掌握囚徒们的一举一动。尽管我们不能认定是算法操纵甚至决定了某些重大的公民决策行为,也无法给出算法对公民的政治理念和投票行为究竟产生了多大程度的影响,但有一点是明确的:算法能够从我们遗留在网络上的数字踪迹中挖掘出更丰富的具体到每一位用户的各类信息以服务于其商业目的或者其他目的,这其中当然包括大量的用户隐私。

英国哲学家杰里米·边沁设计了这样一种“圆形监狱”:在其中,每一个囚徒的所有行为动作对于监视者而言都是可见的,但监视者的任何心理、表情和动作对于囚徒们而言则是无从得知的,他们甚至在根本上不知道监视者的存在。法国哲学家米歇尔·福柯在其著名的《规训与惩罚》一书中使用了“全景监狱”的概念来表达了与边沁类似的意思,但在这里囚徒们在一定程度上是意识到监视者存在的。无论何种说法,囚徒们所处的环境对于监视者而言都是透明的,他们能够清晰地掌握囚徒们的一举一动。在当前的信息社会,每位用户在数字终端上的浏览痕迹、跳转路径、消费记录以及其他各种动作都被以不同的形式存储和保存了下来,构成了所谓的大数据的一部分。这其中绝大部分数据是无意义无价值的,它们根本不会被谁注意到就淹没在了浩浩荡荡的数据洪流之中;但是越来越多的机构——无论是出于商业目的还是政治目的——正在开发各种各样的算法激活大数据中所蕴含的巨大价值。借助算法,我们在大数据的海洋中淘洗到了美丽的贝壳,甚至还发现了闪闪发光的珍珠,那就是数据中所蕴含的关于用户个人的基本情况、兴趣偏好、价值观念、消费需求乃至政治倾向等有助于对用户行为进行预测、引导和施加影响的重要信息。例如,2018年3月引起全球互联网用户极大关注的脸书数据门事件,事件的主角“剑桥分析”公司就涉嫌窃取超过5000万脸书用户的个人数据,并在此基础上利用数据挖掘工具和算法推荐系统来操纵美国大选及英国脱欧的投票。

尽管我们不能认定是算法操纵甚至决定了某些重大的公民决策行为,也无法给出算法对公民的政治理念和投票行为究竟产生了多大程度的影响,但有一点是明确的:算法能够从我们遗留在网络上的数字踪迹中挖掘出更丰富的具体到每一位用户的各类信息以服务于其商业目的或者其他目的,这其中当然包括大量的用户隐私。在这种数据可以被实时收集、存储和挖掘的语境下,波斯特从福柯的“全景监狱”出发,指出了“今天的传播环路似及它们产生的数据库,构成了一座超级全景监狱,一套没有围墙、窗子、塔楼和狱卒的监督系统”[15],我们每个人则成为这个超级全景监狱中的“囚徒”,尽管其中的绝大多数人并没有时时刻刻自发地感知到这种“监视”——当然,监视也不是时时刻刻都存在,但这种由数据、算法和传播权力编织起来的监视与被监视、传播与被传播、操纵与被操纵的虚拟关系确实产生着相应的影响。每年都有层出不穷的数据泄露事件和隐私侵权事件,但用户仍然并不知道自己的隐私会如何被侵犯,被侵犯到何种程度,因为数据和隐私这样的概念对用户而言太抽象了,除非有具体的且恶劣的行为严重伤害到了他们,否则他们就会觉得无关痛痒,更何况“他们与那些掌握并利用甚至可能出卖他们的隐私数据的公司之间,天然是不平等的。在缺乏对自己数据的知情能力的情况下,隐私保护也就无从谈起”[16]

但或许我们也不能因此而彻底悲观甚至陷入绝望,情况可能没有我们想象的那么糟糕。比如《福布斯》杂志曾经就专门针对隐私这件事情撰文指出:“小孩子就是不在乎,或者不理解老一代人所指的‘隐私’一词的意思……70%的千禧代人说没有人有权接近他们的数据或线上行为;但51%的说,如果能被告知,他们愿意共享信息。”[17]Liana Brüseke[18]就千禧一代和婴儿潮一代对在线购物行为中的隐私认知情况进行的对比研究中也在一定程度上支持了上述说法,不同世代的人群对待数字世界中的隐私问题持有不同的态度和观点。

当然,年轻人对个人数据和隐私持有更加开放和乐观的态度是完全可以理解的,他们是信息时代的互联网原住民,更容易认可和支持数据共享行为,还没有受到过太多因为隐私泄露而产生的各种困扰,而且,任何一个国家、任何一个时代的年轻群体总是相对于年老群体对新出现的事物和问题保持激进态度。但这也并不一定就意味着年轻人一点儿都不关心他们的数据安全和隐私风险,例如Brien等人的研究就发现千禧一代非常清楚社交网站中的低隐私设置所存在的风险,并主动采取了一些保护措施以防自己信息的泄露。[19]更何况,随着年龄的逐渐增长,很多年轻人不怎么关注隐私问题的状况还极有可能发生根本性的变化,谁会真的希望在看似匿名、自主、安全的网络环境背后有一双甚至无数双眼睛盯着自己看呢?互联网领域一直引以为豪的共享思维和共享技术塑造了年青一代的思想和行为,使得他们更愿意分享从经验到知识、从数字产品到实体产品等所有非独占性的东西,但这不是说他们会愿意分享所有的一切,或许他们缩小了自己所认为的隐私应该涉及的范围,但他们肯定不会放弃隐私权。“数字化技术能使隐私侵犯更加绝对化,结果它威胁,甚至破坏了我们大家晚上带回家的‘真正的自我’。在持续不断的监控下,我们的行为不像是我们自己的,我们有时甚至不是自己,我们会尽力掩饰自己,希望避免超级牢固的刺网的监视。”[20]现在,这种监视、诱导以及操控行为正在把并非我们真正需要的信息和商品推送给我们,正在从更深层次改变我们对世界的认知、态度乃至行为,因为它看见了我们,于是它能预测、影响甚至改变我们的想法和做法。而我们中的大多数,却看不见、听不到也感知不到它的存在。

探讨:数据伦理与用户隐私

最近几年,你有没有发现一个比较奇怪的现象:手机上安装的应用软件越来越了解你了。如果你的回答是没有,那么我们不妨来回忆一下,最近一段时间你有没有这样的一些经历:你在百度搜索了某一个并不经常购买的商品,结果当你打开淘宝、京东、拼多多或者其他什么网页的时候,这些电商网站居然向你推荐了你搜索的这件商品,或者,这些你所打开的网页居然出现了这件商品的弹出广告。这很诡异吗?其实一点儿也不。因为这已经是一个普遍的商业场景和媒体应用,在媒介内容消费领域它被称为个性化推荐,在广告投放领域它被称为程序化广告,其基本的逻辑都是通过挖掘用户数据进行算法推荐。

目前,移动互联网领域主流的应用软件几乎都无一例外地使用了算法推荐技术。

如果你在百度、优酷、腾讯搜索过一首粤语歌曲,那么有可能在打开网易云音乐的时候被推荐这首歌曲;如果你在京东浏览过某一本图书并把它放进了购物车里,那么你有可能在打开其他图书网站或者再次打开京东网站的时候被推荐与这本书主题类似的其他图书;还有,婚恋网站可能非常清楚地知道你更喜欢什么风格的女性或者男性,美食网站可能会向你推荐在你的公司或者住址附件的美食,资讯网站可能会不停地为你呈现你所喜欢的明星八卦或网红娱乐,微信朋友圈的广告也是根据你的用户画像或标签而进行定向投放的……

更有甚者,有些电商的卖家会根据对用户消费数据的分析来决定是否向这名用户发正品或者假货,就连Facebook这样的互联网巨头都曾经一度深陷利用数据操纵选举的丑闻。越来越多的用户开始注意到这些现象,而实际上,当用户反应过来的时候,个性化推荐和程序化广告早已经变得铺天盖地。

那么,紧接着而来的就是用户的疑惑与焦虑:我的隐私是不是被泄露了?我的数据是不是被贩卖了?我的消费是不是被操控了?要不然,为什么这些应用的内容推荐与广告投放会越来越精准呢?答案是肯定的,只是你的隐私究竟是被谁泄露了、你的数据有多少比例被贩卖了、你的消费在多大程度上被操控了,这还有待于进一步探讨。互联网公司之间有没有数据交易?答案也是肯定的。只是在这个交易的过程中,用户的隐私和用户的数据是被保护了还是被泄露了,在多大程度上被保护或者被泄露了,这也还有待于进一步探讨。这也就难怪那些对大数据、人工智能和个性化算法持悲观主义态度的研究者会对很多互联网巨头进行强烈的批评。

事实上,互联网公司的确是因为获取、积累并挖掘了用户浏览、使用、消费等行为的大数据而不断将用户的标签体系做得越来越丰富和越来越完善的,也正因此,用户画像越来越像一个个丰满、立体、具象的个人,而不再是一幅幅抽象、平面、模糊的群体。

但是,每家企业能够获取到的数据都只是用户全部数据中的一部分,例如高德地图积累的更多的是与你的地理搜索、出行、导航相关的数据,天猫积累的更多的是与你的浏览和购买商品相关的数据,微信积累的数据或许涵盖的面会更广泛一些,它会涉及你的社交、理财、出行、生活消费等诸多维度,但利用这些数据也不能勾画出一个完整的你。

正是因为任何一家互联网公司都不可能像你的父母、配偶、子女或者亲戚朋友那样对你的性格、兴趣、偏好、财产等了如指掌,当他们想要丰富你的用户画像的时候,除了自己家的数据之外,就必须借助其他家的数据相互匹配相互补充,这样它才能越来越了解你,了解你住在哪里、你喜欢吃什么菜、你经常交往的朋友都有哪些人、你喜欢上什么样移动应用浏览什么样的内容……这时候就需要打通各家的数据进行数据共享。但是太阳底下没有免费的数据,除了自己家通过强制用户同意开放给你的数据之外,这就必然产生数据交易行为和数据交易市场。也就是用户所观察到的:我的数据被卖了。百度公司董事长兼首席执行官李彦宏在一次以“中国经济的新动能”为主题的发言中就曾经提到过这样的一个观点,他说:中国的消费者在隐私保护的前提下,很多时候是愿意以一定的个人数据授权使用,去换取更加便捷的服务。这句话被媒体断章取义后就变成了“用户自愿放弃隐私换取便利”,并且受到了很多网民和专家的围攻。(www.xing528.com)

然而,事实的情况确实如此。几乎所有的用户在安装某一款软件或者应用的时候,都会被询问“你是否同意……”,下面有同意和不同意两个选项。99%的用户在99%的情况下都会点击选择“同意”,然而,99%的用户在99%的情况下其实压根都不知道自己同意的内容是什么。这其中,就有涉及我们每个人切身利益的个人隐私和数据。在这个角度上看,很多数据实际上是用户自己同意开放给互联网公司的,他同意开放数据给互联网公司的目的,恰恰是为了获取使用其软件或应用带来的便利。有一次,我要安装一款应用软件,这款软件要求我允许它访问手机的通讯录功能,甚至还有很多其他应用要求访问照相机功能,但是这些应用软件所提供的服务压根与我们的通讯录和照相机等功能没有任何直接的关联。这恰恰是绝大多数互联网软件和手机应用的垄断主义策略所在,不允许访问这些功能,用户就无法使用这个软件提供的基本功能。

客观而论,用户既想要获取大量便利又想要保证自己的数据不被不合理利用的心情是可以理解的,然而这一愿景在当下乃至全球的互联网领域也都是一种奢谈。不开放给互联网公司用户的数据,它就不能更好地了解你,向你提供的内容、商品和服务也就无法做到个性化和定制化,用户的使用体验就会比那些能够提供个性化体验的应用差很多,进而就会导致用户大量流失。用户同意开放数据给互联网公司,那么谁来保证这些互联网公司在获取用户数据的时候守规矩了呢?谁又来保证它们会设身处地地为用户考虑而不是设身处地地为商业利益考虑呢?法律的监督真的起作用了吗?政策制定者会站在用户的利益考虑问题还是会站在某些利益集团效益最大化的角度考虑问题?

再进一步的,如果把用户换位为互联网公司的产品经理乃至高管,他会做出怎样的选择?是选择保护好用户的数据和隐私还是选择保护好公司的商业利益?更何况,什么是数据或许可以较清晰地界定,但什么是隐私并不是那么容易就说得清楚的。对于有些用户而言,我在互联网上是男是女都应该算作涉及个人隐私的数据,但对于另外一些用户而言,我的工作单位和家庭住址都可以不算在隐私数据的行列。什么样的数据应该界定为隐私?什么样的数据使用行为应该被界定为泄露用户隐私行为?很多时候都存在模棱两可的灰色地带。输入法在技术上是可以获取手机上所有应用的数据的,路由器以及手机的运营商在技术上也是可以获取各个软件的流量信息的,你走在路上都有可能被某一款Wi-Fi探针盒子获取到了你手机的mac地址数据,直到有一天,你被推荐了某一款产品,或者你被投放了某一则广告,很多人都不会意识到这是广告主或者经销商在挖掘了你的数据之后对你进行的个性化精准推荐。

从这个角度上看,任何购物网站、社交软件、移动应用、网络工具都存在着泄露用户数据乃至隐私的巨大嫌疑。

在互联网巨头面前,尽管用户作为一个所有互联网公司最喜欢提及的词汇是被尊重的,但任何个体的用户都从来没有真正被尊重过,他们的数据被各大巨头以各种各样新的名义贴上各种各样的标签,打包封装好之后卖给了广告主和经销商。没有任何一位用户有能力和实力与互联网巨头直接叫板对抗,更何况它们还俘虏了相当一部分与数据安全和用户隐私相关的政策制定者。在这样的情况下,用户和很多研究者能做的只有无济于事的呼吁。事实上,魔鬼出来之后就很难再回到宝葫芦中去了,就像用户也很难再回到没有互联网、移动互联网、个性化推荐的传统大众媒体时代一样,这是不可逆的。在这个意义上,仍然有相当大比例的用户群体,愿意放弃部分数据乃至隐私而获取某些便利。

今天的智能手机,已经变成人人拿得起却再也放不下的智能“机手”,它更像每个用户的“手”而不是“机”,甚至也有用户会认为如果它真的能够很好地为我提供更加便利的服务,泄露数据和隐私又有什么不可以呢。几乎绝大多数的智能手机用户并没有被数据泄露的问题所困扰,那么我们又何必为或许根本并不存在的一些问题而杞人忧天呢?至少在可以预见的将来,用户的数据一定不会是越来越少地被开放给通信运营商、网络运营商或者服务运营商了,它只会开放得越来越多,进一步的,也一定会被交易得越来越多。每一秒我们的手机GPS定位系统都在获取我们实时的地理位置,每一天我们登录的购物网站都在积累我们的交易记录,每个月我们的社交软件都会把一些新的标签贴到我们每一个人的用户画像上。甚至毫不夸张地说,智能手机可能是至今人类发明的最私密的监控设备。它持续跟踪我们的位置,它知道我们居住在什么地方,在何处工作,在何地消遣。知道我们什么时候醒来什么时候睡觉,因为人人都有手机,因此它还能知道我们和谁一起睡觉。

所以与其关心我们的数据是不是被开放给运营商了,或者是不是被运营商又倒手贩卖给了其他商业机构,倒不如去关心另外一个话题,那就是我们是不是被不公正地对待了。或许,我们之所以感到细思极恐或者恼羞成怒,并不是因为我们的信息被泄露了,而是因为我们的消费决策甚至我们的自由意志被操控了。说得更直白一点,我们不愿意相信这样的一个事实:我之所以购买了某件假货,不是因为舍不得花钱,而是因为卖家通过数据分析认为我没有辨别真货和假货的能力;我之所以买得比别人贵,不是因为我真的不在乎金钱,而是因为经销商通过数据分析得出我不是价格敏感型的用户;我之所以买了某件商品或者服务,不是因为我觉得我此刻真的需要,而是因为你通过数据预测认为我此刻真的需要……这种现象被称为“大数据杀熟”:你获取了我的数据,还反过来算计我、忽悠我、坑杀我。这或许是很多用户在得知电商网站存在价格歧视后愤怒的真正原因。

近两年经常会爆出“大数据杀熟”的现象,有部分互联网企业被曝存在大数据“杀熟”的行为,包括交通出行、差旅住房、视频会员、网络购物等网络平台均发现大数据“杀熟”,在购买同一件商品或选择同样的路程时,老用户的价格要比新用户贵许多。以某电商平台的P级会员为例,一款“爱仕达炒锅”原价为199元,会员专享价为179元,从表面上确实比普通用户要便宜了20元,但该商品目前在做活动,每位用户可以领取一张满“199减100”的立减券,普通用户在领取100元券后下单就会自动减掉100元,而会员则因为专享价变成了179,达不到199元的满额标准,只能使用会员价格购买。这就是算法“使的坏”。笔者亲身的体验是,原来不经常买图书的时候,动不动就可以抢到各种活动的优惠券;后来经常买经常买,于是各种各样的优惠券就与我无缘了,能参与的活动也少了,打的折扣也少了。为什么?因为算法会“认为”你这是刚需,价格不敏感,优惠不优惠你都会买,那为什么还要给你发放优惠券或者促销呢?基于大数据的动态定价也是这个道理。有一句经典的话是这么说的,“如果附近没有肯德基,就给用户显示更高的比萨价格”,他直白地向我们揭示了动态定价或差别定价的基本原理:供求关系和价格弹性。而在动态定价方面优步是始作俑者,在打车需求旺盛的时间段价格就会自动上浮,在需求萎靡的时间段价格就会自动下调。后来各大电商网站都开始学优步,于是你就会发现最近一段时间放在购物车里的某件商品降价了或者涨价了,其实都是算法根据你近期的浏览和消费行为对你的需求进行的预测,最终目的都是通过降价或者涨价的目的完成销售,获取最大化的利润。

这就是所谓的大数据营销、程序化投放和个性化推荐,无论概念如何有差异,但其本质都是相通的:借助大数据的挖掘和分析,判断你是谁、你现在在做什么、你希望看到什么或想要什么、你下一步将要去哪里或做什么、你愿意花多少时间或者金钱来满足你的需求……

然后,借助于已经积累起来的数据资源,针对不同用户的个性化标签和精准化画像,以不同的内容、不同的产品、不同的服务、不同的形式和不同的价格来满足不同的用户需求,从而使自身收益最大化或利润最大化。

这时候,我们就能够明白为什么一个与交通有关的软件想获取你的通讯录和照相机访问权限了,不仅如此,很多移动应用还要求获得你手机上安装的其他软件的访问权限。因为只有这样,他才能获取与你相关的更多维度的数据,才能对你进行更加完善的用户画像。

很多用户会问,怎么办?这个问题,我也很想反过来问一句:怎么办?

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈