首页 理论教育 智能生成的传播新范式

智能生成的传播新范式

时间:2023-11-18 理论教育 版权反馈
【摘要】:智能生成塑传的学术研究与实践应用的结合,体现在从学术范式到实践模式的落地转换。缺乏计算机智能而进行智能生成塑传是无法完成的任务。本章就可为智能生成塑传所用的计算机科技、思维方式、方法模式等进行集中梳理,并就基于此科学技术建构相应的智能生成塑传实践模式及案例解剖分析进行集中阐释。而将计算机思维融入塑造传播实践问题的解决之中,亦能够为智能生成塑传提供理念指引。

智能生成的传播新范式

智能生成塑传的学术研究与实践应用的结合,体现在从学术范式到实践模式的落地转换。而在这其中,相应的计算机科学、技术甚至是思维,是这一塑造传播领域生产力转化的核心要素和抓手。缺乏计算机智能(包含人工智能)而进行智能生成塑传是无法完成的任务(mission impossible)。本章就可为智能生成塑传所用的计算机科技、思维方式、方法模式等进行集中梳理,并就基于此科学技术建构相应的智能生成塑传实践模式及案例解剖分析进行集中阐释。

从全世界范围看,在塑造传播的产、学、研结合较为成功的国际一流高校中,将计算机科学、技术以及思维(包括计算机智能与人类智能的智能融合)融合以生成范式融汇运用于解决塑造传播的实践问题已呈现出大潮之势。这当中具有代表性的塑传产、学、研中心,分别为卡内基梅隆大学(Carnegie Mellon University,CMU)的计算机思维研究中心(Center for Computational Thinking)、斯坦福大学的说服技术实验室(Persuasive Technology Lab)和麻省理工学院媒体实验室(Media Lab)的情感计算研究组(Affective Computing Group)等,它们的相关成果皆展现出解决实际问题的强大生产力。值得指出的是,卡内基梅隆大学、斯坦福大学、麻省理工学院和加州大学伯克利分校(University of California at Berkeley)的计算机科学专业常年并列雄踞美国新闻和世界报导(US News Rankings)世界大学学科排行的首位,被誉为计算机科学领域的“四大”(Big Four)。

一、生发于卡内基梅隆大学的计算机思维

以“计算机思维是一件卡内基梅隆大学的事情”(Computational thinking is a Carnegie Mellon thing)为口号,CMU的计算机思维研究中心专注于面向解决实践问题的探索研究(Problem-oriented Explorations)。这一口号也体现出该中心的责任胸怀和品牌意识。而将计算机思维融入塑造传播实践问题的解决之中,亦能够为智能生成塑传提供理念指引。

图4.0.1 计算机思维关键词词云

图4.0.1将计算机思维的关键词以wordle.net词云的方式呈现了出来(http://www.cs.cmu.edu/~CompThink/)。计算机思维研究中心创始人、卡内基梅隆大学教授周以真(Jeannette Wing)[1]这样阐述计算机思维:计算机思维是每个人的基本技能,并非仅仅属于计算机科学家。所谓计算机思维是像计算机科学家一样(而非像计算机一样)去运用计算机科学的概念去解决问题、设计系统、理解人类的行为。当我们面对一个特定的理论或实践问题时,首先会问:解决这个问题有多么困难?什么才是最优的解决方法?而计算机思维则可以根据坚实的理论基础来准确地回答这些问题。计算机思维能够通过简化、嵌入、转化、模拟等方法,将一个看来很困难的问题重新阐释为一个我们知道如何解决的问题。计算机思维同时强调递归思维和并行处理思维。它既考虑益处也考虑害处,既考虑解决方案的威力又了解其代价。在评价一个解决方案时,不光考虑其解决问题的效果和效率的功能的一面,还会考虑其设计是否具有简洁和优雅的美学的另一面。计算机思维采用抽象和分解来直面繁杂的任务或设计庞大复杂的系统。它选择最合适的方式去陈述一个问题,或选择最合适的方式对该问题的相关方面进行建模,使其易于处理。它使得人们在不必理解解决方案的每一个细节的情况下就能够安全地使用和调整一个大型的复杂的系统。计算机思维还按照预防、保护、冗余、容错、纠错的方式以从最坏情形恢复,利用启发式推理来寻求问题的解答,在不确定情况下进行规划、学习和调度。它利用海量数据来促进计算,在时间与空间、计算能力与存储能力之间进行权衡。

周以真(Wing[2])认为,计算机思维具有如下的特征:(1)进行概念化而非程序化:计算机科学并不是计算机程序设计。拥有计算机思维意味着能够像计算机科学家那样去思考,能够在抽象的多个层次上思维。(2)根本的而非刻板的:计算机思维是一种人类在现代社会当中发挥智能所必须掌握的根本技能,但这一技能不是刻板的机械重复。(3)人的而非计算机的思维方式:计算机思维是人类解决问题的一种进路,它要求人像计算机科学家那样去思考,而非像计算机那样去思考。计算机本身是枯燥乏味的,人类(包括计算机科学家)则是聪慧的、富有想象力的,是人类赋予了计算机激情。当可以运用计算机的计算和储存能力之后,人类将能够去解决在这之前不敢尝试的问题。(4)数学和工程思维的互补融合:计算机科学既在本质上源自数学思维,其形式化以数学为基础;又从本质上源自工程思维,以建构与实际世界交互、解决实践问题的系统为目的。而计算机的计算与储存能力的限制又迫使计算机科学家认真思考,不能仅仅限于数学性的思考。同时,正是因为拥有建构赛博世界的自由度,才使得人们能够设计出超越物理世界的各种系统。(5)是思想而非人造物:我们并不只是生产出各种软件和硬件的人造物来进行生产生活,更为重要的是我们形成了一种用以接近和求解问题、管理生产生活以及与他人交流互动的思想。(6)面向所有人、所有地方:有刻板印象认为计算机科学的基础研究已经完成,剩下的仅仅是将其应用的工程问题。但事实并非如此。具有智力挑战和引人入胜的科学问题依旧亟待理解和解决。而当计算机思维真正融入人类生产生活而非仅仅是一种显式哲学之时,其功能效用将成为现实。

二、生发于斯坦福大学的计算机说服学

图4.0.2 计算机说服学(capatology)的交叉学科建构

斯坦福大学的说服技术实验室则将传播学研究的说服和计算机科学的技术结合起来,研究如何通过设计和运用计算机工具来改变受众的态度和行为。说服技术实验室创始人、心理学家福格(B.J.Fogg)博士于1996年首次提出“计算机说服学”(captology)的交叉学科设想。该术语的英文单词由两部分组成:“ology”代表学科,而“CAPT”则是“Computers As Persuasive Technologies”(CAPT)的短语的首字母大写缩写(acronym),意为将“计算机作为说服工具”。如图4.0.2所示,计算机说服学[3]一方面关注计算机工具(即对计算机、手机和其他智能设备、网站、无线科技、移动应用、视觉游戏的设计、研发、分析),另一方面则关注改变人们的态度行为(即,改变人们怎么想和怎么做)。将两者交叉融合,形成了专注于研究目标行为(target behaviors)的以及如何达成这一行为的新学科。斯坦福说服技术实验室则把研究如何将计算机作为说服工具(即说服技术)用于说服及其符合伦理的使用作为研究定位。实验室主任福格于1993—1997年在斯坦福大学攻读实验心理学博士,随后即创立计算机说服学新学科及说服技术实验室。说服科技发展近30年已成为全球性的学术研究和设计领域。福格博士指导的学生也取得了10周内1 600万脸书应用安装速度的实践成功。福格博士本人亦被《财富》杂志选为“你应该了解的十大新导师”(1 0 New Gur us You Should K now)。

如图4.0.3所示,计算机说服学或说服技术的理论核心即为福格建立的Fogg行为模型[4]。福格认为,动机(Motivation)、能力(Ability)和触发(Trigger)是产生特定行为(Behavior)的三大因素,即B=MAT模型。动机(M)指潜在行为人想进行该行为的意愿的强烈程度;能力(A)指潜在行为人进行该行为的难易程度;触发(T)则是潜在行为人的内部或外部环境中的线索,提示潜在行为人应该立即实施该行为。若以发送一条微博为例,潜在行为人(即传播者)是否进行发送微博的动作由三大因素决定:传播者是否有一定的发送微博的意愿(即动机);传播者使用微博这一社交媒体平台来发送微博相对容易,操作困难不大(即能力);以及是否有一个提示告知传播者“现在即是发送微博的最佳时机”(即触发)。只有这三大因素都具备,传播者才会进行发送微博的目标行为。

图4.0.3 B=MAT行为模型(www.xing528.com)

福格认为,这三大因素无法独立对目标行为产生影响。对于触发而言,只有潜在行为人的动机和能力都在水平之上,对潜在行为人的触发才能真正导致目标行为的发生。动机和能力缺一不可。若某一目标行为对潜在行为人而言,动机很高,但能力很低,不断对潜在行为人进行触发非但不会激发目标行为,反而会让其产生沮丧(frustration)的情绪。动机高意味着该潜在行为人非常想做出此目标行为;能力低则意味着做出该目标行为对于该潜在行为人而言非常困难;反复地触发只会不断地提醒该潜在行为人其无法做到非常想做的这一严酷现实,从而产生强烈的挫折感。例如,在不能熟练运用但又非常需要去运用新媒体进行传播的人群当中,这一情况非常普遍。

相反地,若某一目标行为对于潜在行为人而言,动机很低,但能力很高,不断对潜在行为人进行触发亦不会激发目标行为,反而会让其产生恼怒(annoyance)的情绪。动机低直接意味着该潜在行为人本身就不愿意做出此目标行为;能力高意味着做出该目标行为对于该潜在行为人而言非常容易;反复地触发只会不断地骚扰该潜在行为人去做出可以做到但是其本身却并不想做出的目标行为,从而令其产生强烈的恼怒情绪。例如,在互联网平台上不断弹出的、用户可以轻易点击观看或进一步操作的广告发布中,这一情况非常普遍。对于潜在行为人(即广告受众)而言,不断地弹出其不关心的广告非但不能促使其点击,反而会使其因此产生反感的“回旋镖效应”。

对于能力和动机而言,福格认为应该更加重视在能力方面的投入而非动机方面。这看似与激发目标行为的传统认知相矛盾(在传统认知上,提高潜在行为人愿意做出目标行为的意愿能够更容易地激发目标行为)。但在福格看来,对增强能力的投入更为高效。对于潜在行为人进行特定目标行为而言,一旦做出此行为的能力得到了提升,能力再下降的可能性很低。例如,对于那些之前不能熟练运用但又非常需要去运用新媒体进行传播的人群而言,提高了运用的熟练度之后,熟练度下降几乎不太可能。福格认为,能力的提升固然可以从潜在行为人处出发,对其进行教育、培训,但作为计算机说服学或说服技术来说,提高计算机工具的易用度应该成为努力的方向。

增强对动机的投入也能在一定程度上增加激发目标行为的概率。但是,做出某一项目标行为的动机对于潜在行为人而言是不断变化的。即使在当前提升了其动机,但不能保证在不远的未来潜在行为人实施目标行为的动机就不会消失。例如,潜在行为人观看互联网广告的意愿可能在当下很高,但在一定时间过去之后,该动机有可能会渐渐消退。从投入产出的效率进行分析,应该更加重视对能力而非动机的投入。而从之前的分析可知,即使能力和动机已达到水平之上,没有触发的参与、提醒潜在行为人现在正是做出目标行为的时机,目标行为仍然无法实施。因此,Fogg认为,进行面向传播实践的说服技术相应解决方案的建构时,应该遵循先触发、后能力、再动机的顺序进行。当然,这三大因素都是潜在行为人实施目标动作的必要因素。若要让目标行为无法实施,只需要破坏掉三大因素条件中的其中一个即可。

三、生发于麻省理工学院媒体实验室的情感计算

麻省理工学院的媒体实验室致力于科技、艺术、媒体的跨学科研究,诞生过如mp4格式、吉他英雄等诸多发明创造。当中的罗萨琳德·皮卡德(Rosalind Picard)教授于1995年开创了情感计算(affective computing)这一计算机科学与心理学、传播学、认知科学、神经科学、社会学教育学等的交叉学科研究领域,并创办了麻省理工情感计算研究组。在皮卡德的专著《情感计算》(Af fective Computing)[5]中,情感计算被定义为“来自影响情绪(emotion)或其他情感现象相关的计算”。扩展来说,情感计算聚焦于对人类的情绪和其他情感现象的识别(recognize)、阐释(interpret)和仿真模拟(simulate)以及实现相应功能的系统设计。情感计算关注于建构能够描述和解释情感因素条件如何影响人类与科技的交互的原则和理论,同时关注情感的感知和模拟技术如何能够使人们理解人类的情感需求,以及关注如何实现和衡量那些慎重考虑了情感因素如何影响系统实用性(usability)的解决方案。

在皮卡德看来,情感是人类经历的基础,影响着人们的感受、认知以及各种生产生活任务(包括学习、交流、沟通甚至是理性决定)的完成。然而,当前的科技人员常常忽视情感的重要性,致使诸多系统的使用难度大大增加,给用户造成了一种强烈的沮丧感。这很大程度上是因为情感被误解以及情感很难测量的缘故。而情感计算的研究目的,恰恰是为了研发和建构全新的科技和理论,以推进人们对情感及其在人类经历中的角色的基础理解,尝试维系在设计解决人类需求的科技时情感和认知的平衡。

麻省理工情感计算组的研究主要涉及六大方面,包括:(1)设计让人类交流情感认知状态的新手段,特别是全新可穿戴传感器的创造和用于联合分析多模态(multimodal)信息的机器学习算法的设计;(2)创造在自然的交互和对话中间接测量沮丧、压力和情绪的新科技;(3)展示计算机的情绪智能,特别是在遇到用户沮丧情绪时能够降低其负面情绪的能力;(4)创造用于个人的科技以提高人们对自我情感状态的感知以及对他人的有选择性的情感表达;(5)增强对情绪如何影响人们健康的理解;(6)开创情感计算当中的伦理问题的研究。

情感计算机组的研究不仅聚焦于学术,也关注成果转化产生生产力的应用实践。具有代表性的便是皮卡德初创的两家公司,Affectiva和Empatica。前者专注于研发情绪识别和监测的软件技术,后者则聚焦搭载这些相关软件的传感器硬件。Affectiva的情绪识别软件已经能够实时在视频中识别使用者的情绪。其通过将视频中的面部表情数据点进行定位,然后将其输入机器学习算法模型,智能判别视频中当前使用者的情绪。基于这一技术,Affectiva开发了可以在智能移动设备上以摄像头作为视觉传感器,实时监测使用者情绪的应用AffedexMe。如图4.0.4所示,用户只需将智能手机平板计算机等智能移动设备的前置摄像头对准自己的脸部,AffedexMe软件即可依托计算机智能,自动识别出用户的当前情绪。其分别给出了愤怒(anger)、欢乐(joy)、厌恶(disgust)、悲伤(sadness)、恐惧(fear)和假笑(smirk)各种情绪的程度(以百分比显示)。例如,AffedexMe判断图中用户假笑的程度达到了100%,厌恶的情绪达到了1%,而其他情绪不明显。除去智能移动设备之外,Affectiva利用这一技术建构了面向传播实践问题的以优化(optimization)、预测(prediction)和衡量(evaluation)为三大主轴的解决方案:在优化方面,Affectiva立足于对视听内容进行以帧(frame)为单位的重构,尝试最大化受众的情感代入度(emotional engagement);在预测方面,Affectiva基于对用户情感的判别,预测随之而来的商业结果(如销售业绩等);在衡量方面,以地理和产品的种类区别衡量数字媒体对情绪的效用。Affectiva具体的成功实践案例包括:预测电视受众在什么时间节点选择跳过当前观看的内容;分析电影当中最能激发受众情绪的镜头用以制作预告片(trailer)以及预测票房收入;定量衡量娱乐节目的戏剧化程度和商业价值;给予智能移动媒体识别情感的能力;衡量包括可口可乐广告在内的有效度;在政治辩论时测量受众的反应;在游戏中衡量玩家的当前情感状态和整体情感经历。在建构实践问题的解决方案的同时,Affectiva亦积累了情感大数据,包含来自75个国家的超过500亿个情感数据点。与此同时,Affectiva开放了云计算应用编程接口(Application Programming Interface,API),此API能够对语音中的情绪进行智能判别。截至2018年5月,Affectiva收到了包括李嘉诚投资在内的3 400万美金的风险投资

图4.0.4 Aff ectiva的视频情绪实
时识别

对上述内容进行总节可以发现,面向塑造传播的实践问题,上述三位学者(周以真、福格、皮卡德)分别在三所世界一流大学(卡内基梅隆大学、斯坦福大学和麻省理工学院)创立了全新的交叉学科以及相应的研究机构。而其产学研结合而产生的解决塑造传播实践问题的生产力的成功,无一不是运用了跨学科的研究方法,特别是与计算机科学(计算机智能)进行结合。对于智能生成塑传而言,这一点同样重要。如下的各个章节就对可用于智能生成塑传的计算机科技、思维、方法进行阐述,并基于案例进行智能生成塑传实践新模式的建构。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈