首页 理论教育 中国文化国际社交媒体传播研究:数据分析与样本抽取

中国文化国际社交媒体传播研究:数据分析与样本抽取

时间:2023-08-09 理论教育 版权反馈
【摘要】:本章分析的是中国文化在国际社交媒体的传播效果及其影响因素。在几种媒体样本中,具体的研究框架如下。Twitter的研究对象是2014年10月11日到2015年10月10日之间的Twitter样本,共采集得到13471条。YouTube研究的样本抽取方法是通过软件自动抓取、采集和结构化提取、存储这些帖子页面上的信息。采样和抓取的帖子在YouTube首页根据“China”和“culture”的组合关键词搜索得到,每两周采样一次。Flickr研究的对象是Flickr上传播与中国文化相关的内容的视频。

中国文化国际社交媒体传播研究:数据分析与样本抽取

本章分析的是中国文化在国际社交媒体的传播效果及其影响因素。对作为样本的社交媒体,从帖子的被转发、收藏等情况来考察所发布内容的实际认知和影响状况。在此基础上,从内容类型、内容丰富度、内容倾向性、内容话题度、传播形式、传播持续度、传者影响力、传者扩散力、传者活跃度、传者互动性、传者详实度、传者持续度等角度考察关系到传播效果的可能因素。由于各种媒体的数据类型各不相同,因此其所能获得和分析的影响因素也存在局部的差异。

其中:(1)内容类型是所发布的帖子的内容所属类型,本研究中采取前文的划分方法,将其分为31个类型(参见第三章第五节)。需说明的是,其中有一些类过于细碎,因此对于过于小的类进行合并。合并的标准有两个:一是被合并的类规模不大,不是作为经常出现的主要类别;二是被合并的类之间尽可能具有相关性或相近性。被合并的类分别如下:自然与环境/生态;风俗与节日;教育语言;个人生活情感哲学与生活哲理影视/流行/娱乐文化与新闻媒体:影视/流行/传媒/娱乐文化;民族与宗教社会/民生与司法;体育与休闲与时尚/设计;科技与医疗/卫生/健康与国防/军事。(2)内容丰富度表示内容上的丰富程度,例如帖子的篇幅、说明文字的篇幅、视频长度等。(3)内容倾向性表示内容在情感、价值等方面的倾向性。(4)内容话题度表示内容容易引发讨论话题的程度,也反映着帖子对网民“议程”的关联和设置能力。(5)传播形式关系到内容的媒介传播环节和方式特点,内容中有无超链接、有无设置标签词都关系到传播中的不同形式。(6)传播持续度指帖子内容在时间上的传播跨度,用帖子上传以来的总天数或总月数来反映。(7)传者影响力是帖子传者的影响力,例如其被订阅数、粉丝数、被收藏数等。(8)传 者扩散力反映传者在影响力上的增长速度和扩散效率,用日均或月均的传者影响力来反映。(9)传者详实度用传者在社交媒体对自身情况进行必要的说明和展示的详实程度,例如自我说明、个人资料的丰实度。帖子的传者在社交媒体中可以提供自身的多种资料,如个人的网址或所在地等,这关系到对传者的轮廓勾画和形象建构,也可能影响到传者与受众的交互架构。(10)传者持续度表示传者在该社交媒体平台上活动和传播的时间跨度长短,主要是考察其从注册到采样时间为止的时间跨度。

在几种媒体样本中,具体的研究框架如下。(1)Twitter。从帖子的被转推数、被收藏数来反映作为帖子传播效果的评估指标,考察它和帖子的内容类型、内容丰富度、内容话题度、传播形式、传播持续度、传者影响力、传者扩散力、传者活跃度、传者互动性、传者详实度、传者社会特征、传者持续度之间的关系。(2)Google+。从帖子的点赞数、分享数来作为其传播效果的衡量指标,考察它和帖子的内容类型、内容丰富度、内容话题度、传播形式、传播持续度、传者影响力、传者扩散力、传者活跃度、传者互动性、传者详实度、传者社会特征、传者持续度之间的关系。(3)YouTube。该媒体上的帖子都以视频形式发布,从视频的被点击观看次数来反映其传播效果。考察它和帖子的内容类型、内容丰富度、内容倾向性、内容话题度、传播形式、传播持续度、传者影响力、传者扩散力、传者持续度之间的关系。(4)Flickr。从图片帖的被点击观看数和被收藏数考察其传播效果,分析其与帖子的内容类型、内容丰富度、内容话题度、传播形式、传播持续度、传者影响力、传者扩散力、传者活跃度、传者互动性、传者详实度、传者持续度之间的作用关系和机制。(www.xing528.com)

各媒体的取样方法如下。(1)Twitter的研究对象是2014年10月11日到2015年10月10日之间的Twitter样本,共采集得到13 471条。这些推文中,删除正文相同的帖子后,剩11 830条;由于Twitter中大量的推特无人回复、转推或收藏,因此再从上述结果中删去转推数、收藏数都为0的帖子,剩下的为3 850条。对这些具有转推或收藏数的帖子,进行其传播效果的分析。(2)Google+的研究样本的抽取方法是通过“八爪鱼软件,自动抓取、采集和结构化提取、存储这些帖子页面上的信息。采样和抓取的帖子在Google+首页根据“China”和“culture”的组合关键词搜索按时间更新顺序的帖子得到。Google+采集的是2014年10月21日到2015年10月20日按时间更新排序的帖子,共得4 947条,这些帖子的网址都不相同,但包含重复的内容。对此进行再删选,剔除传者名称和正文都相同的帖子后剩余4 409条。(3)YouTube研究的样本抽取方法是通过软件自动抓取、采集和结构化提取、存储这些帖子页面上的信息。采样和抓取的帖子在YouTube首页根据“China”和“culture”的组合关键词搜索得到,每两周采样一次。共抓取2014年11月16日至2015年11月15日之间上传的YouTube帖子,去除重复帖之后,剩下的样本2 486条。帖子及其相关信息(包括帖子标题、帖子链接网址、视频说明文字部分、视频时长、传者账号名、传者在YouTube页面的链接网址、上传日期、点击观看次数、点赞数、点踩数、评论数、视频内容所属类别、音乐名称、推荐者信息等)的抓取时间为2015年11月20日。(4)Flickr研究的对象是Flickr上传播与中国文化相关的内容的视频。样本的抽取方法是通过“八爪鱼”软件,自动抓取、采集和结构化提取、存储这些帖子页面上的信息。采样和抓取的帖子在Flickr首页根据“China”和“culture”的组合关键词搜索得到,每两周采样一次。Flickr采集的是2014年11月4日到2015年11月3日按时间更新排序的照片,共得16 692条,这些照片帖的网址都不相同,但包含标题与正文都重复的。对此,进行再删选,剔除标题和正文都重复的帖子后剩余10 490条。

需要指出的是,后文对四种媒体的分析中,除了对于内容类型的分析是各随机抽取400条帖子作为样本外,其他各项指标的分析都是对本处所指的所抽取的所有样本的分析。之所以对内容类型的分析不采取这里所抓取和预处理的全样本,是因为对内容类型的认定和编码需要人工进行,不可能对上万条的帖子进行一一的分类。本章中各媒体用于内容分类的400条随机样本,其抽取方法同第三章第五节中的方法和过程。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈