将研究的这些社交媒体所得的样本进行汇总,汇总后的词频统计得出,具有不同的词汇202 621个,词频最大的词其出现频次为44 918次,出现频次为1的词共有104 619个。所有词的词频均值为22.15次,中值和众数都为1次(表3-15)。
表3-15 汇总后总文本的词频统计量
根据表3-16,从汇总后的总体文本及其前60位的热词来看,中国文化在国际社交媒体的传播倾向于文化艺术(book、art、library)、植物和农林(flowers、plants、rose、plant、seeds、seed、garden、green)、饮食(tea)、历史(history)、教育(university)、宗教(genesha)、个人生活与情感(life)、国际(America、Japan)等。
表3-16 汇总后的热词及其词频分布
对上述七种媒体及其汇总后的文本,通过热词进行议题类型上的区分。对议题的划分和本章第五节中的区分类型相同。具体而言,包括以下门类:政治;经济/商务;文化艺术;教育;社会/民生;司法;国际;地方和区域;国防/军事;宗教;民族;医疗/卫生/健康;科技;自然;历史;环境/生态;旅游;影视/流行/娱乐文化;体育;新闻媒体;个人生活与情感;语言;时尚/设计;节日;植物/农林;动物;饮食;休闲;其他。每种取前60位的高频词,考察这些高频词是否涵盖特定方面的议题。需要指出的是,在这60个最高频的词中,剔除作为直接搜索词的China、culture以及Chinese、中国、文化这五个关键词。最后,统计得到其议题类型的分布如表3-17所示。
表3-17 议题类型分布
从中国文化在各种社交媒体传播的议题分布和差异来看,作为轻博客的Tumblr、图片社交媒体Flickr上的中国文化内容不侧重于政治议题,人际网络型的SNS网站Facebook以及Flickr上不侧重于经济议题,新闻自媒体特征浓厚的Reddit不侧重于狭义上的文化艺术内容,Tumblr上的热门议题缺乏教育方面的内容,宗教议题在Flickr上有较多呈现;民族议题在Twitter的高频词中有讨论,自然类的议题在Facebook和Flickr中有较多呈现,语言类的议题在Tumblr和Flickr上缺乏讨论传播,时尚/设计类是Tumblr所侧重的具有特色性的议题,饮食类则是各社交媒体都共同关注的议题。从前60位的高频词分布的总体来看,Twitter上的内容议题分布广泛,是这七种样本媒体中包含的议题类型最多的,除了政治、经济等议题外,还涉及现当代的影视/流行/娱乐文化以及较为敏感的民族议题。Facebook、Google+也有较为广泛的内容议题分布,其中Facebook关注的科技、自然等领域,是其他几种媒体都较少涉及的。
从话题类型的分布来看,讨论最广的是饮食类的议题,在每一种媒体都是传播的最热门议题;其次是文化艺术、教育、国际、地方和区域、历史、个人生活与情感的议题,除了个别媒体之外,几乎覆盖了所有种类媒体的最热门议题;再次一级的是经济/商务、旅游、语言、节日议题,它们也在多种社交媒体的人们议题中具有良好的覆盖性;具有很大的特色性和差异性的则是宗教、民族、国防/军事、科技、自然、环境/生态、时尚/设计、植物/农林、休闲/游戏类的议题,它们只在少数社交媒体的热门议题中得到讨论和传播;另有一些通常认为比较重要但是在这些社交媒体中并未得到高频呈现的议题,例如社会/民生、司法、医疗/卫生/健康、体育等类型。对于我国的文化国际传播和文化“走出去”而言,需要注重饮食、文化艺术、教育、地方文化、历史传统文化以及个体生活和情感等重点内容的传播;加强和塑造时尚文化、流行文化、自然和物质文化等的输出,满足国际受众对于特色内容的需求;补充和强化体育、社会民生信息、健康传播等议题的呈现,填补一些重要维度的议题类型在国际社交媒体的缺失,完善对外传播的内容生态。
对汇总后的文本,取词频最高的前150个关键词,并分别考察它们在各种社交媒体中的出现频次。截取部分(前75个高频词)如表3-18所示。
取汇总后前150个高频词,并从中剔除掉China、culture、Chinese这三个和检索主题直接相关的词。由于这前150位高频词不含“中国”“文化”这两个中文关键词,因此无需专门剔除。最后选取的前147位高频词及其词序号见表3-19。
表3-19 高频词及其词序号(www.xing528.com)
对这147个高频词进行对应分析和最优尺度分析,以考察不同的词之间以及词和媒体之间的关系和特征。高频词对应分析的结果如图3-1所示。
关于媒体的对应分析中,几种媒体的特征如图3-2所示。
图3-1 对应分析结果(147个高频词)
图3-2 对应分析结果(媒体类型)
图3-3 最优尺度分析结果
对各种媒体的热词特征,通过SPSS进行多重对应分析(最优尺度分析),如图3-3所示。分析的数据是上述的前150位高频词(剔除China、culture、Chinese三个词)在各种社交媒体中出现频次占总词数的比例。由于该比例值是连续变量,对其进行离散化,离散化的分组方法是根据正态分布,对其分为7个类别数。标记变量为词的序号。分析的各项参数值为,收敛性:0.000 001,最大迭代:100次。
图3-4 双标图
根据图3-4,其中,42(festival)、72(large)、96(plants)、140(white)、15(book)这几个热词较为接近,它们和植物、农林、图书有关;144(year)、84(new)、143(world)、90(people)这几个热词较为接近;20(catalogs)、33(double)、49(genesha)、73(leaves)、7(appearing)、40(fine)、64(image)、34(early)、100(red)这几个词较为接近,它们和宗教等有关。82(national)、8(art)、77(long)、142(work)、60(high)、12(beautiful)、119(tea)这些词较为接近,它们涉及艺术、茶饮等文化领域。此外,29(day)、23(city)、51(good)、53(great)、145(years)也是较为接近的热词。
表3-20 最优尺度分析结果多重对应分析的成分负荷
主要变量标准化。
对不同的媒体类型,基于其高频词的出现频次所占比的数值,进行多维尺度分析(ALSCAL)。距离的度量方法为euclidean距离,采用z得分的标准化方法,各项参数值中,S应力收敛性:0.001,最小s应力值:0.005,最大迭代:30次。得到的结果如图3-5。
图3-5 多维尺度分析结果
这个结果和对应分析的结果是相似的。结果显示,Twitter、Facebook、YouTube、Tumblr在高频词特征和议题内容上比较接近;Google+和Reddit比较接近,这两者与前四种媒体的接近程度更低;Flickr作为这几种社交媒体中唯一的图片型社交媒体,与上述六种媒体都有比较大的差别。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。