在对非洲猪瘟疫情的网络情绪进行分析之前,我们先阐述情绪分析的研究方法。情绪分析主要有以下两类方法:
(1)基于语义与词库的研究方法。这种方法需要一个词库,记录不同词语的情感倾向,根据倾向程度的不同,分别赋予不同的权值,比如非常积极的词汇权重设为1,而非常消极或负面情绪的词汇权重设为0。当进行文本情绪分析时,先对文本进行分词处理,再从情感词库中提取词汇的情绪权重,最后计算得到文本的情绪分值。
(2)基于分类模型的研究方法。该方法把情绪分析看作是数据挖掘中的分类问题。在数据挖掘领域,分类算法很多,比较典型的有支持向量机、决策回归树和深度学习等[154]。其中深度学习在自然语言处理方面近年来发展非常迅速。基于深度学习的NLP方法能够主动学习文本特征,对输入文本进行语义理解和情感倾向判断。其底层利用词嵌入技术,同时,采用TensorFlow、Py Torch等深度学习框架,使搭建和部署深度学习模型变得更加容易。特别是近几年,一些重要的深度学习模型如卷积神经网络CNN、循环神经网络RNN被广泛应用于自然语言处理,效果很好,深度学习在情绪分析中正发挥越来越重要的作用。
国内对于中文的情绪分析,百度比较有优势,并在百度人工智能AI平台对外开放了情感倾向分析服务。它能够检测中文文本的情感词汇,判断该文本的情感极性,并给出对应极性类别的概率值和置信度[155]。在百度AI平台中,将情绪类别分成积极、中性和消极三类,分别用2、1、0三个数字表示。此外,还在Github开源了情感分类项目Senta(https://github.com/baidu/Senta)。该项目包含了基于大数据模型,通过迁移学习,可以集成到用户程序中,对用户提交的文本进行情绪分析。
首先,我们编写了网络爬虫程序,以“食品安全”“非洲猪瘟”等为主题词,定向从几大新闻网站提取信息。此外,为了分析非洲猪瘟疫情对猪肉食品代表性企业——“双汇发展”公司的市场价值的影响,我们还从一些财经资讯垂直网站抓取了对“双汇发展”的研报信息。
接着,我们将集成了百度AI平台的自然语言处理NLP模块,用Python语言对前面网络爬虫抓取的文本进行情绪分析。主要程序源代码如下:
表8.1 基于百度AipNlp模块的情绪分析Python源代码
得到关于非洲猪瘟疫情的网络情绪分值如表8.2所示。表中的第3列是情绪类别,0表示消极,1表示中性,2表示积极。而第1列则是情绪为积极倾向的概率,它是0到1之间的数,越靠近1,则表明文本所反映的内容越积极、越乐观;越接近于0,则越消极、越悲观。第2列的置信度是文本情绪取上述分值的显著性水平,是关于情绪得分的可靠性指标。
表8.2 非洲猪瘟疫情的网络情绪分值(www.xing528.com)
为了进一步观察、检验情绪分析的效果,我们将情绪分值与相应的舆情内容进行对比。以2018年11月22日的情绪分值计算结果为例,该日的情绪分值为0.0157,情绪类别为0,反映了比较消极的情绪,对应的是该日来自搜狐网的一条标题为“担心非洲猪瘟,江西多区县禁售双汇等企业猪肉引争议”的舆情消息,消息内容为:“近期非洲猪瘟疫情有所蔓延,一些地区的担忧情绪也开始上升,……接连发布通知,禁售包括双汇、博莱、吉安正邦等企业的冷鲜(冷冻)猪肉及其产品……今年8月非洲猪瘟疫情出现至今,已给中国的生猪产业带来较大的经济损失。国内已累计处理逾47万头感染猪瘟的生猪。生猪养殖遭受直接经济损失超8亿元,间接损失尚无法估计”。我们可以看出,这的确是关于非洲猪瘟疫情一条比较消极的信息。我们还列举出了几条同为消极的信息,其情绪得分、情绪类别和舆情内容对比如下表所示,可以看出,情绪分析的结果与舆情内容还是比较匹配的。
表8.3 情绪分值与舆情内容的匹配情况(消极类)
我们再比较几条情绪分值比较积极的消息。比如2018年12月25日,来自“平安证券”标题为“双汇正处长周期起点”的研报写道:“双汇屠宰业务持续成长的核心原因……,双汇已成为行业领跑者及具规模效应,双汇具备成为行业绝对龙头的潜力,……环保风暴、扫黑除恶、猪瘟疫情防控有望加速这一进程,预计2020—2025年的屠宰营业利润保持20%以上的复合增速”,我们人工可以识别出这是一条比较积极的消息,与0.9849比较高的情绪得分和2的情绪类别是比较相符的。再比如,2018年11月2日,来自《新京报》题为“双汇回应检出非洲猪瘟传言:加工过程可杀死病毒”的消息内容是“针对此前旗下火腿被传检出非洲猪瘟一事,11月2日,双汇发展在投资者互动平台回应,高低温肉制品在加工过程中均能杀死非洲猪瘟病毒……”,看似关于双汇火腿被检出非洲猪瘟的一条负面新闻,但“高低温肉制品在加工过程中均能杀死非洲猪瘟病毒”这句话却对该条消息赋予了积极的信号,此时计算出来的情绪得分是0.8544,略低于上一条消息,情绪类别仍然列为2。
表8.4 情绪分值与舆情内容的匹配情况(积极类)
续表
通过对比,可以看出,基于人工智能深度学习的疫情文本情绪分析方法有一定的准确性和可靠性,再加上计算机高效的处理能力,使得情绪分析有一定的现实意义。一旦出现某种疫情,不再需要人工去阅读大量的关于该疫情的新闻报道、用户评论等,计算机的自动化和智能化处理为把握公众对疫情的态度、掌握舆情倾向提供了辅助手段。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。