中国进入互联网时代及移动互联网时代以来,网络用户快速增长。根据中国互联网络信息中心(CNNIC)发布《中国互联网络发展状况统计报告》,庞大的网民群体和自媒体等新技术的出现加强了民众在网络环境中的表达能力,社会矛盾开始在网络上聚焦。在此过程中,网民群体既是网络舆情的“消费者”,又是网络舆情的“传播者”和“创造者”,使得网络舆情产生的成本低、周期短、频率快。一旦形成网络谣言等负面舆情,极易误导民众,损害政府公信力,不利于社会经济发展,甚至危害社会的安全稳定。因此,网络舆情监测在目前显得尤为重要,组织力量开展网络舆情信息汇集整理和分析,对于及时应对网络突发的公共事件和全面掌握社情民意很有意义。
(一)网络舆情监测的定义
网络舆情监测是对互联网上公众的言论和观点进行监视和预测的行为。网络舆情监测指整合互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。传统的网络舆情监测主要对网站、社交媒体、论坛等某一主题的新闻或者帖文的数量进行统计。这种统计数据尽管可以结合一些算法或者模型,给出一些具有参考价值的信息,如发文数量、趋势、地理分布以及计算舆情热度等。随着大数据文本挖掘技术、人工智能等技术的发展,目前的网络舆情监测增加了社会情绪、文本价值、社会阶层话语权等指标的测量内容。
从类型上看,网络舆情监测分为日常监测和突发事件监测两种。
日常监测,指将网络舆情监测作为本部门的一项日常工作不间断进行,随时掌握网络舆论的导向、特点和趋势。目前,许多科研机构及相关部门建立了对网络舆情进行日常监控的办公室。日常监测的意义在于,随时了解网络舆论的动态方向。一旦发现有不利于社会稳定、重大的虚假舆情,可以及时反馈到有关部门。通过“舆论领袖”等手段,对日常舆情进行引导,为有关部门提供社会舆情方面的决策支持。
突发事件监测,尤指当发生群体性突发事件时对相关网络舆情的监测。突发事件的变化因素多,内部关系较为复杂,发展趋势难以预测,相关信息纷繁复杂,给管理机构的信息判断和决策增加了难度。另外,由于突发事件中的矛盾双方往往处于对立状态,影响或阻碍了原有信息沟通渠道的正常功能,从而给各种“小道消息”提供了填补信息真空的机会。此类事件突发性强、社会影响大、给决策者思考的时间短,如果不及时准确获得最新信息并加以判断处理,产生的后果非常严重。而巨大的压力使决策者很难从容地对所有信息进行采集、整理和判别,一些有价值的信息可能被遗漏或者忽视,从而对处理决策产生误导。因此,在突发事件出现时,完善的舆情监测机制、及时有效的舆情信息汇集和分析、全面掌握与该事件密切相关的各种信息,极其重要。
(二)网络舆情监测的方法
由于网络舆情信息量巨大,目前网络舆情监测主要通过系统软件来实现。“网络舆情监测系统”是针对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿的集合而进行的计算机监测的系统统称。网络舆情监控系统是利用搜索引擎技术和网络信息挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态,做出正确舆论引导,提供分析依据。网络舆情监测系统的具体构成和工作方式将在后文进行详细阐述。
(三)网络舆情监测的流程
网络舆情监测流程可分为舆情主题规划、舆情信息采集、舆情信息预处理、舆情信息分析、舆情报告5个阶段。这5个阶段所包含的具体内容如图8-1所示。
图8-1 网络舆情监测流程(www.xing528.com)
1.舆情主题规划
相关部门根据自身所需要获取舆情信息需求,确定需要实时监测的对象以及需要关注的主题,然后确定实时跟踪的关键词并及时调整采集内容。舆情主题规划的内涵和外延包括了舆情的来源、网络舆情的关键词的管理方法以及网络舆情主题词的管理[9]。其中,主题可以根据相关研究成果并结合相关部门的实际情况进行动态调整。
2.舆情信息采集
完成网络舆情主题规划后,需要根据相应的主题对网络舆情信息进行采集。具体而言,舆情信息采集指根据主题的关键词,利用网络爬虫等技术从繁杂的内容中筛选出与确定主题相关的舆情信息,然后将其存储在数据库中。为防止信息重复,在将信息储存入数据库时可以采用“网络雷达”技术判定资源是否存储于历史数据库中。一般来说,网络舆情信息采集的渠道有新闻、论坛、博客、评论等。
3.舆情信息预处理
由于互联网中的信息纷繁复杂,我们无法确保通过关键词抓取的信息完全精准。因此在进行舆情信息分析前,需要对采集到的舆情信息进行初步的预处理。舆情信息的预处理首先需要将原始舆情数据进行清洗和净化,如对广告、版权说明、图片等与主题无关的噪音内容进行去噪处理。随后,需要将半结构化的网页数据转化为结构化的文本形式。最后,为了进一步进行舆情信息分析,需要将结构化的文本通过分词转化为计算机能够识别的单个词汇,并进行分类参数优化,建立文本表示模型,得到文本分类。
4.舆情信息分析
舆情信息分析是网络舆情动态监测系统的核心环节,是指在舆情信息与处理之后,利用文本聚类技术对获取的信息进行分析、挖掘来实现网络舆情信息的主题发现,对文本的主题结构进行确定,分析结果用于信息提取、自动生成文摘、跟踪主题的转换、觉察主题间的关系等,为舆情警告处理提供支持(李中原)。其中,文本聚类有语义聚类与关联聚类,以及通过计量手段进行聚类等多种方法。
5.舆情报告
舆情报告指对网络舆情信息分析结果进行信息汇总并形成可视化报告,从而完成舆情分级、舆情预警等任务。其中,舆情预警是舆情报告的主要部分,监测部分首先通过主题检测模型进行敏感、热点信息的发现,判断该主题是否属于相关部门关注的敏感、热点内容,随后通过网络舆情主题追踪模型对该主题进行追踪,然后利用层次分析法判定主题所属的预警等级,并将结果通过简报、列表、图表、报告等形式呈现,为网络舆情相关部门提供辅助决策。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。