【摘要】:新闻话题的主要特点包括时序性、波动性和层次性[121,122]。新闻话题不同于普通文本,基本要素之一就是话题的发生时间,故不同话题或者同一话题的不同报道具有时序性,对话题识别与追踪的扩展研究多围绕时序性展开。图5-3话题时序性和波动性图5-3中,横轴表示时间序列time-i,纵轴表示某一时间点time-i时,某一话题的相关报道数。
新闻话题的主要特点包括时序性、波动性和层次性[121,122]。新闻话题不同于普通文本,基本要素之一就是话题的发生时间,故不同话题或者同一话题的不同报道具有时序性,对话题识别与追踪的扩展研究多围绕时序性展开。所谓波动性是指新闻话题在一定时间段内其热度会随着时间的推移先增加,然后降低,在某一时刻或许再被激发而变成热点话题,使得话题以波浪的形式存在。在话题识别与追踪中,一个新的新闻报道可能不单独属于某一个话题,而是在不同层次属于不同话题,故研究者提出了层次话题检测方法[122],该方法充分运用了新闻话题的层次性。
如果一个新闻话题的相关新闻报道在短时间内大量出现,即爆发密度(不规则图形的面积)比较大,则该话题为热点话题的可能性就会增大;从话题发展曲线的总体来看,如果其波动的幅度越大,则其为热点话题的可能性亦会增大。综上分析,可以发现时序性和波动性均与话题的热度有关系,图5-3展示了某一话题一定时间段内(一个波动周期)追踪到的相关报道数量变化简图。
(www.xing528.com)
图5-3 话题时序性和波动性
图5-3中,横轴表示时间序列time-i,纵轴表示某一时间点time-i时,某一话题的相关报道数。在一定时间段(时间距离)内,该话题的相关报道出现密度越大,则该话题越热。当time-i=4时,图5-3所示话题追踪到的相关报道数达到峰值,即幅度最大,该峰值越大则话题为热点话题的可能性越大。本章首先将二者进行线性融合和指数规范化处理,然后给出一个新的判断话题是否为热点话题的方法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。