基于情感词典的文本分析是根据情感词的极性来判断文本的极性,还可以根据情感词极性的强弱来判断文本情感的强烈程度。基于情感词的文本分析重点是需要构建情感词典,目前有许多常用的情感词典,如Hownet、Wordnet、SeniWordNet、GI(General Inquirer)等。
在情感词典中对情感词有定性和定量的标注,主要是通过专家进行人工标注,需要大量的人力、物力和财力,效率低且受到标注人主观的影响,同时,需要对原有的情感词根据不同的领域进行扩展,提高领域适应能力和情感分类的准确率。在基于情感词典分类方法中,其核心思想是利用情感词典作为判断和评价情感极性评论词的主要依据,同时设计相应的判断规则实现情感词典的建立。因此,情感词典是这类算法的核心之一,但情感词典的构建是一个复杂的过程,同时依赖于情感极性标注人的主观性,使得同一词汇在不同的词典中可能表现出不同的极性。选择不同情感词典和设计不同规则进行词典扩充所带来的分类效果差异很大,且这类方法具有领域性,可扩展性差,使得此类方法的应用具有很大的局限性。
对于基于情感词典的文本情感分析主要是针对句子的分析,分析句子中出现的情感词的情况,根据情感词的极性来判断整个句子的极性。但是,由于否定词的存在,含有否定词的句子在情感极性的判断过程中需要考虑否定词。如:
(1)“这个手机我喜欢”。(www.xing528.com)
(2)“这个手机我不怎么喜欢”。
其中,两句中的情感词“喜欢”的情感极性相同,但是由于第二句中有否定词“不怎么”,则两个句子的情感极性完全相反。同时,我们也考虑了程度副词在句子情感表达中的作用,可根据程度副词不同,分别为不同级别的程度副词赋予不同的分值,最后根据句子的总分值来判断情感极性和情感的强烈程度,负分表明是“负面”情感,正分表明是“正面”情感,且分值越大,情感越强烈。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。