情感分析字典

我想知道是否有人知道我可以在哪里获得正面和负面的词的字典。 我正在研究情绪分析,这是它的一个关键部分。

匹兹堡大学的情感词汇可能就是你所追求的。 这是一个8000字左右的词汇,有正面/中性/负面的情绪。 本文将对此进行更详细的介绍,并在GPL下发布。

迟到了一点,我只会注意到字典对情感分析的贡献有限。 有些情感句子不包含任何“情感”一词 – 例如“读书”,在书评中可能是正面的,而在电影评论中是负面的。 同样,在描述丰田的休假制度时,情绪词“不可预测的”在惊悚片中可能是正面的,但是是负面的。

还有更多…

情感分析(意见挖掘)词典

  • MPQA主观词汇
  • 刘兵和胡敏清情感词汇
  • SentiWordNet (包含在NLTK中 )
  • VADER情绪词汇
  • SenticNet
  • LIWC(不免费)
  • 哈佛询问者
  • 重新

资料来源:

  • Keenformatics – 情感分析词典和数据集 (我的博客)
  • 胡托,CJ和埃里克·吉尔伯特。 “Vader:一种基于规则的社交媒体文本情感分析模型。” 第八届国际AAAInetworking博客和社交媒体大会。 2014年
  • Sentiment Symposium教程由克里斯托弗Potts
  • 个人经验

刘兵教授提供了约6800字的英语词汇,您可以从此链接下载: 意见挖掘,情感分析和意见垃圾邮件检测

2002年的这篇论文描述了一种从文本样本中自动导出这样一个字典的algorithm,只用两个字作为种子集。

AFINN你可以在这里find并dynamic创build它。 就像每当有未知的+ ve词来添加它+1。 就像香蕉是新的+ ve的话,出现两次然后会变成+2。

尽可能多的文章和数据使你的字典变得更加强大!

你可以使用vader情绪词典

from nltk.sentiment.vader import SentimentIntensityAnalyzer sentence='APPle is good for health' sid = SentimentIntensityAnalyzer() ss = sid.polarity_scores(sentence) print(ss) 

它会给你句子的极性。

输出:

  {'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}