情感分析字典
我想知道是否有人知道我可以在哪里获得正面和负面的词的字典。 我正在研究情绪分析,这是它的一个关键部分。
匹兹堡大学的情感词汇可能就是你所追求的。 这是一个8000字左右的词汇,有正面/中性/负面的情绪。 本文将对此进行更详细的介绍,并在GPL下发布。
迟到了一点,我只会注意到字典对情感分析的贡献有限。 有些情感句子不包含任何“情感”一词 – 例如“读书”,在书评中可能是正面的,而在电影评论中是负面的。 同样,在描述丰田的休假制度时,情绪词“不可预测的”在惊悚片中可能是正面的,但是是负面的。
还有更多…
情感分析(意见挖掘)词典
- MPQA主观词汇
- 刘兵和胡敏清情感词汇
- SentiWordNet (包含在NLTK中 )
- VADER情绪词汇
- SenticNet
- LIWC(不免费)
- 哈佛询问者
- 重新
资料来源:
- Keenformatics – 情感分析词典和数据集 (我的博客)
- 胡托,CJ和埃里克·吉尔伯特。 “Vader:一种基于规则的社交媒体文本情感分析模型。” 第八届国际AAAInetworking博客和社交媒体大会。 2014年
- Sentiment Symposium教程由克里斯托弗Potts
- 个人经验
刘兵教授提供了约6800字的英语词汇,您可以从此链接下载: 意见挖掘,情感分析和意见垃圾邮件检测
2002年的这篇论文描述了一种从文本样本中自动导出这样一个字典的algorithm,只用两个字作为种子集。
AFINN你可以在这里find并dynamic创build它。 就像每当有未知的+ ve词来添加它+1。 就像香蕉是新的+ ve的话,出现两次然后会变成+2。
尽可能多的文章和数据使你的字典变得更加强大!
你可以使用vader情绪词典
from nltk.sentiment.vader import SentimentIntensityAnalyzer sentence='APPle is good for health' sid = SentimentIntensityAnalyzer() ss = sid.polarity_scores(sentence) print(ss)
它会给你句子的极性。
输出:
{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}