R堆积百分比条形图与二进制因子和标签的百分比(与ggplot)
我想生成一个看起来像这样的graphics:
我的原始数据集看起来像这样:
> bb[sample(nrow(bb), 20), ] IMG QUANT FIX 25663 1 1 0 7936 2 2 0 23586 3 2 0 23017 2 2 1 31363 1 3 1 7886 2 2 0 23819 3 3 1 29838 2 2 1 8169 2 3 1 9870 2 3 0 31440 2 1 0 35564 3 1 0 24066 1 2 0 12020 3 2 0 6742 3 2 0 6189 2 3 0 26692 2 3 0 1387 3 2 0 31839 2 3 1 28637 3 2 0
所以想法是条形图显示每个因子QUANT
和每个因子IMG
FIX = 1
。
我已经使用plyr
将我的数据集合成了百分比
library(plyr) bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))
它几乎是正确的事情:
QUANT IMG FIX.PROP 1 1 1 0.52439024 2 1 2 0.19085366 3 1 3 0.13658537 4 2 1 0.20414201 5 2 2 0.53964497 6 2 3 0.09585799 7 3 1 0.29000000 8 3 2 0.13000000 9 3 3 0.40705882
但是现在如果我做了一个图,它并没有考虑到FIX==0
情况,也就是说所有的条都有相同的高度,即100%,这不是我想要的。 注意单个QUANT子帧如何不加起来达到100%:
> sum(bb.perc[1:3,]$FIX.PROP) [1] 0.8518293 > sum(bb.perc[4:6,]$FIX.PROP) [1] 0.839645 > sum(bb.perc[7:9,]$FIX.PROP) [1] 0.8270588
我能用R做的最好的是显示计数:
# Take only the positive samples bb.pos <- bb[bb$FIX == 1,] # Plot the counts ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() + scale_y_continous(labels=percent)
结果在: 这也不是我想要的:
- 百分比规模是离开的。 我需要一种方法将100%的点传递给
percent
函数,但我不知道如何。 - 它缺乏标签。
关于这个问题已经有很多类似的问题了,但是我似乎缺乏足够的智能(或者对R的理解)来推断他们解决我的问题的方法。
感谢任何指针!
编辑:斯文·海恩斯坦已经提供了一个答案,但是我也是这样做的:
> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100), "%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack", aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)
使用我使用plyr
进一步定义的plyr
。 这个优点是百分比是按本地每列计算的,而不是全局的。
感谢大家的帮助。 以下两个问题和他们各自的答案帮助我很好地做出了正确的select:
用ggplot2堆积的条形图标签
将标签添加到ggplot条形图
最初我做错了什么,是把position = "fill"
parameter passing给geom_bar()
,由于某种原因,所有的酒吧都有相同的高度!
这是生成情节的一种方式:
ggplot(bb[bb$FIX == 1, ],aes(x = factor(QUANT), fill = factor(IMG), y = (..count..)/sum(..count..))) + geom_bar() + stat_bin(geom = "text", aes(label = paste(round((..count..)/sum(..count..)*100), "%")), vjust = 5) + scale_y_continuous(labels = percent)
更改vjust
参数的值以调整标签的垂直位置。