Tag: 复合密钥

使用group_by(多个variables)时dplyr问题

我想开始使用dplyr来代替ddply,但是我无法得到它是如何工作的(我已阅读文档)。 例如,为什么当我尝试mutate()时,“group_by”函数不工作,因为它应该? 看mtcars: 库(车) 说我做了一个data.frame这是一个mtcars总结,分为“cyl”和“齿轮”: df1 <- mtcars %.% group_by(cyl, gear) %.% summarise( newvar = sum(wt) ) 然后说我想进一步总结这个数据框。 使用ddply,这将是直接的,但是当我尝试使用dplyr时,它实际上并不是“按…分组”: df2 <- df1 %.% group_by(cyl) %.% mutate( newvar2 = newvar + 5 ) 仍产生一个未分组的输出: cyl gear newvar newvar2 1 6 3 6.675 11.675 2 4 4 19.025 24.025 3 6 4 12.375 17.375 4 6 5 […]