我有一个调查文件,其中行是观察和列问题。 以下是一些假冒的数据 : People,Food,Music,People P1,Very Bad,Bad,Good P2,Good,Good,Very Bad P3,Good,Bad,Good P4,Good,Very Bad,Very Good P5,Bad,Good,Very Good P6,Bad,Good,Very Good 我的目标是用ggplot2创build这种情节。 我绝对不在乎颜色,devise等 情节不符合假数据 这里是我的假数据: raw <- read.csv("http://pastebin.com/raw.php?i=L8cEKcxS",sep=",") raw[,2]<-factor(raw[,2],levels=c("Very Bad","Bad","Good","Very Good"),ordered=FALSE) raw[,3]<-factor(raw[,3],levels=c("Very Bad","Bad","Good","Very Good"),ordered=FALSE) raw[,4]<-factor(raw[,4],levels=c("Very Bad","Bad","Good","Very Good"),ordered=FALSE) 但是,如果我selectY作为计数,那么我正面临一个关于selectX和组值的问题…我不知道如果我不能使用reshape2 ,我是否能成功…我也厌倦了使用重塑function。 但我不明白如何使用它…
我试图理解为什么发展从reshape转变为reshape 。 他们似乎在function上是相同的,但是,我现在无法升级到reshape2因为服务器上运行的R版本较旧。 我担心可能会发生一个重大的错误,将发展转向一个全新的scheme,而不是简单地继续发展reshape 。 有谁知道reshape包装有没有重大缺陷?
我有一个很长的数据集,我想扩大,我很好奇,如果有一种方法,在R一步使用reshape2或tidyr包完成这一切。 dataframedf如下所示: id type transactions amount 20 income 20 100 20 expense 25 95 30 income 50 300 30 expense 45 250 我想要得到这个: id income_transactions expense_transactions income_amount expense_amount 20 20 25 100 95 30 50 45 300 250 我知道我可以通过例如reshape2获得部分path: dcast(df, id ~ type, value.var="transactions") 但是,是否有办法一次性重塑整个DF,同时解决“交易”和“金额”两个variables? 理想情况下,新的更适合的列名称?
我正在调整一个新的工作,我与同事分享的大部分工作都是通过MS Excel进行的。 我经常使用数据透视表,因此需要“堆叠”的数据,就是我为此所依赖的R中reshape (reshape2)包中的melt()函数的输出。 任何人都可以让我开始在VBAmacros来完成这个,还是已经存在? macros观纲要是: 在Excel工作簿中select一个单元格范围。 开始“融化”的macros。 macros将创build一个提示,“inputID列的数量”,在那里你可以input识别信息的前几列。 (例如下面的R代码是4)。 在标题为“melt”的excel文件中创build一个新的工作表,用于堆叠数据,并创build一个名为“variable”的新列,与原始select的数据列标题相同。 换句话说,输出看起来和R中简单执行这两行的输出完全一样: require(reshape) melt(your.unstacked.dataframe, id.vars = 1:4) 这是一个例子: # unstacked data > df1 Year Month Country Sport No_wins No_losses High_score Total_games 2 2010 5 USA Soccer 4 3 5 9 3 2010 6 USA Soccer 5 3 4 8 4 2010 5 CAN Soccer 2 […]
我的df看起来像这样: Id Task Type Freq 3 1 A 2 3 1 B 3 3 2 A 3 3 2 B 0 4 1 A 3 4 1 B 3 4 2 A 1 4 2 B 3 我想通过Id重组,并得到: Id AB … Z 3 5 3 4 4 6 我试过了: df_wide <- dcast(df, Id + Task […]
我有一个宽格式的dataframe,在不同的date范围内进行重复测量。 在我的例子中,有三个不同的时期,都有相应的价值。 例如,在从“DateRange1Start”到“DateRange1End”期间测量的第一个度量('Value1'): ID DateRange1Start DateRange1End Value1 DateRange2Start DateRange2End Value2 DateRange3Start DateRange3End Value3 1 1/1/90 3/1/90 4.4 4/5/91 6/7/91 6.2 5/5/95 6/6/96 3.3 我正在寻找重塑的数据到一个长的格式,使DateRangeXStart和DateRangeXEnd列分组。 因此,原表中的1行在新表中成为3行: ID DateRangeStart DateRangeEnd Value 1 1/1/90 3/1/90 4.4 1 4/5/91 6/7/91 6.2 1 5/5/95 6/6/96 3.3 我知道必须有一种方法来处理reshape2 / melt / tidyr / tidyr ,但我似乎无法弄清楚如何以这种特殊的方式将多组度量variables映射到一组值列中。