有条件地replacedata.frame中的值
我想了解如何有条件地取代数据框中的值而不使用循环。 我的数据框架结构如下:
> df ab est 1 11.77000 2 0 2 10.90000 3 0 3 10.32000 2 0 4 10.96000 0 0 5 9.90600 0 0 6 10.70000 0 0 7 11.43000 1 0 8 11.41000 2 0 9 10.48512 4 0 10 11.19000 0 0
和输出是这样的:
structure(list(a = c(11.77, 10.9, 10.32, 10.96, 9.906, 10.7, 11.43, 11.41, 10.48512, 11.19), b = c(2, 3, 2, 0, 0, 0, 1, 2, 4, 0), est = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)), .Names = c("a", "b", "est"), row.names = c(NA, -10L), class = "data.frame")
我想要做的是检查b
的值。 如果b
是0,我想将est
设置为a的值。 我知道当b==0
时, df$est[df$b == 0] <- 23
会将est
所有值设置为23。 我不明白的是,如果这个条件成立est
,如何设定est
的值。 例如:
df$est[df$b == 0] <- (df$a - 5)/2.533
给出以下警告:
Warning message: In df$est[df$b == 0] <- (df$a - 5)/2.533 : number of items to replace is not a multiple of replacement length
有没有一种方法可以传递相关的单元格,而不是vector?
由于您有条件地索引df$est
,因此还需要有条件地索引replace向量df$a
:
index <- df$b == 0 df$est[index] <- (df$a[index] - 5)/2.533
当然,variablesindex
只是暂时的,我用它来使代码更易读。 你可以一步写下来:
df$est[df$b == 0] <- (df$a[df$b == 0] - 5)/2.533
为了更好的可读性,您可以within
以下内容中使用:
df <- within(df, est[b==0] <- (a[b==0]-5)/2.533)
结果,无论您select哪种方法:
df ab est 1 11.77000 2 0.000000 2 10.90000 3 0.000000 3 10.32000 2 0.000000 4 10.96000 0 2.352941 5 9.90600 0 1.936834 6 10.70000 0 2.250296 7 11.43000 1 0.000000 8 11.41000 2 0.000000 9 10.48512 4 0.000000 10 11.19000 0 2.443743
正如其他人指出的,在你的例子中的另一种解决scheme是使用ifelse
。
试试data.table的:=
operator:
DT = as.data.table(df) DT[b==0, est := (a-5)/2.533]
这是快速和短暂的。 有关更多信息,请参阅以下链接的问题:=
:
为什么要定义data.table :=
何时应该在data.table
使用:=
运算符
你如何从data.frame
删除列
R自我参考
这是一种方法。 ifelse
是vector化的,它检查所有行的b
值为零,并用(a - 5)/2.53
代替est
(a - 5)/2.53
如果是这种情况)。
df <- transform(df, est = ifelse(b == 0, (a - 5)/2.53, est))
R-inferno或基本的R-documentation将解释为什么使用df $ *不是这里最好的方法。 从“[”的帮助页面:
“用[索引]与primefaces向量相似,并select指定元素的列表。[[和$]select列表中的一个元素,主要区别在于$不允许计算索引,而[[ 。x $ name相当于x [[“name”,exact = FALSE]]。另外,[[可以使用精确的参数来控制]的部分匹配行为。
我build议使用[row,col]
符号。 例:
Rgames: foo xyz [1,] 1e+00 1 0 [2,] 2e+00 2 0 [3,] 3e+00 1 0 [4,] 4e+00 2 0 [5,] 5e+00 1 0 [6,] 6e+00 2 0 [7,] 7e+00 1 0 [8,] 8e+00 2 0 [9,] 9e+00 1 0 [10,] 1e+01 2 0 Rgames: foo<-as.data.frame(foo) Rgames: foo[foo$y==2,3]<-foo[foo$y==2,1] Rgames: foo xyz 1 1e+00 1 0e+00 2 2e+00 2 2e+00 3 3e+00 1 0e+00 4 4e+00 2 4e+00 5 5e+00 1 0e+00 6 6e+00 2 6e+00 7 7e+00 1 0e+00 8 8e+00 2 8e+00 9 9e+00 1 0e+00 10 1e+01 2 1e+01