R:用gsubreplace字符,如何创build一个函数?
我试图replacedata.frame中的字符。 我有这个解决scheme
> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) > df var1 1 aabbcdefg 2 aabbcdefg > df$var1 <- gsub("a", "h", df$var1) > df$var1 <- gsub("b", "i", df$var1) > df$var1 <- gsub("c", "j", df$var1) > df$var1 <- gsub("d", "k", df$var1) > df$var1 <- gsub("e", "l", df$var1) > df$var1 <- gsub("f", "m", df$var1) > df var1 1 hhiijklmg 2 hhiijklmg >
但是我想避免使用几个gsub调用,那么产生一个能够立即执行此操作的函数会更好一些? 任何想法继续?
你可以创build和向量:
from <- c('a','b','c','d','e','f') to <- c('h','i','j','k','l','m')
然后vector化gsub
函数:
gsub2 <- function(pattern, replacement, x, ...) { for(i in 1:length(pattern)) x <- gsub(pattern[i], replacement[i], x, ...) x }
这使:
> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) > df$var1 <- gsub2(from, to, df$var1) > df var1 1 hhiijklmg 2 hhiijklmg
你想要chartr
:
df$var1 <- chartr("abcdef", "hijklm", df$var1) df # var1 # 1 hhiijklmg # 2 hhiijklmg
如果你不想使用chartr,因为replace可能不止一个字符,那么另外一个select就是使用gsubfn包中的gsubfn(我知道这不是gsub,而是gsub上的一个扩展)。 这里是一个例子:
> library(gsubfn) > tmp <- list(a='apple',b='banana',c='cherry') > gsubfn('.', tmp, 'abcd') [1] "apple.banana.cherry.d"
replace也可以是一个函数,将匹配并返回该匹配的重置值。