我有一些非常大的分隔数据文件, 我只想处理R中的某些列,而不需要花费时间和内存为整个文件创build一个data.frame 。 我所知道的唯一select是read.table ,当我只想要几列或者scan ,这太浪费了。 有没有更好的select,无论是纯R或可能呼吁其他shell脚本进行列提取,然后使用扫描或read.table输出? (这导致了如何调用shell脚本并在R中捕获其输出的问题)。
题: 在read.table / read.csv中使用colClasses参数时是否有指定date格式的方法? (我知道我可以在导入后进行转换,但是有很多这样的date列,在导入步骤中会更容易) 例: 我有一个.csv格式的date列%d/%m/%Y 。 dataImport <- read.csv("data.csv", colClasses = c("factor","factor","Date")) 这会导致转换错误。 例如,15/07/2008变成0015-07-20 。 可重复的代码: data <- structure(list(func_loc = structure(c(1L, 2L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 5L), .Label = c("3076WAG0003", "3076WAG0004", "3076WAG0007", "3076WAG0009", "3076WAG0010"), class = "factor"), order_type = structure(c(3L, 3L, 1L, 1L, 1L, 1L, 2L, 2L, 3L, 1L), .Label […]