如何基于涉及字段的条件提取dataframe的子集?
我有一个很大的CSV与来自不同地点的医疗调查结果(位置是数据中存在的一个因素)。 由于一些分析是特定的位置,为了方便起见,我想从这些位置提取只有行的子帧。 它发生的位置是第一个领域所以是的,我可以通过sortingCSV行,但我想学习如何在R做,因为我相信我会需要这个其他列。
所以,简而言之,问题是:给定一个数据框foo,我怎样才能创build另一个数据框栏,其中只包含foo的位置foo $ location ='there'?
非常感谢。
这是两个主要的方法。 我更喜欢这个可读性:
bar <- subset(foo, location == "there")
请注意,您可以使用&
和|
将多个条件string连接在一起 创build复杂的子集。
其次是索引方法。 您可以使用数字或布尔切片在R中索引行。 foo$location == "there"
返回与foo
的行长度相同的T
和F
值的向量。 您可以这样做只返回条件返回true的行。
foo[foo$location == "there", ]