如何删除所有重复项,以便R中的数据框中保留NONE?
对于PHP也有类似的问题 ,但是我正在使用R,并且无法将解决scheme转换为我的问题。
我有这个数据框10行50列,其中一些行是绝对相同的。 如果我使用唯一的,我得到一行 – 我们说 – “types”,但我真正想要的是只得到那些只出现一次的行。 有谁知道我可以做到这一点?
我可以看一下簇和热图来手动sorting,但是我有比上面提到的更大的数据框(最多100行),这有点棘手。
这将提取只出现一次的行(假设您的数据框被命名为df
):
df[!(duplicated(df) | duplicated(df, fromLast = TRUE)), ]
它是如何工作的 : duplicated
的函数testing一条线是否至less第二次出现在第一行。 如果使用fromLast = TRUE
参数,则函数从最后一行开始。
两者的布尔结果都与|
相结合 (逻辑“或”)成一个新的向量,表示所有行出现不止一次。 这个结果是否定的使用!
从而创build一个布尔vector指示线只出现一次。