Tag: dataframe

通过列中的值过滤数据框

我正在使用数据集LearnBayes 。 对于那些想看到实际数据的人: install.packages('LearnBayes') 我正在尝试根据列中的值过滤出行。 例如,如果列值是“水”,那么我想要那一行。 如果列值是“牛奶”,那么我不想要它。 最终,我试图过滤掉所有饮料栏中的“水”。

如何打印(纸张)一个很好格式的dataframe

我想打印格式良好的dataframe,最好从脚本内。 (我试图用仪器收集数据,并使用R脚本自动处理和打印)。 现在,我可以使用write.table()将数据框写入文本文件,但这有两个问题:1.)生成的文本文件格式不正确(列不一定与其标题alignment),以及2.)我不知道如何从R打印文本文件。 我正在寻找更多的一般策略比特定的代码(虽然代码也将是伟大的!)。 Sweave会是最方便的解决scheme吗? 原则上,我可以使用socketConnection()打印到打印机 – 如果是这样,我可以在哪里学习如何使用它(我没有发现文档是非常有用的)。 谢谢。

从所有值为NA的数据框中删除列

我遇到了一个数据框的问题,我自己也无法真正解决这个问题: dataframe具有任意属性作为列 , 每行代表一个数据集 。 问题是: 如何摆脱所有行的值为NA的列 ?

将pandas多指标转入栏目

我有一个2索引级别的dataframe: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 我想把这个变成: Trial measurement value 1 0 13 1 1 3 1 2 4 2 0 NaN 2 1 12 3 0 34 我怎么能最好的做到这一点? 我需要这个,因为我想按照这里的指示来聚合数据,但是如果它们被用作索引,我不能select这样的列。

R – 连接两个数据框?

给定两个dataframea和b : > a abc 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b ac 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 -0.6660001 有没有简单的方法来连接这些以便返回一个新的数据框的forms: > new abc 1 -0.2246894 -1.48167912106676 -1.65099363 2 0.5559320 -0.878985746842256 -0.15634590 […]

确定数据框的列的数据types

我正在使用R并使用read.csv()将数据加载到数据read.csv() 。 如何确定数据框中每列的数据types?

如何从R data.frame获取行

我有一个data.frame与列标题。 我怎样才能得到data.frame的特定行作为列表(列标题作为列表的关键)? 具体来说,我的data.frame是 ABC 1 5 4.25 4.5 2 3.5 4 2.5 3 3.25 4 4 4 4.25 4.5 2.25 5 1.5 4.5 3 我想得到一个相当于的行 > c(a=5, b=4.25, c=4.5) abc 5.0 4.25 4.5

如何将行附加到R数据框

我已经看了一下周围的StackOverflow,但我找不到解决scheme特定于我的问题,其中涉及将行附加到R数据框。 我正在初始化一个空的2列数据框,如下所示。 df = data.frame(x = numeric(), y = character()) 然后,我的目标是迭代值列表,并在每次迭代中,将一个值附加到列表的末尾。 我从下面的代码开始。 for (i in 1:10) { df$x = rbind(df$x, i) df$y = rbind(df$y, toString(i)) } 我也尝试了函数c , append ,并没有成功merge 。 如果您有任何build议,请让我知道。

随机播放DataFrame行

我有以下的DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 … 20 7 8 9 2 21 10 11 12 2 … 45 13 14 15 3 46 16 17 18 3 … DataFrame是从csv文件中读取的。 所有具有Type 1的行位于顶部,接着是具有Type 2的行,接着是具有Type 3的行等。 我想洗牌DataFrame的行,以便所有Type的混合。 可能的结果可能是: Col1 Col2 Col3 Type 0 7 8 9 2 1 […]

在大型data.table中取代NAs的最快方法

我有一个很大的data.table ,许多缺失的值分散在整个〜200K行和200列。 我想尽可能有效地将这些NA值重新编码为零。 我看到两个选项: 1:转换为data.frame,并使用这样的东西 2:一些很酷的data.table子设置命令 我会很满意types1的一个相当有效的解决scheme。转换为data.frame,然后返回到data.table不会太长。