Python – 数据框的维数
Python新手
在R中,可以使用dim(…)来获得matrix的维数。 Python Pandas中的数据框相应的function是什么?
df.shape
,其中df
是您的DataFrame。
所有获取DataFrame或Series的维度信息的方法摘要
有很多方法可以获取有关DataFrame或Series的属性的信息。
创build示例DataFrame和系列
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]}) df ab 0 5.0 9 1 2.0 2 2 NaN 4 s = df['a'] s 0 5.0 1 2.0 2 NaN Name: a, dtype: float64
shape
属性
shape
属性返回DataFrame中的行数和列数的两个项目的元组。 对于一个系列,它返回一个元素的元组。
df.shape (3, 2) s.shape (3,)
len
函数
要获取DataFrame的行数或获取Series的长度,请使用len
函数。 一个整数将被返回。
len(df) 3 len(s) 3
size
属性
要获取DataFrame或Series中元素的总数,请使用size
属性。 对于DataFrame,这是行数和列数的乘积。 对于一个系列,这将等于len
函数:
df.size 6 s.size 3
ndim
属性
ndim
属性返回DataFrame或Series的维数。 对于DataFrames,系列总是2:
df.ndim 2 s.ndim 1
棘手的count
方法
count
方法可用于返回DataFrame的每个列/行的非缺失值的数量。 这可能是非常混乱的,因为大多数人通常认为count只是每行的长度,事实并非如此。 在DataFrame上调用时,将返回一个Series,索引中的列名称以及非缺失值的数量作为值。
df.count() # by default, get the count of each column a 2 b 3 dtype: int64 df.count(axis='columns') # change direction to get count of each row 0 2 1 2 2 1 dtype: int64
对于一个系列,只有一个计算轴,所以它只是返回一个标量:
s.count() 2
使用info
方法检索元数据
info
方法返回每个列的非缺失值和数据types的数量
df.info()
<class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): a 2 non-null float64 b 3 non-null int64 dtypes: float64(1), int64(1) memory usage: 128.0 bytes
数据框的形状是以行*列的formsfind的,所以用于查找形状的函数是
dataframe_name.shape()