Python – 数据框的维数

Python新手

在R中,可以使用dim(…)来获得matrix的维数。 Python Pandas中的数据框相应的function是什么?

df.shape ,其中df是您的DataFrame。

所有获取DataFrame或Series的维度信息的方法摘要

有很多方法可以获取有关DataFrame或Series的属性的信息。

创build示例DataFrame和系列

 df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]}) df ab 0 5.0 9 1 2.0 2 2 NaN 4 s = df['a'] s 0 5.0 1 2.0 2 NaN Name: a, dtype: float64 

shape属性

shape属性返回DataFrame中的行数和列数的两个项目的元组。 对于一个系列,它返回一个元素的元组。

 df.shape (3, 2) s.shape (3,) 

len函数

要获取DataFrame的行数或获取Series的长度,请使用len函数。 一个整数将被返回。

 len(df) 3 len(s) 3 

size属性

要获取DataFrame或Series中元素的总数,请使用size属性。 对于DataFrame,这是行数和列数的乘积。 对于一个系列,这将等于len函数:

 df.size 6 s.size 3 

ndim属性

ndim属性返回DataFrame或Series的维数。 对于DataFrames,系列总是2:

 df.ndim 2 s.ndim 1 

棘手的count方法

count方法可用于返回DataFrame的每个列/行的非缺失值的数量。 这可能是非常混乱的,因为大多数人通常认为count只是每行的长度,事实并非如此。 在DataFrame上调用时,将返回一个Series,索引中的列名称以及非缺失值的数量作为值。

 df.count() # by default, get the count of each column a 2 b 3 dtype: int64 df.count(axis='columns') # change direction to get count of each row 0 2 1 2 2 1 dtype: int64 

对于一个系列,只有一个计算轴,所以它只是返回一个标量:

 s.count() 2 

使用info方法检索元数据

info方法返回每个列的非缺失值和数据types的数量

df.info()

 <class 'pandas.core.frame.DataFrame'> RangeIndex: 3 entries, 0 to 2 Data columns (total 2 columns): a 2 non-null float64 b 3 non-null int64 dtypes: float64(1), int64(1) memory usage: 128.0 bytes 

数据框的形状是以行*列的formsfind的,所以用于查找形状的函数是

 dataframe_name.shape()