DataFrames基础
DataFrames
简介
他是一种类似于NumPy中的二维数组,是一种表结构的数据。跟NumPy中的array不同的是DataFrames里的每一列每一行的数据都可以是任意数据类型。
使用
创建DataFrame,创建DataFrame时必须要传入一个数据data,和NumPy一样data可以传列表、元祖,当传嵌套字典时,pandas就会把外层字典的键作为列,内层键则作为行索引;在Dataframe中index成为单独的一列,即索引列,同样也可以传入列表和元祖;创建DataFrame时还可以设置columns,他必须传列表
>>> pd.DataFrame((1,2,3,4),index=(1,2,3,4),columns=['a']) a 1 1 2 2 3 3 4 4 >>> a = {'a':{1:1},'b':{2:2}} >>> pd.DataFrame(a) a b 1 1.0 NaN 2 NaN 2.0
在创建DataFrame时,如果传入数据的数据量不匹配,在结果中会产生缺失值,如果传入了columns,结果会按columns传入的顺序显示