DataFrames基础
DataFrames#
简介#
他是一种类似于 NumPy 中的二维数组,是一种表结构的数据。跟 NumPy 中的 array 不同的是 DataFrames 里的每一列每一行的数据都可以是任意数据类型。
使用#
创建 DataFrame,创建 DataFrame 时必须要传入一个数据 data,和 NumPy 一样 data 可以传列表、元祖,当传嵌套字典时,pandas 就会把外层字典的键作为列,内层键则作为行索引;在 Dataframe 中 index 成为单独的一列,即索引列,同样也可以传入列表和元祖;创建 DataFrame 时还可以设置 columns, 他必须传列表
>>> pd.DataFrame((1,2,3,4),index=(1,2,3,4),columns=['a']) a 1 1 2 2 3 3 4 4 >>> a = {'a':{1:1},'b':{2:2}} >>> pd.DataFrame(a) a b 1 1.0 NaN 2 NaN 2.0
在创建 DataFrame 时,如果传入数据的数据量不匹配,在结果中会产生缺失值,如果传入了 columns,结果会按 columns 传入的顺序显示