请教pandas中read_csv()的使用
我的csv文件第一行的字段,数据从第二行开始,由于第一行的每个字段名都很长,我想重新命名,如果这样:
import pandas as pd
names = [‘preg’, ‘plas’, ‘pres’, ‘skin’]
df=pd.read_csv(“test.csv”,names=names)
那么好像第一行也算成数据了,请问pd.read_csv参数要怎么设置数据从第二行开始读取?
好像是df=pd.read_csv(“test.csv”,names=names,header=0) 是不是?
表头 header
支持
int, list of int
,第几行是表头,默认会自动推断,会把第一行作为表头。注意:如果 skip_blank_lines=True,
header
参数将忽略空行和注释行, 因此 header=0 表示第一行数据而非文件的第一行.要跳过 CSV 文件中的第一行,可以使用 skiprows 参数。将其设置为 1,可以忽略掉第一行。例如:
pd.read_csv(data, header=[0,1,3]) # 多层索引 MultiIndex,请问多层索引是什么意思?能举例吗