请教pandas中read_csv()的使用

我的csv文件第一行的字段,数据从第二行开始,由于第一行的每个字段名都很长,我想重新命名,如果这样:
import pandas as pd
names = [‘preg’, ‘plas’, ‘pres’, ‘skin’]
df=pd.read_csv(“test.csv”,names=names)
那么好像第一行也算成数据了,请问pd.read_csv参数要怎么设置数据从第二行开始读取?

讨论数量: 4

好像是df=pd.read_csv(“test.csv”,names=names,header=0) 是不是?

1年前 评论
Jason990420

表头 header

支持 int, list of int,第几行是表头,默认会自动推断,会把第一行作为表头。

# int, list of int, default ‘infer’
# 默认系统会推断,如果指定列名会被忽略
pd.read_csv(data, header=0) # 第一行
pd.read_csv(data, header=None) # 没有表头
pd.read_csv(data, header=[0,1,3]) # 多层索引 MultiIndex

注意:如果 skip_blank_lines=True,header 参数将忽略空行和注释行, 因此 header=0 表示第一行数据而非文件的第一行.

1年前 评论

要跳过 CSV 文件中的第一行,可以使用 skiprows 参数。将其设置为 1,可以忽略掉第一行。例如:

import pandas as pd
names = ['preg', 'plas', 'pres', 'skin']
df = pd.read_csv('test.csv', names=names, skiprows=1)
1年前 评论

pd.read_csv(data, header=[0,1,3]) # 多层索引 MultiIndex,请问多层索引是什么意思?能举例吗

1年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!