数据预处理之 pandas 读表
读表基本操作:
- 表标题
- 表文件读取
- 查看表
数据文件支持.dat
、.csv
等
在import pandas as pd users_title = ['UserID', 'Gender', 'Age', 'OccupationID', 'Zip-code'] users = pd.read_table('./data/users.dat', sep='::', header=None, names=users_title, engine='python')
jupyter notebook
中,可以使用:
来简单阅览数据的情况,只显示五行数据。users.head()
如果是用print()
打印来查看数据内容,对于多列多行的数据表不太友好,可以看到打印结果是前 5 行数据 … 到最后 5 行数据,列的话,如果字段名长,只能看到 首 … 尾 数据。
在阅览数据的时候,最好使用jupyter
环境,对数据阅读非常友好。
最后可以使用type(users)
来查看表文件类型:
Out: pandas.core.frame.DataFrame
使用pd.read_csv
读表也一样。
本作品采用《CC 协议》,转载必须注明作者和本文链接
本帖由 Galois
于 4年前 加精