数据预处理之 pandas 读表

读表基本操作:

  • 表标题
  • 表文件读取
  • 查看表
    数据文件支持.dat.csv
    import pandas as pd
    users_title = ['UserID', 'Gender', 'Age', 'OccupationID', 'Zip-code']
    users = pd.read_table('./data/users.dat', sep='::', header=None, names=users_title, engine='python')
    jupyter notebook中,可以使用:
    users.head()
    来简单阅览数据的情况,只显示五行数据。

如果是用print()打印来查看数据内容,对于多列多行的数据表不太友好,可以看到打印结果是前 5 行数据 … 到最后 5 行数据,列的话,如果字段名长,只能看到 首 … 尾 数据。
在阅览数据的时候,最好使用jupyter环境,对数据阅读非常友好。

最后可以使用type(users)来查看表文件类型:

Out: pandas.core.frame.DataFrame

使用pd.read_csv读表也一样。

本作品采用《CC 协议》,转载必须注明作者和本文链接
不要试图用百米冲刺的方法完成马拉松比赛。
本帖由 Galois 于 3年前 加精
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!