Python 计算生态中那些著名的库-文本处理
PyPDF2
用来处理pdf文件的工具集
提供了一批处理PDF文件的计算功能,支持获取信息、分隔/整合文件、加密解密等,完全Python语言实现,不需要额外依赖,功能稳定
NLTK
自然语言文本处理第三方库
提供了一批简单易用的自然语言文本处理功能,支持语言文本分类、标记、语法句法、语义分析等,是最优秀的Python自然语言处理库
官方网站:www.nltk.org
Python-docx
创建或更新Microsoft Word文件的第三方库
提供创建或更新.doc .docx等文件的计算功能,增加并配置段落、图片、表格、文字等功能
官方网站:python-docx.readthedocs.io/en/latest/index.html
本作品采用《CC 协议》,转载必须注明作者和本文链接