2.1. 文本处理

str 类是 Python编程者最常用的文本处理工具。但是在标准库中还有很多其他的能够让高阶的文本处理变得更简单的工具。

程序需要参数化字符串时可以选择使用简单的 string.Template 来操作。虽然不像其他 web 应用框架或者 Python Package Index 中的扩展模块中的类似模板那么功能丰富,但是当需要动态输入值的时候,string.Template 还是一个不错的可以由用户修改的模板。

textwrap 模块就内置一些工具来格式化段落中的文本,比如设置文本每行输出行宽度,添加缩进,以及插入换行来保证每行的一致性等。

标准库除了内置的字符串类支持的相等与分类比较方法外,还包括两个用来比较文本值的模块。 re 提供了一个完整高效的 C 语言形式内置的正则表达式库。正则表达式很适合在大量数据中查找子串,将一个字符串与另一个更复杂的固定字符串进行比较,以及进行温和句法分析。

difflib 则根据增加、删除、更改的部分来计算文本字符序列之间的实质差别。difflib 中的比较函数能为使用者提供更加详细的关于两组输入中的不同点所在、文档随时间而变化等方面的反馈。

本文章首发在 LearnKu.com 网站上。
上一篇 下一篇
讨论数量: 0
发起讨论 只看当前版本


暂无话题~