不知道为啥,输出无内容,代码不知道错在哪里了
我想得到 Tiger,Two tigers two tigers run fast;Rabbit,Small white rabbit white and white;
import re
s = """<div class="animal">
<p class="name">
<a title="Tiger"></a>
</p>
<p class="contents">
Two tigers two tigers run fast
</p>
</div>
<div class="animal">
<p class="name">
<a title="Rabbit"></a>
</p>
<p class="contents">
Small white rabbit white and white
</p>
</div>"""
p = re.compile('<div class="animal".*?title="\
(.*?)">.*?contents">(.*?)</p>', re.S)
r = p.findall(s)
print(r)

关于 LearnKu
正则错误不能匹配到目标内容。可如此这般达到你想要的效果。
注意非捕获分组(?:)用法,任意字符匹配防贪婪([\s\S]),及p标签的闭口需要转义
若工作需要,可以考虑用scrapy抓取,它只需要你理解css或xpath表达式,直接用对象方法的形式抓取。