如何删除 HTML 代码内字串的部分内容?
大家好,小弟想问有关Python字串的问题。
早前小弟使用了Selenium和Web driver 抓取所需的东西和输出了一个csv档案。
CSV档案内容如下:
然后,我要读取csv档案抓取html代码的栏位,再删除部分的字串。
我尝试了使用 replace 的方法,但网路上找到的方法都是针对指定的字元,而不是范围。
以下是html代码例子:
<div class="ContentGrid">
香港一年GDP 都3千幾億大美金
<br>
2成都6百幾
<br>
<br>
<br>
</div>
<div class="ContentGrid">
<blockquote>
<div style="color: #0000A0;">
<blockquote>
<div style="color: #0000A0;">
藍店送聖誕卡比施生有乜下場
<img data-icons="???" src="/faces/wonder2.gif" alt="???">
</div>
</blockquote>
<br>何只聖誕卡,直情要送埋聖誕樹賀一賀佢
<img data-icons="#hehe#" src="/faces/hehe.gif" alt="#hehe#">
</div>
</blockquote>
<br>
施生只對聖誕卡有感覺。
<br>
<br>
<br>
</div>
我有大量的 div class="ContentGrid"
,但不是每个 div class="ContentGrid"
也有 <blockquote>...</blockquote>
。所以我需要移除所有包含 <blockquote>...</blockquote>
的内容
以下是我预期的结果:
<div class="ContentGrid">
香港一年GDP 都3千幾億大美金
<br>
2成都6百幾
<br>
<br>
<br>
</div>
<div class="ContentGrid">
<br>
施生只對聖誕卡有感覺。
<br>
<br>
<br>
</div>
希望大家可以帮到我,谢谢你们。