讨论数量:
先自定义字体文件,不是用你的字体全部显示乱码,爬虫爬出来的全是乱码文字,只有应用了你的字体文件才能正常显示,这是目前防爬技术手段比较好的方案,但在Python面前都是浮云,Python可以直接调用一个浏览器,抓取到浏览器显示的内容,这已经是要最终显示给用户看界面,所以什么都能爬取,包括spa应用
先自定义字体文件,不是用你的字体全部显示乱码,爬虫爬出来的全是乱码文字,只有应用了你的字体文件才能正常显示,这是目前防爬技术手段比较好的方案,但在Python面前都是浮云,Python可以直接调用一个浏览器,抓取到浏览器显示的内容,这已经是要最终显示给用户看界面,所以什么都能爬取,包括spa应用
推荐文章: