随意提取正文内容,不需要任何规则的爬虫

在线抓取任意网页内容

只要输入你想要抓取的文章链接,直接抓取正文内容,不需要配置规则,任何网址都可以,成功率95%以上

欢迎评论和指责探讨

aqsmoke
《L05 电商实战》
从零开发一个电商项目,功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等
《L04 微信小程序从零到发布》
从小程序个人账户申请开始,带你一步步进行开发一个微信小程序,直到提交微信控制台上线发布。
讨论数量: 9

根本不能用

4年前 评论
L学习不停 4年前
aqsmoke (楼主) 4年前
aqsmoke (楼主) 4年前
小李世界 (作者) 4年前
小李世界 (作者) 4年前
aqsmoke (楼主) 4年前
sphard 4年前
aqsmoke (楼主) 4年前
aqsmoke (楼主) 4年前

试了3个网址 一个没反应 http://www.idongni.cn 一个说跳过去了 分享:随意提取正文内容,不需要任何规则的爬虫 一个给了一些很基础的内容 https://www.xitieba.com

两个体验问题: 1、不输入http会无效 2、input获取焦点的时候应该自动清空input里的内容,你的value值一直存在

4年前 评论
aqsmoke (楼主) 4年前

失败率确实是 95%

4年前 评论
aqsmoke (楼主) 4年前
aqsmoke

http://huahualive.net/
这个站点都是通过脚本用这个提取方式提取的,根据话题名字百度搜索拿到各个网页的网址,然后去提取内容。 特殊的提取不到的就跳过去了

4年前 评论
sunxyw

MCBBS 无法正确抓取,是的,就是那 5% 失败率。

4年前 评论

我试了一下抓我的博客的文章,报了以下错误。 file

4年前 评论

正文内容提取,之前看过类似的代码

4年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!