laravel如何去爬网页上的数据

我昨天用QueryList 插件去拉取线上的数据,因为那个网站的有些数据是通过接口调用后填充的,我用这个插件获取到的数据就是0,
我就想有没有一个插件能拉取到网页已经结束后的所有页面?
大家都是怎么去爬网页数据的?

《L04 微信小程序从零到发布》
从小程序个人账户申请开始,带你一步步进行开发一个微信小程序,直到提交微信控制台上线发布。
《G01 Go 实战入门》
从零开始带你一步步开发一个 Go 博客项目,让你在最短的时间内学会使用 Go 进行编码。项目结构很大程度上参考了 Laravel。
讨论数量: 20

我记得QueryList文档里有说,怎么爬取JS渲染的页面,是个插件

找到了
github.com/jae-jae/QueryList-Commu...

2年前 评论

这个跟laravel没啥关系哦 分析接口模拟请求散

2年前 评论
  • 无头浏览器 rialto-php/puphpeteer,没更新了,不支持 Laravel 9,我自己 fork 改了下版本
  • github.com/spatie/crawler
2年前 评论
ShiKi

你直接接口请求数据 复制成 cURL 格式,然后放到 postman 中就可以一键生成代码了.
关于登录,如果接口不方便登录的话, 可以尝试使用 火车浏览器 进行模拟登录然后把 cookie 保存下来,再构造请求.

2年前 评论

用GOlang,直接模拟浏览器,想采集什么都有!而且可以并发采集!

2年前 评论

用 guzzle 手动写请求呗,就是有点累

2年前 评论
donggan (楼主) 2年前
donggan (楼主) 2年前
tomcath (作者) 2年前
donggan (楼主) 2年前
小白菜 2年前
donggan (楼主) 2年前
小白菜 2年前
donggan (楼主) 2年前
小白菜 2年前
w_W_v_V

headless puppeteer

2年前 评论

请求带上cookie session 或者token,可能还需要自己做一下登录

2年前 评论

我自己在网上稍微学了点Python,主要是用的BeautifulSoup这个库,主要是解析html节点,一开始里面的参数尽量都按照最小的来,确定正确再调整,中间设置好sleep时间,因为我这种没有那种IP代理,我也只会简单的爬取导出csv

file

2年前 评论
pardon110

scrapy

2年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!