laravel如何去爬网页上的数据

问答 / 2 / 20 / 创建于 3年前

我昨天用QueryList 插件去拉取线上的数据，因为那个网站的有些数据是通过接口调用后填充的，我用这个插件获取到的数据就是0，
我就想有没有一个插件能拉取到网页已经结束后的所有页面？
大家都是怎么去爬网页数据的？

324 声望

暂无个人描述~

《L05 电商实战》

从零开发一个电商项目，功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等

《L03 构架 API 服务器》

你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程，JWT 概念及使用和 API 开发相关的进阶知识。

讨论数量: 20

liaosp

课程读者 444 声望

selenium +php

3年前评论

airy

128 声望

我记得QueryList文档里有说，怎么爬取JS渲染的页面，是个插件

找到了
github.com/jae-jae/QueryList-Commu...

3年前评论

putyy

140 声望

这个跟laravel没啥关系哦分析接口模拟请求散

3年前评论

小李世界

Laravel 8.x 译者 2.0k 声望 / Doge 先锋 @ dogeow.com

无头浏览器 rialto-php/puphpeteer，没更新了，不支持 Laravel 9，我自己 fork 改了下版本
github.com/spatie/crawler

3年前评论

ShiKi

Laravel 8.x 译者 130 声望 / 农村闲散劳动力 @ 家里蹲

你直接接口请求数据复制成 cURL 格式,然后放到 postman 中就可以一键生成代码了.
关于登录,如果接口不方便登录的话, 可以尝试使用火车浏览器进行模拟登录然后把 cookie 保存下来,再构造请求.

3年前评论

dongzhiyu

130 声望

用GOlang，直接模拟浏览器，想采集什么都有！而且可以并发采集！

3年前评论

tomcath

Laravel 9.x 译者 194 声望

用 guzzle 手动写请求呗，就是有点累

3年前评论

donggan （楼主）

这个guzzle如何执行javascript，因为我的一些数据是javascript执行后才出来的

donggan （楼主）

@tomcath 我用guzzle,只能拉到一个html架子，没有数据，需要执行javascript

tomcath （作者）

@donggan 那你可能只有考虑 selenium 了，PHP 也能用，不过用 Python 会简单些

donggan （楼主）

@tomcath 我后来用chrome-php/chrome插件和chromium无头浏览器的模式，这不好一点就是Linux上的chromium老是断掉？

小白菜

@donggan javascript 那你直接看他的javasript 请求的接口地址是什么，然后php直接请求对应的地址不就行了

donggan （楼主）

@小白菜接口地址我也知道，但是对方加密了，我拉下来也没用

小白菜

@donggan 那你还爬，不怕他告你啊

donggan （楼主）

@小白菜公司要的，还没搞定呢

小白菜

@donggan 方便发一下网址或api地址看一下吗

w_W_v_V

见习助教 19 声望 / 后勤部部长 @ 十四大盗

headless puppeteer

3年前评论

Joker0100

1 声望

请求带上cookie session 或者token,可能还需要自己做一下登录

3年前评论

ljheisenberg

课程读者 187 声望

我自己在网上稍微学了点Python，主要是用的BeautifulSoup这个库，主要是解析html节点，一开始里面的参数尽量都按照最小的来，确定正确再调整，中间设置好sleep时间，因为我这种没有那种IP代理，我也只会简单的爬取导出csv。

file

3年前评论

pardon110

862 声望 / 开发者 @ 社科大

用 scrapy 吧

3年前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助