PHP 数据采集的一种思路

今天老大让我抓取某个网页的数据,最开始我就想到了querylist,但是不管怎么获取数据都没有成功,最后在网上了解到queryList无法爬取table


想了很久,最后想到了一个办法
先用file_get_contents获取当前界面的html代码,然后用自己写的去html代码空的函数,trimall

function trimall($str){
    $qian=array(" "," ","\t","\n","\r");
    return str_replace($qian, '', $str);  
}

如果需要处理乱码,用iconv函数

最后用strip_tags去除所有Html代码

根据需求匹配自己需要的数据

主要解决的问题是:php抓取界面显示的内容

本作品采用《CC 协议》,转载必须注明作者和本文链接
《L05 电商实战》
从零开发一个电商项目,功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等
《L04 微信小程序从零到发布》
从小程序个人账户申请开始,带你一步步进行开发一个微信小程序,直到提交微信控制台上线发布。
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!