PHP 数据采集的一种思路

今天老大让我抓取某个网页的数据,最开始我就想到了querylist,但是不管怎么获取数据都没有成功,最后在网上了解到queryList无法爬取table


想了很久,最后想到了一个办法
先用file_get_contents获取当前界面的html代码,然后用自己写的去html代码空的函数,trimall

function trimall($str){
    $qian=array(" "," ","\t","\n","\r");
    return str_replace($qian, '', $str);  
}

如果需要处理乱码,用iconv函数

最后用strip_tags去除所有Html代码

根据需求匹配自己需要的数据

主要解决的问题是:php抓取界面显示的内容

本作品采用《CC 协议》,转载必须注明作者和本文链接
《L03 构架 API 服务器》
你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程,JWT 概念及使用 和 API 开发相关的进阶知识。
《L02 从零构建论坛系统》
以构建论坛项目 LaraBBS 为线索,展开对 Laravel 框架的全面学习。应用程序架构思路贴近 Laravel 框架的设计哲学。
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!