初沁
  • 初沁
  • 全自动文章发布
  • GIT
    • git命令
    • Github无法访问解决办法
  • QueryList
    • 表格采集
    • 采集列表
  • 迅睿cms
    • 迅睿cms标签调用
      • 联动菜单调用 dr_linkage
      • 百度地图调用
      • 分页标签问题
      • 迅睿cms常用调用标签
    • 迅睿插件修改
      • 文章SEO配图
      • 迅睿分站插件
      • 轮播图插件
      • 自动更新历史文章时间
      • 采集入库发布接口
  • PESCMS
    • PESCMS文档系统修改
  • EXCEL
    • Excel公式
  • 开发问题
    • 解决:IIS/Apache/Nginx/Tomcat响应头缺失低危漏洞方法。
    • 宝塔定时任务不执行及执行失败301问题
    • 数据库批量更新内容
    • php图片处理-补全图片链接
    • wb部署
    • 注释样式
    • MySQL报错-1146-Table ‘performance

搜索结果

没有相关内容~~

表格采集

最新修改于 2025-09-26 18:15
## 去除头部写法 `$content = QueryList::get($url)->rules($rules)->removeHead()->queryData();` ## 表格采集 由于网页中的`table`表格每一行、每一列没有明显的`class`或`id`,让很多人对采集表格感觉束手无策。 下面演示如何通过`伪选择器`来采集表格。 示例 采集代码: ``` use QL\QueryList; $html = 姓名 年龄 职位 Rae 29 医生 Marsh 56 牧师 Solomon 18 作家 STR; $table = QueryList::html($html)->find('table'); // 采集表头 $tableHeader = $table->find('tr:eq(0)')->find('td')->texts(); // 采集表的每行内容 $tableRows = $table->find('tr:gt(0)')->map(function($row){ return $row->find('td')->texts()->all(); }); print_r($tableHeader->all()); print_r($tableRows->all()); ``` 采集结果: ``` Array ( [0] => 姓名 [1] => 年龄 [2] => 职位 ) Array ( [0] => Array ( [0] => Rae [1] => 29 [2] => 医生 ) [1] => Array ( [0] => Marsh [1] => 56 [2] => 牧师 ) [2] => Array ( [0] => Solomon [1] => 18 [2] => 作家 ) ) ```
开始访问