PHP采撷CSDN博客边栏的阅读排行

PHP采集CSDN博客边栏的阅读排行

  项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。

复制代码

<?php    include_once'simple_html_dom.php');    header'Content-Type:text/html;charset=utf-8');    $html = file_get_html'http://blog.csdn.net/szy361');    $res = $html->find'#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title    $span = $html->find'#hotarticls ul.panel_body li span');//取得span    foreach$res as $element){        $arr[] = $element->title.'+'.$element->href;//将title值和href的值通过+连起来    }    foreach$span as $e){        $brr[] = $e->innertext;//得到span下的值组成的数组    }        //将两个数组组成一个新的二维数组    for$i=0;$i<count$res);$i++){        $crr[] = explode'+',$arr[$i]);        $crr[$i][] = $brr[$i];    }    return $crr;

复制代码

扩展:

PHP Simple HTML DOM解析器使用入门

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注