时时商务社区

标题: php基于Snoopy解析网页html的方法 [打印本页]

作者: xgnic    时间: 2018-2-14 05:44

            本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:
set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}
希望本文所述对大家的php程序设计有所帮助。
            
            
您可能感兴趣的文章:
  • snoopy PHP版的网络客户端提供本地下载
  • snoopy 强大的PHP采集类使用实例代码
  • PHP采集利器 Snoopy 试用心得
  • 基于Snoopy的PHP近似完美获取网站编码的代码
  • php使用curl和正则表达式抓取网页数据示例
  • PHP采集类Snoopy抓取图片实例
  • PHP采集类snoopy详细介绍(snoopy使用教程)
  • php结合正则批量抓取网页中邮箱地址
  • php中Snoopy类用法实例
  • PHP正则表达式抓取某个标签的特定属性值的方法
  • PHP怎样用正则抓取页面中的网址
  • PHP正则+Snoopy抓取框架实现的抓取淘宝店信誉功能实例
            




    欢迎光临 时时商务社区 (http://bbs.4435.cn/) Powered by Discuz! X3.2