找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1832|回复: 0
打印 上一主题 下一主题

php基于Snoopy解析网页html的方法

[复制链接]

3444

主题

3465

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
11142
跳转到指定楼层
楼主
发表于 2018-2-14 05:44:10 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

            本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:
set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}
希望本文所述对大家的php程序设计有所帮助。
            
            
您可能感兴趣的文章:
  • snoopy PHP版的网络客户端提供本地下载
  • snoopy 强大的PHP采集类使用实例代码
  • PHP采集利器 Snoopy 试用心得
  • 基于Snoopy的PHP近似完美获取网站编码的代码
  • php使用curl和正则表达式抓取网页数据示例
  • PHP采集类Snoopy抓取图片实例
  • PHP采集类snoopy详细介绍(snoopy使用教程)
  • php结合正则批量抓取网页中邮箱地址
  • php中Snoopy类用法实例
  • PHP正则表达式抓取某个标签的特定属性值的方法
  • PHP怎样用正则抓取页面中的网址
  • PHP正则+Snoopy抓取框架实现的抓取淘宝店信誉功能实例
            
  • 分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    用户反馈
    客户端