时时商务社区

标题: 初级的用php写的采集程序 [打印本页]

作者: wx_pylelnL4    时间: 2018-2-14 09:25

            可以先用这个采集然后在用帝国处理
count($presult[0]))
                                $pc=count($presult[0]);
                for($i=1;$i返回首页[/url]
";
                while(list($num,$var)=each($))
                {
                                if($_POST['showtype']=="图片")
                                {
                                                echo  "

";
                                }
                                else
                                echo  $var."
";
                }
####################################################################################
                //exit();
}
?>
实例1(信息页有分页,使用了简单的分页正则):

输入图片地址[I]

图片地址正则[I]'>

图片地址前缀[I]

图片地址标识[I]

图片标题正则[I]{图片标题}'>

分页地址正则[I].[0-9]'>

分页地址模式[I]


获取分页信息
不要分页信息


获取1页
获取2页
获取3页
获取4页
获取5页
获取全部


直接显示图片
直接显示地址

[I]

实例2(信息页没有分页,所以分页正则为空):

输入图片地址[I]

图片地址正则[I]

图片地址标识[I]

图片标题正则[I]{图片标题}[/TD]'>

分页地址正则[I]

分页地址模式[I]


获取分页信息
不要分页信息


获取1页
获取2页
获取3页
获取4页
获取5页
获取全部


直接显示图片
直接显示地址

[I]

实例3(信息页没有分页,所以分页正则为空,图片为绝对地址,所以图片地址前缀为空):

输入图片地址[I]

图片地址正则[I][I]
'>

图片地址前缀[I]

图片地址标识[I]

图片标题正则[I]{图片标题}[/td]'>

分页地址正则[I]

分页地址模式[I]


获取分页信息
不要分页信息


获取1页
获取2页
获取3页
获取4页
获取5页
获取全部


直接显示图片
直接显示地址

[I]

华声论坛图片为附件http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336436
图片地址正则:upload=jpg{图片地址}upload
图片地址标识:bbs
图片标题正则:帖子主题[/B]:{图片标题}[/td]
华声论坛图片为外链http://bbs.hnol.net/dispbbs2.asp?boardID=50&ID=336253
图片地址正则:img]{图片地址}/
图片地址标识:jpg
图片标题正则:帖子主题[/B]:{图片标题}[/td]
            
            
        




欢迎光临 时时商务社区 (http://bbs.4435.cn/) Powered by Discuz! X3.2