设为首页
收藏本站
用户名
Email
自动登录
找回密码
密码
登录
立即注册
只需一步,快速开始
快捷导航
登录
注册
论坛首页
BBS
建站模版
微站设计
虚拟主机
企业邮箱
博客日志
Blog
搜索
搜索
搜索
热搜
长春
优惠
活动
做网站
本版
帖子
用户
本版
帖子
用户
请
登录
后使用快捷导航
没有帐号?
立即注册
道具
勋章
任务
留言板
设置
我的收藏
退出
时时商务社区
»
论坛首页
›
建站资源
›
建站技术
›
基于PHP的简单采集数据入库程序【续篇】 ...
返回列表
查看:
630
|
回复:
0
基于PHP的简单采集数据入库程序【续篇】
[复制链接]
新格网络
当前离线
积分
7789
2617
主题
2617
帖子
7789
积分
论坛元老
论坛元老, 积分 7789, 距离下一级还需 9992210 积分
论坛元老, 积分 7789, 距离下一级还需 9992210 积分
积分
7789
发消息
电梯直达
楼主
发表于 2018-2-14 05:55:46
|
只看该作者
|
倒序浏览
|
阅读模式
在上篇文章中,我们已经采集新闻信息页的列表数据,接下来要做的操作就是从数据库中读取所需要采集的URL,进行页面抓取就行
新建一个content表
不过需要注意的一点是,不能再采用采集URL这种id递增的方法去采集,因为数据表中可能出现id断续,比如id=9,id=11,当采集到id=10的时候,URL是空白的,这样可能会导致采集到了空字段。
这里用到的一个技巧是数据库的查询语句,在我们采集完第一条数据的时候,判断数据库里是否还有大于此id的id编号,若有,读取一条,查询信息重复上面的工作。
具体代码如下:
(.*)/iUs";
preg_match($pattern, $content,$info);//获取内容存放info
echo $title=$row[1]."
";
echo $content=$info[0]."";
//插入数据库
$add="insert into content(title,content) value('$title','$content')";
mysql_query($add);
$sql2="select * from list where id>$id order by id asc limit 1";
$result2=mysql_query($sql2);
$row2=mysql_fetch_array($result2);//取得对应的url地址
if($row2['id']){
echo "";
}
?>
这样子我们所要的新闻内容就采集入库了,接下来只需要对数据的一些样式进行整理就行了。
您可能感兴趣的文章:
深入php数据采集的详解
解析php利用正则表达式解决采集内容排版的问题
php采集文章中的图片获取替换到本地(实现代码)
php实现的一个很好用HTML解析器类可用于采集数据
php使用curl模拟登录后采集页面的例子
一个基于phpQuery的php通用采集类分享
PHP远程采集图片详细教程
PHP使用CURL_MULTI实现多线程采集的例子
基于PHP的简单采集数据入库程序
PHP实现采集中国天气网未来7天天气
PHP采集静态页面并把页面css,img,js保存的方法
分享到:
QQ好友和群
QQ空间
腾讯微博
腾讯朋友
收藏
0
回复
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
用户反馈
客户端