关于PHP,我绝对是门外汉,这里记录一下我晚上为获取百度收录总数量、百度今日收录数量和百度快照日期的而整理的代码。它用到了三个函数:file_get_contents()、preg_match()与iconv()。file_get_contents() 函数把整个文件读入一个字符串中,它是用于将文件的内容读入到一个字符串中的首选方法。preg_match()函数则根据指定的模式来匹配文件名或字符串。iconv()函数用于将字符串由一种编码转换为另一种编码。
具体代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 | <?php $domain = "www.ninthday.net"; /*欲查询的域名*/ $site_url = 'http://www.baidu.com/s?wd=site%3A'; $all = $site_url.$domain; /*域名所有收录的网址*/ $today = $all.'&lm=1'; /*域名今日收录的网址*/ $utf_pattern = "/找到相关结果数(.*)个/"; $gb2312_pattern = iconv("UTF-8","GB2312",$utf_pattern); /*因为百度为GB2312编码*/ $kz_pattern = "/<span class=\"g\">(.*)<\/span>/"; /*用以匹配快照日期的字符串*/ $times = "/\d{4}-\d{1,2}-\d{1,2}/"; /*匹配快照日期的正则表达式,如:2011-8-4*/ $s0 = @file_get_contents($all); /*将site:www.ninthday.net的网页置入$s0字符串中*/ $s1 = @file_get_contents($today); preg_match($gb2312_pattern,$s0,$all_num); /*匹配"找到相关结果数*个"*/ preg_match($gb2312_pattern,$s1,$today_num); preg_match($kz_pattern,$s0,$temp); preg_match($times,$temp[0],$screenshot); if($all_num[1] == "") $all_num[1] = 0; if($today_num[1] == "") $today_num[1] = 0; if($screenshot[0] == "") $screenshot[0] = "暂无快照"; ?> <html> <head> <title>Test</title> </head> <body> <p>百度收录:<a href="<?php echo $all; ?>" target="_blank"><?php echo $all_num[1]; ?></a></p> <p>百度今日收录:<a href="<?php echo $today; ?>" target="_blank"><?php echo $today_num[1]; ?></a></p> <p>百度快照日期:<a href="<?php echo $all; ?>"><?php echo $screenshot[0]; ?></a></p> </body> </html> |
下图是运行后的显示结果:

声明:本文采用 BY-NC-SA 协议进行授权 | 星期九
原创文章转载请注明:转自《PHP获取百度收录数量及百度快照》
功能使用,有空鼓捣一下
这个比较牛啊。但我通常都是在别的网站查呢。
这个都研究 太给力了哦
你为什么取名 星期九 我很好奇哦
@黄健祥, 为什么叫“星期九”在我的关于页面有说明吧
真专业。。。
怎么申请那个备案的啊??
@煎豆, 什么备案?ICP备案吗?你不是有备案号吗?
@Harid, 还没办下来,那个是虚设的。你是蓝冰帮你办的么??
@煎豆, 还没办下来也可以放了?!我的备案是在域名刚注册就备案好了的,那个时候备案还很容易的,一年之前了。现在的备案我也备过,我是等了近三个星期才下来的,中间还不能打电话给管局询问,只能干等,而且各地的通信局办事效率很不一样,通过率也很不一样。我备案了好几次了,都是在湖南省通信局备的,貌似湖南的通过比较容易。
@Harid,邮寄开始 花了好久时间啊??
我们在同一主机上~~~
@煎豆, 那就有点生死与共的味道了,一挂同挂,
Random Posts
Recent Posts
Recent Comments
By Plastic injection mould
By OOZJ
By Jusbe
By 互联网战
By 互联网战
By ixwebhosting
Blogroll
Categories
Tag Cloud
360 5800 Alexa C++ Chrome Cisco Dedecms Discuz Fcitx Fedora GFW Gravatar IE Linux Mobile ModelSim Music QT Quartus Shell Verilog VPN VPS Windows Wordpress XAMPP Xilinx xp 下载 垃圾评论 情感 手机 插件 星期九 注册 电子信息 程序设计 站长工具 缩略图 网络应用 考研 胡思乱想 西工大 视频 软件Meta