PHP使用表正则表达式获取HTML内容

全屏阅读
  • 基本信息
  • 作者:
  • 作者已发布:925篇文章
  • 发布时间:2021年03月06日 21:51:27
  • 所属分类:PHP+MySql
  • 阅读次数:2364次阅读
  • 标签:

php怎么抓取网页某个DIV区块的内容。像funp推推王那样每次推文都会显示文章内的图片,提供缩图撰择,又是怎么做到的?其实这语法出乎意料的简短…

1. 取得指定网页内的所有图片:测试

开新视窗复制代码列印?

<?php
//取得指定位址的内容,并储存至text
$text=file_get_contents('http://www.tra56/');
//取得所有img标识,并储存至二维阵列match
preg_match_all('#<img[^>]*>#i', $text, $match);
//输出match
print_r($match);
?>

 2. 取得指定网页内的第一张图片:测试

开新视窗复制代码列印?

<?php
//取得指定位址的内容,并储存至text
$text=file_get_contents('http://www.tra56/');
//取得第一个img,并储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);
//输出match
print_r($match);
?>

3. 取得指定网页内的特定div区块:测试

<?php
    //取得指定位址的内容,并储存至text
    $text=file_get_contents('http://www.tra56/2018/01/');
    //去除换行及空白字元(序列化内容才需使用)
    //$text=str_replace(array("r","n","t","s"), '', $text);
    //取出div且id为PostContent的内容,并储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match);
    //输出match[0]
    print($match[0]);
    ?>

 4. 上述2及3的结合:测试

<?php
    //取得指定位址的内容,并储存至text
    $text=file_get_contents('http://www.tra56/2018/01/');
    //取出div标籤且id为PostContent的内容,并储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match);
    //取得第一个img,并储存至阵列match2
    preg_match('/<img[^>]*>/Ui', $match[0], $match2);
    //输出match2[0]
    print_r($match2[0]);
?>

方式可以用,只是个人觉得file_get_contents效率不高,建议改成curl

顶一下
(0)
100%
订阅 回复
踩一下
(0)
100%
» 郑重声明:本文由mpxq168发布,所有内容仅代表个人观点。版权归恒富网mpxq168共有,欢迎转载, 但未经作者同意必须保留此段声明,并给出文章连接,否则保留追究法律责任的权利! 如果本文侵犯了您的权益,请留言。

目前有 0 条留言 其中:访客:0 条, 博主:0 条

给我留言

您必须 [ 登录 ] 才能发表留言!