在网页采集过程中,我们需要获取一个网站的meta信息,如title、keywords、description等,本文章向大家介绍两种方法获取网站的meta信息,第一种方法是使用get_meta_tags函数,第二种方法是使用正则表达式匹配的方法获取。 1:使用get_meta_tags函数获取meta信息比如我们要获取http://www.taobao.com这个网页的meta信息,...
日期:2021-03-06 浏览:2125次 评论: 0 阅读全文
正则表达式中,“。”(点符号)匹配的是除了换行符“\n”以外的所有字符。但有时候我们需要匹配包括换行符在内的字符,经过一番搜索,发现了几种正则表达式匹配任意字符(包括换行符)的方法。   可以用 ([\s\S]*) ,也可以用 “([\d\D]*)”、“([\w\W]*)” 来匹配,就可以匹配包括换行符在内的任意字符。   下面是...
日期:2021-03-06 浏览:2117次 评论: 0 阅读全文