$url = "https://so.gushiwen.org/shiwenv_94e9aad7a0d2.aspx";
$html = curlget($url);
$regular = "/html/body//a//@href";
$titlexpath = "//h1";
$titles = xpathregular($html,$titlexpath);
for ($i = 0; $i < $titles->length; $i++)
{
$title = $titles->item($i);
$title = $title->nodeValue;
echo $title;
}
function curlget($url)
{
$url = "https://so.gushiwen.org/shiwenv_94e9aad7a0d2.aspx";
$ch = curl_init(); // 2. 设置选项,包括URL
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER,0);
curl_setopt($ch,CURLOPT_SSL_VERIFYHOST,0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_HEADER,0);
// 3. 执行并获取HTML文档内容
$output = curl_exec($ch);
if($output === FALSE )
{
echo "CURL Error:".curl_error($ch);
} // 4. 释放curl句柄
return $output;
curl_close($ch);
}
function xpathregular($html,$regular)
{
$dom = new DOMDocument();
//从一个字符串加载HTML
@$dom->loadHTML($html);
//使该HTML规范化
$dom->normalize();
//用DOMXpath加载DOM,用于查询
$xpath = new DOMXPath($dom);
#获取所有的a标签的地址
$results = $xpath->query($regular);
return $results;
}
phpcurl+xpath示例
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 什么是xpath? xpath(XML path language)是一门在XML文档中查找的语言,可用来在XML...
- 什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可...
- 什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可...