php 页面内联和外链获取方法,内部跳转链接,外部跳转链接独立获取,可以自己写几行函数自己改成批量或者是一个域名把全部网页呢内链外链获取后查看页面的有效性。
<?php
$html = file_get_contents('http://nmgqq.com.cn/');
$dom = new DOMDocument();
@$dom->loadHTML($html);
//抓取页面上的所有内容
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
//展示外链链接获取
if(substr($url,0,4)=='http'){
echo $url.'<br />';
}
//展示内连接
if(substr($url,0,4)<>'http'&&substr($url,0,4)<>'java'&&substr($url,0,1)<>'#'&&substr($url,0,3)<>'/'){
echo $url.'<br />';
}
}
?>