以下是蜘蛛的基本原理。
$html = file_get_contents('http://www.example.com');
$dom = new DOMDocument();
@$dom->loadHTML($html);
// grab all the on the page
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);
$url = $href->getAttribute('href');
echo $url.'<br />';
}
这正是我需要的。谢谢。
非常适合联盟网站!
WAAAAO 太棒了……我一直在寻找它
我不太理解如何使用它?我在哪里输入?我有点困惑.. 我需要更多解释
谢谢
没错,如何使用这些php代码片段
看,我的方法更清晰(希望他们教我们如何)
已经尝试过几个,我不知道如何实现这些php代码片段
这篇文章太好了。点赞!
继续努力;)
非常感谢您的帮助!
完美!谢谢!
请问有人可以一步步地向我展示如何使用它吗?提前感谢
完美。一直在使用php simple DOM,但它不像这个那样好!
PHP 和 DOM 的独特力量释放。基于 cURL 和 REGEX 的技术无法与之匹敌。当然,它们有自己的用途。非常感谢。
如何跟踪所有其他子页面?
谢谢。
XPath 的性能如何?
太棒了。非常感谢。
谢谢,非常简单。很棒!
嗨,感谢您的帮助,我有一个问题,
如果我需要获取具有特定类的链接怎么办
这样可以吗?:(html/body//a.class)
嗨
是否有此代码的 curl 版本?
如果您能用 curl 编写它,我将不胜感激。
谢谢
谢谢老兄。这正是我需要的。
此代码仅适用于一个链接,我需要任何链接… 例如 http://www.abc.com… 或… http://www.xyz.com 等等