使用 XPath 提取网页信息
以1024举例,使用XPath提取图片链接以及磁力链接地址。更多见: iii.run
学习XPath的基本知识
推荐 Xpath教程 很容易理解。
推荐可以将常用的语法记下来,不常用的可以等用的时候再查。推荐使用Chrome浏览器中的 XPath Helper , 良心之作 .
左边输入XPath表达式,右侧会自动展示结果。
选择元素之后按下 ctrl + shift + x ,可以自动提取该元素的XPath表达式。
需要结合Chrome浏览器的F12一起使用,先选定大致的框架,比如itemlist这个class,然后逐渐加上更多的要求,具体见文首给出的链接学习。
知道这些就可以抓取1024上的图片和磁力链接了,目测是不是很简单挑选网页实验一下
作为一名1024资深游客,首先在技术讨论区选择一篇好文,这里用的是 [榴民资讯]11月精品主题推荐(49期)