‘大众娱乐购彩大厅’网页结构的简介和Xpath语法的入门教程

发布时间：2024-11-16 18:06:02

本文摘要：坚信很多小伙伴早已听闻过Xpath，之前小编也写出过一篇关于Xpath的文章，感兴趣的小伙伴可以砍这篇文章如何利用Xpath捕捉京东网商品信息以及Python网络爬虫四大选择器（正则表达式、BS4、Xpath、CSS）总结。

坚信很多小伙伴早已听闻过Xpath，之前小编也写出过一篇关于Xpath的文章，感兴趣的小伙伴可以砍这篇文章如何利用Xpath捕捉京东网商品信息以及Python网络爬虫四大选择器（正则表达式、BS4、Xpath、CSS）总结。今天小编之后给大家讲解一些Xpath知识点，期望对大家的自学有协助。

1、Xpath让我们可以用于一种类似于Windows下的文件路径的方式，让我们可以定位到HTML或者XML结构中的明确元素。Xpath本身包括标一些定函数库，可以让我们的Xpath语法更为强劲。2、在HTML结构中，有一定的层级关系，主要的关系还包括：父节点、子节点、同胞节点（兄弟节点）、先辈节点、后代节点。一般的，像类似于这种结构，称作一个节点。

如上图，根据层次关系，我们可以告诉节点是的父节点，适当的，节点是节点的子节点。同胞节点又叫兄弟节点，一般的正处于同级层次的节点叫同胞节点，如上图中的节点和第一个节点、177～181讫的标签都是归属于同胞节点。先辈节点又叫祖先节点，一般的，一个节点的上层以上的节点均称作先辈节点，所以父节点也是归属于先辈节点的一种。基于此，我们又可以称之为节点是的先辈节点。

比较不应的，一个节点的下层以下的节点均称作后代节点，所以子节点也是归属于后代节点的一种。基于此，我们又可以称之为节点是节点的后代节点。

3、解读这些节点之间的关系之后，可以便利我们更佳的解读Xpath语法，下表是部分常用的Xpath语法。这里特别强调“／”和“／／”的区别，“／”一般代表的某个元素的子节点，而不是全部的后代节点；而“／／”一般代表的某个元素的后代节点，范围比“／”代表的要更为普遍一些。＠符号后边经常回来class，代表挑选取名为class属性的节点，较为少见。

4、下面针对明确的网页源码，让大家理解一下网页结构。如上图中的红色框框中，class为属性，而等于号后边的“grid－5”即为属性值，有的时候节点内不只是一个属性，如上图中的196讫中，就有两个属性。5、为了更为便利的定位到div或者其他节点下的标签，我们必须之后更进一步的展开定位瞄准，下表是部分常用的Xpath语法。掌控了Xpath语法科学知识之后，我们就可以通过Xpath语法来展开撰写Xpath表达式，以萃取网页上的目标数据。

千里之行，始于足下。如果想要懂Xpath，堪称必须勤加用于，下一篇文章将给大家讲解Xpath在Scrapy爬虫项目中的用于。

本文关键词：大众彩票首页大厅,彩神彩票购彩大厅v,大众彩票第一娱乐平台,大众娱乐购彩大厅

本文来源：大众彩票首页大厅-www.572355.com

上一篇：全新激光钝化方法提高了前沿LED的效率【彩神彩票购彩大厅v】

下一篇：大众彩票首页大厅-智能小区电动自行车RFID防盗管理解决方案