jsoup Selector类学习笔记,快速提升你的HTML处理能力!
moboyou 2025-06-13 07:52 3 浏览
Selector 类是 jsoup 库中的一个核心类,用于通过 CSS 选择器语法来查找 HTML 文档中的元素。
选择器语法
通用选择器 * :匹配任何元素。
标签选择器 tag :匹配指定标签名的元素。
ID 选择器 #id :匹配具有指定 ID 的元素。
类选择器 .class :匹配具有指定类名的元素。
属性选择器 [attr] :匹配具有指定属性的元素。
属性值选择器 [attr=val] :匹配具有指定属性值的元素。
属性值前缀选择器 [attr^=valPrefix] :匹配属性值以指定前缀开头的元素。
属性值后缀选择器 [attr$=valSuffix] :匹配属性值以指定后缀结尾的元素。
属性值包含选择器 [attr*=valContaining] :匹配属性值包含指定文本的元素。
属性值正则选择器 [attr~=regex] :匹配属性值符合正则表达式的元素。
子元素选择器 E F :匹配作为 E 元素后代的 F 元素。
子元素选择器 E > F :匹配作为 E 元素直接子元素的 F 元素。
相邻兄弟选择器 E + F :匹配紧接在 E 元素后的 F 元素。
兄弟选择器 E ~ F :匹配在 E 元素之后的所有 F 元素。
分组选择器 E, F, G :匹配 E、F 或 G 元素。
伪类选择器
:lt(n) :匹配兄弟元素中索引小于 n 的元素。
:gt(n) :匹配兄弟元素中索引大于 n 的元素。
:eq(n) :匹配兄弟元素中索引等于 n 的元素。
:has(selector) :匹配包含指定选择器匹配的元素的元素。
:is(selector list) :匹配选择器列表中任意一个选择器的元素。
:not(selector) :匹配不匹配指定选择器的元素。
:contains(text) :匹配包含指定文本的元素。
:containsOwn(text) :匹配直接包含指定文本的元素。
:containsData(data) :匹配包含指定数据的元素。
:containsWholeText(text) :匹配包含指定完整文本的元素。
:containsWholeOwnText(text) :匹配直接包含指定完整文本的元素。
:matches(regex) :匹配包含符合正则表达式的文本的元素。
:matchesWholeText(regex) :匹配包含符合正则表达式的完整文本的元素。
:matchesWholeOwnText(regex) :匹配直接包含符合正则表达式的完整文本的元素。
结构伪类选择器
:root :匹配文档的根元素。
:nth-child(an+b) :匹配父元素之前有 an+b-1 个兄弟元素的元素。
:nth-last-child(an+b) :匹配父元素之后有 an+b-1 个兄弟元素的元素。
:nth-of-type(an+b) :匹配父元素之前有 an+b-1 个同类型兄弟元素的元素。
:nth-last-of-type(an+b) :匹配父元素之后有 an+b-1 个同类型兄弟元素的元素。
:first-child :匹配父元素的第一个子元素。
:last-child :匹配父元素的最后一个子元素。
:first-of-type :匹配父元素的第一个同类型子元素。
:last-of-type :匹配父元素的最后一个同类型子元素。
:only-child :匹配没有其他兄弟元素的元素。
:only-of-type :匹配没有其他同类型兄弟元素的元素。
:empty :匹配不包含任何子元素的元素。
方法
select(String query) :根据 CSS 选择器查找匹配的元素。
selectFirst(String cssQuery, Element root) :根据 CSS 选择器查找第一个匹配的元素。
注意事项
使用正则表达式时,可能需要使用 Pattern.quote("regex") 来正确解析。
特殊字符需要使用 \ 进行转义。
- 上一篇:前端面试:css选择器有哪些,选择器的权重的优先级
- 下一篇:jquery选择器
相关推荐
- 在html5页面中如何使用vue3
-
今天是2021.7.14,是个好日子.好久没发布文章了.今天发布下如何在在html页面中使用vue3.义县游学电子科技一直以技术文章为主.以下是h5的页面源码:<html><scri...
- 分享几个css实用技巧
-
本篇将介绍几个css小技巧,目录如下:自定义引用标签的符号重置所有标签样式禁止文本选择制作小三角形自定义<q>引用标签的符号默认q标签引用符号是浏览器根据不同语言环境自动设置的,当然我们也...
- 复玥语 Web Fonts 的引入方法
-
CSS的font-face属性CSS的font-face是CSS3中允许使用自定义字体的一个模块,功能是支持WEB字体,能够将网络地址、自定义的Web上的字体嵌入到你的网页中。...
- 17个CSS知识点整理
-
微信ID:WEB_wysj(点击关注)◎◎◎◎◎◎◎◎◎一┳═┻︻▄(点击页底“阅读原文”下载源代码)●●●1、对WEB标准以及W3C的理解与认识标签闭合、标签小写、不乱嵌套、提高搜索机...
- JavaScript开发基础——CSS知识
-
JavaScript开发基础——CSS知识使用CSS技术可以对文档进行精细的页面美化,CSS不仅可以对单个页面进行格式化,还可以对多个页面使用相同的样式进行修饰,以达到统一的效果。CSS的相关概念CS...
- HTML序章(学习目的、对象、基本概念)——零基础自学网页制作
-
为什么学习网页制作?互联网时代的今天,各种各样的网页充斥着我们的生活。只要使用浏览器,打开的每一个页面都可以称之为网页。即使使用头条这样的APP,其内容布局、展示的方法也脱胎于网页页面设计的方法与原则...
- 如何拥有渐变色 | css进阶
-
渐变色--线性渐变人类对美的追求是无止境的,色彩的搭配是对美的最基本要求,而其中的渐变,就能给人一种舒缓的感觉,它不那么的突兀,给人一种不逼迫、缓缓地和高逼格感觉。Css3引入了渐变的功能,有线性渐变...
- Tailwindcss 入门
-
是什么?Tailwindcss是一个功能类优先的CSS框架,通过flex,pt-4,text-center和rotate-90这种原子类组合快速构建网站,而不需要离开你的HTML。...
- html css js基础知识点
-
提示:点击上方"蓝色字体"↑可以订阅噢!1.对WEB标准以及W3C的理解与认识标签闭合、标签小写、不乱嵌套、提高搜索机器人搜索几率、使用外链css和js脚本、结构行为表现的分离、文件下载与页面速度更...
- (一)熟练HTML5+CSS3,每天复习一遍
-
前言学习网页的概念和分类,了解静态网页和动态网页的不同;了解网页浏览器的工作原理。了解HTML,XHTML,HTML5的概念,制作简单的HTML页面的开发。什么是网页可以在internet上通过网页浏...
- JavaScript代码怎样引入到HTML中?
-
JavaScript程序不能独立运行,它需要被嵌入HTML中,然后浏览器才能执行JavaScript代码。通过<script>标签将JavaScript代码引入到HTM...
- 你知道HTML、CSS、JS文件在浏览器中是如何转化成页面的吗?
-
在前面一篇文章:「高频面试题」浏览器从输入url到页面展示中间发生了什么中,我们有对浏览器的渲染流程做了一个概括性的介绍,今天这篇文章我们将深入学习这部分内容。对于很多前端开发来说,平常做工主要专注...
- HTML页面中head标签有啥用?——零基础自学网页制作
-
head标签概述通过之前三节的学习,我们基本了解了HTML标记语言的基本语法,也明确了一个基本原则,那就是网页中所有的可视信息都是写在<body></body>标签之间的,在一...
- 一、什么是CSS3
-
一、什么是CSS3如何学习SEO搜索引擎优化CSS是什么CascadingSheet层叠级联样式表,表现,网页美化CSS发展史:CSS1.0CSS2.0DIV+CSSHTML和CSS结构分...
- html实现原生table并设置表格边框的两种方式
-
在HTML中实现原生表格并设置表格边框的详尽教程在HTML中,表格是展示结构化数据的重要工具。为了使表格更加清晰、美观,设置表格边框是常见的需求。本文将深入探讨两种原生方式来实现表格边框...
- 一周热门
- 最近发表
- 标签列表
-
- curseforge官网网址 (16)
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle 数据导出导入 (16)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- oracle修改端口 (15)
- 左连接 oracle (15)
- oracle 转义字符 (14)
- oracle安装补丁 (19)
- matlab归一化 (16)
- matlab脚本 (14)
- 共轭梯度法matlab (16)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- c语言编程小知识大全 (17)
- css class选择器用法 (25)
- css样式引入 (30)