Jsoup是一个开源的Java HTML解析器,可以通过选择器语法来提取和操作HTML文档。它提供了一种简单、方便的方式来解析HTML并提取其中的数据。
以下是Jsoup的一些常用用法:
解析HTML文档:Document doc = Jsoup.parse(html);通过URL解析HTML文档:Document doc = Jsoup.connect(url).get();选择器语法提取元素:Elements links = doc.select("a");Element element = doc.selectFirst("#id");Elements elements = doc.select(".class");获取元素的属性和文本:String href = link.attr("href");String text = link.text();遍历元素:for (Element link : links) { // do something}修改元素的属性和文本:link.attr("href", "newUrl");link.text("newText");提取表单数据:Elements forms = doc.select("form");for (Element form : forms) { String action = form.attr("action"); // do something}除了上述常用用法,Jsoup还提供了强大的功能,如处理文档编码、处理HTML片段、处理文件上传等。可以通过查阅官方文档来了解更多详细用法:https://jsoup.org/

