0
点赞
收藏
分享

微信扫一扫

jsoup 解析html


 

 


 

      最近做html内容抽取,使用的是HtmlParser,但当提取数学符号,上标和下标时,没有办法提取。最终通过自定义<sub>和<sup>两个tag类,并将其注入 factory中,得以解决。

 

      在搜索 html parser自定义tag时,无意中发现了jsoup,看了技术手册,使用比较简单,学习的成本相当低(如果对jquery有一定的应用),基本上没有门槛,建议以后在解析html时,尝试并尽量使用jsoup.

 

举报

相关推荐

0 条评论