0
点赞
收藏
分享

微信扫一扫

java代码处理HTML识别IMG标签,自动抓取网页图片内容,的正则配置

zhongjh 2022-05-17 阅读 144


案例代码:

<p><img src=\\\"​​https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1596546745835&di=22c349312e299fe8af8040c679e7e01b&imgtype=0&src=http%3A%2F%2Fmedia-cdn.tripadvisor.com%2Fmedia%2Fphoto-s%2F01%2F3e%2F05%2F40%2Fthe-sandbar-that-links.jpg​​\\\" title=\\\"图3.png\\\" alt=\\\"图3.png\\\" oldsrc=\\\"W020200731477969213655.png\\\" </img></></p>";

 ”


正则表达式

<img[\s+]src=.*?(\/>|\<\/img>)

运行结果

共找到 1 处匹配:

<img src=\\\"https://data.stcn.com/djsj/202007/W020200731477969213655.png\\\" title=\\\"图3.png\\\" alt=\\\"图3.png\\\" oldsrc=\\\"W020200731477969213655.png\\\" </img>

java代码处理HTML识别IMG标签,自动抓取网页图片内容,的正则配置_正则表达式


举报

相关推荐

0 条评论