肥宅自学平台_人人成为技术开发者

肥宅人只等待您,联系我们吧,曾经的巅峰是否能回来?我们正在用心服务!

JAVA通过正则匹配html里面body标签的内容

 更新时间:2023-09-11 07:19:37   作者:肥宅-季波   我要评论(0)  

         JAVA通过正则匹配html里面body标签的内容,具体代码如下,如果要取得html代码中body里面的内容 不包含body标签,直接调用 removeBody
  1. /**
  2.      *  获取html中body的内容 包含body标签
  3.      * @param htmlStr  html代码
  4.      * @return
  5.      */
  6.     public static String getBody(String htmlStr){
  7.         String pattern = "<body[^>]*>([\\s\\S]*)<\\/body>";
  8.         Pattern p_body = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
  9.         Matcher m_body = p_body.matcher(htmlStr);
  10.         if (m_body.find()){
  11.             return m_body.group();
  12.         }
  13.         return htmlStr;
  14.     }
  15.     /**
  16.      * 取到html中body里面的内容 不包含body标签
  17.      * @param htmlStr
  18.      * @return
  19.      */
  20.     public static String removeBody(String htmlStr){
  21.         /**
  22.          * 获取html代码中body标签里的内容
  23.          */
  24.         htmlStr=getBody(htmlStr);
  25.         //body开头标签
  26.         String bodyEx_start = "<body[^>]*>";
  27.         //body结尾标签
  28.         String bodyEx_end = "<\\/body>";
  29.         Pattern p_script = Pattern.compile(bodyEx_start, Pattern.CASE_INSENSITIVE);
  30.         Matcher m_script = p_script.matcher(htmlStr);
  31.         htmlStr = m_script.replaceAll(""); // 过滤script标签
  32.         Pattern p_style = Pattern.compile(bodyEx_end, Pattern.CASE_INSENSITIVE);
  33.         Matcher m_style = p_style.matcher(htmlStr);
  34.         htmlStr = m_style.replaceAll(""); // 过滤style标签
  35.         return htmlStr;
  36.     }
以上就是JAVA通过正则匹配html里面body标签的内容所有内容。
"小礼物走一走,来肥宅自学平台支持我"
评论区

评论

共条评论
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~
客服中心在线客服
全心全意为平台用户服务
Copyright © 2017-2023 自学平台网站地图:去查看>
  • 肥宅人自己的自学平台
  • 人人都能成为平台讲师
  • 贡献你的力量壮大肥宅自学平台
  • 将自己的能力变现
  • 实现人生的第二职业
网址收藏平台安卓APP
微信公众号微信公众号

本站部分图片或者资源来自程序自动采集或卖家(商家)发布,如果侵犯了您的权益请与我们联系,我们将在24小时内删除!谢谢!

肥宅自学教程网是一个主打IT视频教程、自媒体运行、摄影剪辑等内容的资源学习交流平台。