程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> Java裡面去掉網頁裡的HTML標記的方法

Java裡面去掉網頁裡的HTML標記的方法

編輯:關於JAVA
01./**
02. * 去掉字符串裡面的html代碼。<br>
03. * 要求數據要規范,比如大於小於號要配套,否則會被集體誤殺。
04. *
05. * @param content
06. * 內容
07. * @return 去掉後的內容
08. */
09.public static String stripHtml(String content) {
10. // <p>段落替換為換行
11. content = content.replaceAll("<p .*?>", "\r\n");
12. // <br><br/>替換為換行
13. content = content.replaceAll("<br\\s*/?>", "\r\n");
14. // 去掉其它的<>之間的東西
15. content = content.replaceAll("\\<.*?>", "");
16. // 還原HTML
17. // content = HTMLDecoder.decode(content);
18. return content;
19.}
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved