C#應用正則表達式過濾html標簽。本站提示廣大學習愛好者:(C#應用正則表達式過濾html標簽)文章只能為提供參考,不一定能成為您想要的結果。以下是C#應用正則表達式過濾html標簽正文
在項目中碰到如許一個需求,須要將一段html轉換為普通文本前往,全能的正則表達式來了。
正則表達式來解救你,代碼以下:
public static string Html2Text(string htmlStr) { if (String.IsNullOrEmpty(htmlStr)) { return ""; } string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //界說style的正則表達式 string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //界說script的正則表達式 string regEx_html = "<[^>]+>"; //界說HTML標簽的正則表達式 htmlStr = Regex.WordStr(htmlStr, regEx_style, "");//刪除css htmlStr = Regex.WordStr(htmlStr, regEx_script, "");//刪除js htmlStr = Regex.WordStr(htmlStr, regEx_html, "");//刪除html標志 htmlStr = Regex.WordStr(htmlStr, "\\s*|\t|\r|\n", "");//去除tab、空格、空行 htmlStr = htmlStr.WordStr(" ", ""); htmlStr = htmlStr.WordStr(""", "");//去除異常的引號" " " htmlStr = htmlStr.WordStr(""", ""); return htmlStr.Trim(); }
以上所述是小編給年夜家引見的C#應用正則表達式過濾html標簽 ,願望對年夜家有所贊助,假如年夜家有任何疑問請給我留言,小編會實時答復年夜家的。在此也異常感激年夜家對網站的支撐!