利用正則表達式去掉字符串中所有html內容,得到所有文本內容,去掉的內容有:div,img,超連接,script腳本等Html內容。將以下例子保存為ASP文件,運行一下就知道效果了。
<%
Function RemoveHtml( strText )
Dim RegEx
Set RegEx = New RegExp
RegEx.Pattern = "<[^>]*>"
RegEx.Global = True
RemoveHtml = RegEx.Replace(strText, "")
End Function
str="<html><body><a href=""a.ASP"">打開</a><img src=""1.jpg""><div class=""a3"">aaa</div></body></Html>"
response.write removeHtml(str)
%>