這篇文章主要介紹了python去除所有html標簽的方法,涉及Python正則替換的相關技巧,非常簡單實用,需要的朋友可以參考下
本文實例講述了python去除所有html標簽的方法。分享給大家供大家參考。具體分析如下:
這段代碼可以用於去除文本裡的字符串標簽,不包括標簽裡面的內容
?
1 2 3 4 5 import re html='<a href="http://www.3lian.net">腳本之家</a>,Python學習!' dr = re.compile(r'<[^>]+>',re.S) dd = dr.sub('',html) print(dd)運行結果如下:
?
1 腳本之家,Python學習!希望本文所述對大家的Python程序設計有所幫助。