需要安裝
pip install chardet
可以檢測網頁,也可以檢測字符串
import urllib
import chardet
'''
從網頁的頭部信息可以查看的內容
網頁的大小,編碼等(有時候可能為空)
可以使用chardet來檢測網頁的編碼
'''
url = 'http://baidu.com'
headerInfo = urllib.urlopen(url).info()
# headerInfo.getparam('charset')
context = urllib.urlopen(url)
print chardet.detect(context)
返回的是一個字典,可以通過字典的key拿到對應的值
result = chardet.detect(context)
print result['encoding']
import urllib
import chardet
'''
代碼的封裝
'''
def auto_getCharset(targetUrl):
context = urllib.urlopen(targetUrl).read()
result = chardet.detect(context)
return result['encoding']
if __name__=='__main__':
urls = ['http://www.csdn.net/','http://www.imooc.com/','http://www.51cto.com/',
'http://www.mukedaba.com/','http://www.nowcoder.com/']
for url in urls:
print url , auto_getCharset(url)