程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

正則表達式與re庫的知識-python爬蟲與信息提取(2)-北京理工大學-嵩天老師

編輯:Python

一、Re庫的Match對象

1、Match對象是一次匹配的結果,包含匹配的很多信息

import re
match=re.search(r'[1-9]\d{5}','BIT 100081')
if match:
print(match.group(0))
100081
type(match)
<class 're.Match'>

2、match對象屬性

3、match對象方法

 

import re
m=re.search(r'[1-9]\d{5}',"BIT100081 TSU100084")
m.string
'BIT100081 TSU100084'
m.re
re.compile('[1-9]\\d{5}')
m.pos
0
m.endpos
19
m.group(0)
'100081'
m.start()
3
m.end()
9
m.span()
(3, 9)

 二、Re的貪婪匹配和最小匹配

1、貪婪匹配(Re庫默認貪婪匹配,就是匹配盡可能多的東西)

match = re.search(r'PY.*N', 'PYANBNCNDN')
match.group(0)
'PYANBNCNDN'

2、最小匹配(代碼裡加一個問號)

match = re.search(r'PY.*?N', 'PYANBNCNDN')
match.group(0)
'PYAN'

3、最小匹配操作符

 4、Re庫和正則表達式總結

 


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved