Python中許多功能的實現都有許多方法。在python中並不是代碼越多越好,而是越少越好。代碼不是越復雜越好,而是越簡單越好。基於這一思想,python中設計了許多非常有用的高級特性。
(1)簡單列表生成式
例如要生成前10個數的平方[1x1, 2x2, 3x3, ..., 10x10]
,使用常規辦法需要借助循環。
L = []
for x in range(1, 11):
L.append(x * x)
這種方式太過繁瑣,而列表生成式可以使用一行語句代替上面的循環
[x * x for x in range(1,11)]
# [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
寫列表生成式時,把要生成的元素x*x
放到前面,後面跟for循環,就可以把list創建出來。
(2)兩層循環與多變量循環
列表生成式支持多重循環,例如
[m + n for m in 'ABC' for n in 'XYZ']
# ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
三層以上的循環就很少用到了。
由於for循環支持兩個甚至多個變量,因此列表生成式也支持同樣的功能
d = {
'x': 'A', 'y': 'B', 'z': 'C' }
[k + '=' + v for k, v in d.items()]
# ['y=B', 'x=A', 'z=C']
(3)列表生成式的if用法
for循環加if用法
[x for x in range(1, 11) if x % 2 == 0]
# [2, 4, 6, 8, 10]
跟在for後面的if是一個篩選條件。
(4)列表生成式的if…else用法
for循環加if…else用法
[x if x % 2 == 0 else -x for x in range(1, 11)]
# [-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
for前面的部分是一個表達式,它必須根據for循環得到的x計算出一個結果,作為列表的一個元素。
上述for前面的表達式x if x % 2 == 0 else -x
才能根據x計算出確定的結果。如果只用if不加else,則考察表達式:x if x % 2 == 0
,它無法根據x計算出結果,因此程序會報錯。
綜上,在一個列表生成式中,for
前面的if ... else
是表達式,而for
後面的if
是過濾條件,不能帶else
。
由於內存的限制,列表的容量是有限的,如果我們需要創建一個包含100萬個元素的列表,但每次僅需要訪問前幾個元素,這樣不僅占用了很大的存儲空間,其它絕大多數元素占用的空間都白白浪費了。
如果元素列表可以按照某種算法推算出來,就可以在循環過程中不斷推算列表元素,這樣就不必一次創建完成的list,從而節省大量的空間,這種一邊循環一邊計算的機制,稱為生成器generator。
(1)創建生成器
創建generator最簡單的方法,把一個列表生成式的[]
改成()
,就創建了一個generator:
g = (x * x for x in range(10))
# <generator object <genexpr> at 0x1022ef630>
調用生成器generator的元素,可以通過for循環:
g = (x * x for x in range(10))
for n in g:
print(n)
(2)使用yield創建生成器
如果一個函數定義中包含yield
關鍵字,那麼這個函數就不再是一個普通函數,而是一個generator函數。
def odd():
print('step 1')
yield 1
print('step 2')
yield(3)
print('step 3')
yield(5)
可以通過next()
函數獲得generator的下一個返回值,直到計算到最後一個元素,沒有更多的元素時,拋出StopIteration
的錯誤。
generator函數和普通函數的執行流程不一樣。普通函數是順序執行,遇到return
語句或者最後一行函數語句就返回。而變成generator的函數,在每次調用next()
的時候執行,遇到yield
語句返回,再次執行時從上次返回的yield
語句處繼續執行。
調用該generator函數時,首先要生成一個generator對象,然後用next()
函數不斷獲得下一個返回值:
>>> o = odd()
>>> next(o)
step 1
1
>>> next(o)
step 2
3
>>> next(o)
step 3
5
>>> next(o)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
把函數改成generator函數後,我們基本上從來不會用next()
來獲取下一個返回值,而是直接使用for
循環來迭代。
for n in odd():
print(n)
(1)變量指向函數
函數本身也可以賦值給變量,即:變量可以指向函數。
>>> f = abs
>>> f(-10)
10
說明變量f
現在已經指向了abs
函數本身。直接調用abs()
函數和調用變量f()
完全相同。
(2)函數名也是變量
函數名其實就是指向函數的變量!對於abs()
這個函數,完全可以把函數名abs
看成變量,它指向一個可以計算絕對值的函數!
>>> abs = 10
>>> abs(-10)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not callable
把abs
指向10
後,就無法通過abs(-10)
調用該函數了!因為abs
這個變量已經不指向求絕對值函數而是指向一個整數10
!(當然實際代碼不可能這麼寫)
(3)傳入函數
一個函數就可以接收另一個函數作為參數,這種函數就稱之為高階函數。
def add(x, y, f):
return f(x) + f(y)
當我們調用add(-5, 6, abs)
時,參數x
,y
和f
分別接收-5
,6
和abs
,實現絕對值加法計算。
(4)map/reduce
map()
函數接收兩個參數,一個是函數,一個是Iterable
,map
將傳入的函數依次作用到序列的每個元素,並把結果作為新的Iterator
返回。
舉例說明,比如我們有一個函數f(x)=x2,要把這個函數作用在一個list [1, 2, 3, 4, 5, 6, 7, 8, 9]
上,就可以用map()
實現如下:
>>> def f(x):
... return x * x
...
>>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
reduce()
函數接收兩個參數,一個是函數,一個是Iterable
。reduce
把一個函數作用在一個序列[x1, x2, x3, ...]
上,這個函數必須接收兩個參數,reduce
把結果繼續和序列的下一個元素做累積計算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
例如把序列[1, 3, 5, 7, 9]
變換成整數13579
:
>>> from functools import reduce
>>> def fn(x, y):
... return x * 10 + y
...
>>> reduce(fn, [1, 3, 5, 7, 9])
13579
(5)filter
Python內建的filter()
函數用於過濾序列。
filter()
接收一個函數和一個序列,把傳入的函數依次作用於每個元素,然後根據返回值是True
還是False
決定保留還是丟棄該元素。
例如,在一個list中,刪掉偶數,只保留奇數
def is_odd(n):
return n % 2 == 1
list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
# 結果: [1, 5, 9, 15]
(6)sorted
排序也是在程序中經常用到的算法。無論使用冒泡排序還是快速排序,排序的核心是比較兩個元素的大小。
Python內置的sorted()
函數就可以對list進行排序:
>>> sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
sorted()
函數也是一個高階函數,它還可以接收一個key
函數來實現自定義的排序
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
默認情況下,對字符串排序,是按照ASCII的大小比較的
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
若要忽略大小寫,按照字母序排序,只要我們能用一個key函數把字符串映射為忽略大小寫排序即可
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
要進行反向排序,不必改動key函數,可以傳入第三個參數reverse=True
:
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
(1)函數作為返回值
高階函數除了可以接受函數作為參數外,還可以把函數作為結果值返回。
例如如果不需要立刻求和,而是在後面的代碼中,根據需要再計算怎麼辦?可以不返回求和的結果,而是返回求和的函數:
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
當我們調用lazy_sum()
時,返回的並不是求和結果,而是求和函數:
>>> f = lazy_sum(1, 3, 5, 7, 9)
>>> f
<function lazy_sum.<locals>.sum at 0x101c6ed90>
調用函數f
時,才真正計算求和的結果:
>>> f()
25
(2)閉包
上面例子中內部函數sum
可以引用外部函數lazy_sum
的參數和局部變量。
閉包就是能夠讀取其他函數內部變量的函數。
需要注意的問題是,返回的函數並沒有立刻執行,而是直到調用了f()
才執行。
返回閉包時牢記一點:返回函數不要引用任何循環變量,或者後續會發生變化的變量。
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()
>>> f1()
9
>>> f2()
9
>>> f3()
9
使用閉包,就是內層函數引用了外層函數的局部變量。如果只是讀外層變量的值,我們會發現返回的閉包函數調用一切正常。但是,如果對外層變量賦值,由於Python解釋器會把x
當作函數fn()
的局部變量,它會報錯。
def inc():
x = 0
def fn():
nonlocal x
x = x + 1
return x
return fn
f = inc()
print(f()) # 1
print(f()) # 2
原因是x
作為局部變量並沒有初始化,直接計算x+1
是不行的。但我們其實是想引用inc()
函數內部的x
,所以需要在fn()
函數內部加一個nonlocal x
的聲明。加上這個聲明後,解釋器把fn()
的x
看作外層函數的局部變量,它已經被初始化了,可以正確計算x+1
。
關鍵字lambda
表示匿名函數,冒號前面的x
表示函數參數。
匿名函數有個限制,就是只能有一個表達式,不用寫return
,返回值就是該表達式的結果。
>>> list(map(lambda x: x * x, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
[1, 4, 9, 16, 25, 36, 49, 64, 81]
匿名函數也是一個函數對象,也可以把匿名函數賦值給一個變量,再利用變量來調用該函數:
>>> f = lambda x: x * x
>>> f(5)
25
也可以把匿名函數作為返回值返回
def build(x, y):
return lambda: x * x + y * y
假設我們要增強某個函數的功能,比如,在函數調用前後自動打印日志,但又不希望修改函數的定義,這種在代碼運行期間動態增加功能的方式,稱之為“裝飾器”(Decorator)。
本質上,decorator就是一個返回函數的高階函數。
def log(func):
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
觀察上面的log
,因為它是一個decorator,所以接受一個函數作為參數,並返回一個函數。(其中__name__
屬性,可以拿到函數的名字)
使用log函數時要借助Python的@語法,把decorator置於函數的定義處
@log
def now():
print('2022-6-28')
把@log
放到now()
函數的定義處,相當於執行了語句:
now = log(now)
調用now()
函數,不僅會運行now()
函數本身,還會在運行now()
函數前打印一行日志:
>>> now()
call now():
2022-6-28
由於函數有__name__
等屬性,但經過decorator裝飾之後的函數,它們的__name__
已經從原來的'now'
變成了'wrapper'
,所以,需要把原始函數的__name__
等屬性復制到wrapper()
函數中,否則,有些依賴函數簽名的代碼執行就會出錯。
一個完整的decorator的寫法如下
import functools
def log(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
帶參數的decorator
import functools
def log(text):
def decorator(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('%s %s():' % (text, func.__name__))
return func(*args, **kw)
return wrapper
return decorator
Python的functools
模塊提供了偏函數(Partial function)功能。把一個函數的某些參數給固定住(也就是設置默認值),返回一個新的函數,調用這個新函數會更簡單。
例如int()
函數提供了額外的base
參數,默認值為10
。如果傳入base
參數,就可以做N進制的轉換:
>>> int('12345', base=8)
5349
>>> int('12345', 16)
74565
functools.partial
就是幫助我們創建一個偏函數的,不需要我們自己定義int2()
,可以直接使用下面的代碼創建一個新的函數int2
:
>>> import functools
>>> int2 = functools.partial(int, base=2)
>>> int2('1000000')
64
>>> int2('1010101')
85
本博客文章首先發布於個人博客網站:https://www.mahaofei.com/,歡迎大家訪問。