目錄
使用 *args 和 **kwargs 來調用函數
什麼時候使用它們?
生成器(Generators)
可迭代對象(Iterable)
迭代器(Iterator)
迭代(Iteration)
生成器(Generators)
那現在我們將看到怎樣使用*args和**kwargs 來調用一個函數。 假設,你有這樣一個小函數:
def test_args_kwargs(arg1, arg2, arg3):
print("arg1:", arg1)
print("arg2:", arg2)
print("arg3:", arg3)
你可以使用*args或**kwargs來給這個小函數傳遞參數。 下面是怎樣做:
# 首先使用 *args
args = ("two", 3, 5)
test_args_kwargs(*args)
arg1: two
arg2: 3
arg3: 5
# 現在使用 **kwargs:
kwargs = {"arg3": 3, "arg2": "two", "arg1": 5}
test_args_kwargs(**kwargs)
arg1: 5
arg2: two
arg3: 3
標准參數與*args、**kwargs在使用時的順序
那麼如果你想在函數裡同時使用所有這三種參數, 順序是這樣的:
some_func(fargs, *args, **kwargs)
這還真的要看你的需求而定。
最常見的用例是在寫函數裝飾器的時候(會在另一章裡討論)。
此外它也可以用來做猴子補丁(monkey patching)。猴子補丁的意思是在程序運行時(runtime)修改某些代碼。
打個比方,你有一個類,裡面有個叫get_info的函數會調用一個API並返回相應的數據。如果我們想測試它,可以把API調用替換成一些測試數據。例
如:
import someclass
def get_info(self, *args):
return "Test data"
someclass.get_info = get_info
我敢肯定你也可以想象到一些其他的用例。
首先我們要理解迭代器(iterators)。根據維基百科,迭代器是一個讓程序員可以遍歷一個容器(特別是列表)的對象。然而,一個迭代器在遍歷並讀取一個容器的數據元素時,並不會執行一個迭代。你可能有點暈了,那我們來個慢動作。換句話說這裡有三個部分:
可迭代對象(Iterable)
迭代器(Iterator)
迭代(Iteration)
上面這些部分互相聯系。我們會先各個擊破來討論他們,然後再討論生成器(generators).
Python中任意的對象,只要它定義了可以返回一個迭代器的__iter__方法,或者定義了可以支持下標索引的__getitem__方法(這些雙下劃線方法會在其他章節中全面解釋),那麼它就是一個可迭代對象。簡單說,可迭代對象就是能提供迭代器的任意對象。那迭代器又是什麼呢?
任意對象,只要定義了next(Python2) 或者__next__方法,它就是一個迭代器。就這麼簡單。現在我們來理解迭代(iteration)
用簡單的話講,它就是從某個地方如一個列表)取出一個元素的過程。當我們使用一個循環來遍歷某個東西時,這個過程本身就叫迭代。現在既然我們有了這些術語的基本理解,那我們開始理解生成器吧。
生成器也是一種迭代器,但是你只能對其迭代一次。這是因為它們並沒有把所有的值存在內存中,而是在運行時生成值。你通過遍歷來使用它們,要麼用一個“for”循環,要麼將它們傳遞給任意可以進行迭代的函數和結構。大多數時候生成器是以函數來實現的。然而,它們並不返回一個值,而是yield(暫且譯作“生出”)一個值。這裡有個生成器函數的簡單例子:
def generator_function():
for i in range(10):
yield i
for item in generator_function():
print(item)
這個案例並不是非常實用。生成器最佳應用場景是:你不想同一時間將所有計算出來的大量結果集分配到內存當中,特別是結果集裡還包含循環。
譯者注:這樣做會消耗大量資源
許多Python 2裡的標准庫函數都會返回列表,而Python 3都修改成了返回生成器,因為生成器占用更少的資源。
下面是一個計算斐波那契數列的生成器:
# generator version
def fibon(n):
a = b = 1
for i in range(n):
yield a
a, b = b, a + b
# Now we can use it like this
for x in fibon(1000000):
print(x)
用這種方式,我們可以不用擔心它會使用大量資源。然而,之前如果我們這樣來實現的話:
def fibon(n):
a = b = 1
result = []
for i in range(n):
result.append(a)
a, b = b, a + b
return result
這也許會在計算很大的輸入參數時,用盡所有的資源。我們已經討論過生成器使用一次迭代,但我們並沒有測試過。在測試前你需要再知道一個Python內置函數:next()。它允許我們獲取一個序列的下一個元素。那我們來驗證下我們的理解:
def generator_function():
for i in range(3):
yield i
gen = generator_function()
print(next(gen))
# Output: 0
print(next(gen))
# Output: 1
print(next(gen))
# Output: 2
print(next(gen))
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# StopIteration
我們可以看到,在yield掉所有的值後,next()觸發了一個StopIteration的異常。基本上這個異常告訴我們,所有的值都已經被yield完了。你也許會奇怪,為什麼我們在使用for循環時沒有這個異常呢?啊哈,答案很簡單。for循環會自動捕捉到這個異常並停止調用next()。你知不知道Python中一些內置數據類型也支持迭代哦?我們這就去看看:
my_string = "Yasoob"
next(my_string)
# Output: Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# TypeError: str object is not an iterator
好吧,這不是我們預期的。這個異常說那個str對象不是一個迭代器。對,就是這樣!它是一個可迭代對象,而不是一個迭代器。這意味著它支持迭代,但我們不能直接對其進行迭代操作。那我們怎樣才能對它實施迭代呢?是時候學習下另一個內置函數,iter。它將根據一個可迭代對象返回一個迭代器對象。這裡是我們如何使用它:
my_string = "Yasoob"
my_iter = iter(my_string)
next(my_iter)
# Output: 'Y'
現在好多啦。我肯定你已經愛上了學習生成器。一定要記住,想要完全掌握這個概念,你只有使用它。確保你按照這個模式,並在生成器對你有意義的任何時候都使用它。你絕對不會失望的!
http://hksc.cs.cityu.edu.hk/pr
List of articles 1. Friends pr