今天我們來研究一下 Python 中最快的循環方式。
01
各種姿勢
比如說有一個簡單的任務,就是從 1 累加到 1 億,我們至少可以有 7 種方法來實現,列舉如下:
def while_loop(n=100_000_000):
i = 0
s = 0
while i < n:
s += i
i += 1
return s
def for_loop(n=100_000_000):
s = 0
for i in range(n):
s += i
return s
def sum_range(n=100_000_000):
return sum(range(n))
def sum_generator(n=100_000_000):
return sum(i for i in range(n))
def sum_list_comp(n=100_000_000):
return sum([i for i in range(n)])
import numpy
def sum_numpy(n=100_000_000):
return numpy.sum(numpy.arange(n, dtype=numpy.int64))
import numpy
def sum_numpy_python_range(n=100_000_000):
return numpy.sum(range(n))
上述 7 種方法得到的結果是一樣的,但是消耗的時間卻各不相同,你可以猜測一下哪一個方法最快,然後看下面代碼的執行結果:
import timeit
def main():
l_align = 25
print(f'{
"1、while 循環":<{
l_align}} {
timeit.timeit(while_loop, number=1):.6f}')
print(f"{
'2、for 循環':<{
l_align}} {
timeit.timeit(for_loop, number=1):.6f}")
print(f'{
"3、sum range":<{
l_align}} {
timeit.timeit(sum_range, number=1):.6f}')
print(f'{
"4、sum generator":<{
l_align}} {
timeit.timeit(sum_generator, number=1):.6f}')
print(f'{
"5、sum list comprehension":<{
l_align}} {
timeit.timeit(sum_list_comp, number=1):.6f}')
print(f'{
"6、sum numpy":<{
l_align}} {
timeit.timeit(sum_numpy, number=1):.6f}')
print(f'{
"7、sum numpy python range":<{
l_align}} {
timeit.timeit(sum_numpy_python_range, number=1):.6f}')
if __name__ == '__main__':
main()
執行結果如下所示:
02
比較快的方式
for 和 while 本質上在做相同的事情,但是 while 是純 Python 代碼,而 for 是調用了 C 擴展來對變量進行遞增和邊界檢查,我們知道 CPython 解釋器就是 C 語言編寫的,Python 代碼要比 C 代碼慢,而 for 循環代表 C,while 循環代表 Python,因此 for 比 while 快。
numpy 內置的 sum 要比 Python 的 sum 快
numpy 主要是用 C 編寫的,相同的功能,肯定是 numpy 的快,類似的,numpy 的 arange 肯定比 Python 的 range 快。
numpy 的 sum 與 Python 的 range 結合使用,結果耗時最長,見方法 7。最好是都使用 numpy 包來完成任務,像方法 6。
生成器是惰性的,不會一下子生成 1 億個數字,而列表推導式會一下子申請全部的數字,內存占有較高不說,還不能有效地利用緩存,因此性能稍差。