一、問題
先看一個例子:
<?php
$ar = array(1, 2, 3);
var_dump($ar);
foreach ($ar as &$v) {}
foreach ($ar as $v) {}
var_dump($ar);
?>
輸出為:
array(3) {
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
array(3) {
[0]=>
int(1)
[1]=>
int(2)
[2]=>
&int(2)
}
???為什麼沒有進行賦值操作,數組最後一個元素的值卻發生了改變呢?
我早就發現了這個問題,一開始以為是 PHP 的 bug,就扔著沒管它, foreach 中不使用引用就沒事, 用 foreach $k => $v 然後 $ar[$k] 來改變原始數組, 略微損失點效率。
二、分析
今天花了點時間,看了 參考 中的文章, 算是稍微明白一點了,原來是這個樣子的:
在執行第一個使用引用的 foreach 時, 一開始, $v 指向 $ar[0] 的存儲空間,空間內存儲著 1 , foreach 結束時, $v 指向 $ar[2] 的存儲空間,空間內存儲著 3 。 下面要開始執行第二個 foreach 了,注意和第一個 foreach 不同, 第二個 foreach 沒有使用引用,那麼就是賦值方式, 即將 $ar 的值依次 賦值 給 $v 。 進行到第一個元素時,要將 $ar[0] 賦值給 $v 。 問題就在這裡,由於剛剛執行完第一個 foreach, $v 不是一個新變量,而是已經存在的、指向 $ar[2] 的那個 引用 , 如此一來,對 $v 進行賦值的時候,就將 $ar[0] = 1 寫入了 $ar[2] 的實際存儲空間, 相當於對 $ar[2] 進行賦值。 依此類推,第二個 foreach 執行的結果, 就是數組的最後一個元素變成了倒數第二個元素的值。 參考文章 2 中有詳細的示意圖。
如果說這是一個錯誤,那麼錯誤的原因就在於對引用變量的使用。 當引用變量指向和其他變量時,改變引用變量的值當然會影響到他指向的其他變量。 單獨說誰都明白,但在這個 foreach 例子中,湊巧了, 同一個變量兩次被使用,前一次是引用的身份,後一次是普通變量身份, 就產生了意料之外的效果。 PHP 的開發者也認為,這種情況屬於語言特性造成的,不是 bug。 的確,如果要修復這個問題,一種方法是對 foreach 進行特殊處理之外, 另外一種就是限制 foreach 中 $v 的作用域, 這兩種方式都與目前 PHP 的語言特性不符,開發人員不願改, 但還是在 官方文檔 中用 Warning 進行了說明。
三、解決方法
簡單,但談不上完美,就是在使用了引用的 foreach 之後, unset 掉 $v , 開始的例子改為:
<?php
$ar = array(1, 2, 3);
var_dump($ar);
foreach ($ar as &$v) {}
unset($v);
foreach ($ar as $v) {}
var_dump($ar);
?>
運行結果:
array(3) {
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
array(3) {
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
參考
Bug #29992 foreach by reference corrupts the array:https://bugs.php.net/bug.php?id=29992
References and foreach:http://schlueters.de/blog/archives/141-References-and-foreach.html