程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> PHP內核探索之變量

PHP內核探索之變量

編輯:PHP綜合

php變量組成部分:

變量名:php語言的變量名以$開頭+英文/下劃線,可以包含數字、下劃線、字母,區分大小寫。同時PHP也支持復合變量,形如$$A,增加了php的動態性。

類型:php屬於弱類型語言,可以賦值任意類型的值。

內容:在同一時刻只能有一種值。

php語言中存在8中數據類型,分為三大類:

1. 標量類型:Boolean,integer,float,string;

2. 復合類型:object,array;

3. 特殊類型:NULL,resource;

php作為一種弱類型語言,在實現內部所有變量是通過結構zval來存儲數據的,不僅包含變量的值,也包含變量的類型,是php弱類型的核心。

zval數據結構:

struct _zval_struct{
  zvalue_value value;    //存儲變量的值
  zend_unint  refcount_gc; //引用計數
  zend_char  is_ref_gc;  // 是否為引用
  zend_char  type;     //存儲變量的類型
}

其中zvalue_value並不是一個結構體,為了節省內存使用的union來實現的,因為在同一時刻變量只能表示一種類型。其原型:

typedef union _zvalue_value{
  long lval;         
  double dval;
  struct {
      char *val;
      int len;      //字符串的長度
    }str;
  HashTable *ht;       //保存數組
  zend_object_value obj;   //對象
}zvalue_value;

哈希表:

php內部很多實現基於哈希表:變量的作用域、函數表、類的屬性、方法等,Zend引擎內部的很多數據都是保存在哈希表中的。

php數組使用哈希表來存儲關聯數據,哈希表實現使用兩個數據結構HashTable和Bucket:

HashTable:

typedef struct _hashtable { 
  uint nTableSize;    // hash Bucket的大小,最小為8,以2x增長。
  uint nTableMask;    // nTableSize-1 , 索引取值的優化
  uint nNumOfElements;  // hash Bucket中當前存在的元素個數,count()函數會直接返回此值 
  ulong nNextFreeElement; // 下一個數字索引的位置
  Bucket *pInternalPointer;  // 當前遍歷的指針(foreach比for快的原因之一)
  Bucket *pListHead;     // 存儲數組頭元素指針
  Bucket *pListTail;     // 存儲數組尾元素指針
  Bucket **arBuckets;     // 存儲hash數組
  dtor_func_t pDestructor;  // 在刪除元素時執行的回調函數,用於資源的釋放
  zend_bool persistent;    // 指出了Bucket內存分配的方式。如果persisient為TRUE,
                  則使用操作系統本身的內存分配函數為Bucket分配內存,否則使用
                  PHP的內存分配函數。
  unsigned char nApplyCount; // 標記當前hash Bucket被遞歸訪問的次數(防止多次遞歸)
  zend_bool bApplyProtection;// 標記當前hash桶允許不允許多次訪問,不允許時,最多只能遞歸3次
#if ZEND_DEBUG
  int inconsistent;
#endif
} HashTable;

在HashTable中容量的擴增,始終調整為接近初始大小的2的整數次方。因為:

在選槽時,這裡使用&操作而不是使用取模,這是因為是相對來說取模操作的消耗和按位與的操作大很多。mask的作用就是將哈希值映射到槽位所能存儲的索引范圍內。 例如:某個key的索引值是21, 哈希表的大小為8,則mask為7,則求與時的二進制表示為: 10101 & 111 = 101 也就是十進制的5。 因為2的整數次方-1的二進制比較特殊:後面N位的值都是1,這樣比較容易能將值進行映射, 如果是普通數字進行了二進制與之後會影響哈希值的結果。那麼哈希函數計算的值的平均分布就可能出現影響。

bucket:

typedef struct bucket {
  ulong h;      // 對char *key進行hash後的值,或者是用戶指定的數字索引值
  uint nKeyLength;  // hash關鍵字的長度,如果數組索引為數字,此值為0
  void *pData;    // 指向value,一般是用戶數據的副本,如果是指針數據,則指向pDataPtr
  void *pDataPtr;   //如果是指針數據,此值會指向真正的value,同時上面pData會指向此值
  struct bucket *pListNext;  // 整個hash表的下一元素
  struct bucket *pListLast;  // 整個哈希表該元素的上一個元素
  struct bucket *pNext;    // 存放在同一個hash Bucket內的下一個元素
  struct bucket *pLast;    // 同一個哈希bucket的上一個元素
// 保存當前值所對於的key字符串,這個字段只能定義在最後,實現變長結構體
  char arKey[1];       
} Bucket; 

在Bucket中存儲的是哈希值而不是哈希的索引。

上面結構體的最後一個字段用來保存key的字符串,而這個字段卻申明為只有一個字符的數組, 其實這裡是一種長見的變長結構體,主要的目的是增加靈活性。 以下為哈希表插入新元素時申請空間的代碼

p = (Bucket *) pemalloc(sizeof(Bucket) - 1 + nKeyLength, ht->persistent);
if (!p) {
  return FAILURE;
}
memcpy(p->arKey, arKey, nKeyLength);

插入過程圖

哈希算法

php中hash函數使用DJBX33A算法來實現。

對象:

php對象使用數據結構zend_object_value來存儲;

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved