本節包括幾個主題,這些主題不完全適合於本章從client1到clIEnt5 的開發中的任一小節的內容:
■ 在使用結果集元數據幫助驗證這些數據適合於計算之後,使用結果集數據計算結果。
■ 如何處理很難插入到查詢中的數據。
■ 如何處理圖形數據。
■ 如何獲得表結構的信息。
■ 常見的MySQL程序設計錯誤及如何避免。
6.8.1在結果集上執行計算
迄今為止,我們集中而主要地使用了結果集元數據來打印行數據,但很明顯,除打印之外,還有需要使用數據做其他事情的時候。例如,計算基於數據值的統計信息,應用元數據確保數據適合它們要滿足的需求。哪種類型的需求?對於啟動程序來說,可能要校驗一下正
要執行數字計算的列實際上是否包含著數字!
下面的列表顯示了一個簡單函數summary _ stats ( ) ,它獲取結果集和列索引,並產生列值的匯總統計。該函數還列出缺少數值的數量,它是通過檢查NULL 來檢測的。這些計算包括兩個數據所必須滿足的需求, summary_stats() 用結果集元數據來校驗:
■ 指定的列必須存在(也就是說,列索引必須在結果集列值的范圍內)。
■ 此列必須包括數字值。
如果這些條件不滿足,則summary_stats() 只打印出錯誤消息並返回。代碼如下:
請注意在mysql_fetch_row() 循環前面調用的mysql_ data _ seek( )。為獲得同樣的結果集,它允許多次調用summary _ stats()(假設要計算幾列的統計值的話)。每次調用summary _ stats( )都要“重新回到”到結果集的開始(這裡假設mysql_store_result() 創建結果集,如果用MySQL_use_result() 創建結果集就只能按順序處理行,而且只能處理一次)。summary_stats() 是個相對簡單的函數,但它給我們一個提示,就是如何編寫一個比較復雜的計算程序,如兩個列的最小二乘回歸或者標准統計,如t -檢驗。
6.8.2 對查詢中有疑問的數據進行編碼
包括引號、空值和反斜線的數據值,如果把它們插入到查詢中,在執行查詢時就會產生一些問題。下面的討論論述了這些難點,並介紹了解決的辦法。假設要建造一個SELECT 查詢,它基於由name 指向的空終結串的內容:
如果name 的值類似於“0’Malley, Brian”,這時進行的查詢就是非法的,因為引號在引用的字符串裡出現:
需要特別注意這個引號,以便使服務器不將它解釋為name 的結尾。一種方法是在字符串內使用雙引號,這就是ANSI SQL 約定。SQL 支持這個約定,也允許引號在反斜線後使用:
另一個有問題之處是查詢中任意二進制數據的使用,例如,在把圖形存儲到數據庫這樣的應用程序中會發生這種情況。因為二進制數值含有一些字符,把它放到查詢中是不安全的。為了解決這個問題,可使用mysql_ escape _ string( ),它可以對特殊字符進行編碼,使其在引用的字符串中可以使用。mysql_escape_string() 認為的特殊字符是指空字符、單引號、雙引號、反斜線、換行符、回車符和C ontrol - Z(最後一個在Windows 語言環境中出現)。什麼時候使用mysql_escape_string() 呢?最保險的回答是“始終”。然而,如果確信數據的形式並且知道它是正確的—可能因為預先執行了確認檢查—就不必編碼了。例如,如果處理電話號碼的字符串,它完全由數字和短線組成,那麼就不必調用MySQL_ escape _ string( )了,否則還是要調用。
mysql_escape_string() 對有問題的字符進行編碼是將它們轉換為以反斜線開頭的2個字符的序列。例如,空字符轉換為‘ 0’,這裡的0 是可打印的ASCII 碼0,而不是空。反斜線、單引號和雙引號分別轉換為‘ ’、‘’’和‘”’。調用MySQL_escape_string() 的過程如下:
mysql_escape_string() 對from_str 進行編碼,並把結果寫入to _ str中,還添加了空終結值,這樣很方便,因為可以利用像strcpy() 和strlen() 這樣的函數使用該結果串。from_str 指向包括將要編碼的字符串的char 緩沖區,這個字符串可能包含任何內容,其中包括二進制數據。to_str 指向一個存在的char 緩沖區,在這個緩沖區裡,可以寫入編碼的字符串;不要傳遞未初始化的指針或NULL 指針,希望由MySQL_escape_string() 分配空間。由to_str 指向的緩沖區的長度至少是(from_len*2)+1個字節(很可能from_str 中的每個字符都需要用2 個字符來編碼;額外的字節是空終結值)。
from_len 和to_len 都是unsigned int 值,from_len 表示from_str 中數據的長度;提供這個長度是非常必要的,因為from_str 可能包含空值字節,不能把它當作空終結串。從MySQL_escape_string() 返回的to_len 值是作為結果的編碼字符串的實際長度,沒有對空終結值進行計數。
當MySQL_escape_string() 返回時, to _ str中編碼的結果就可看作是空終結串,因為from_str 中的空值都被編碼為‘ 0’。
為了重新編寫構造SELECT 的代碼,使名稱的值即使包含引號也能工作,我們進行下面的操作:
6.8.3 圖像數據的處理
MySQL_escape_string() 的基本功能之一就是把圖像數據加載到一個表中。本節介紹如何進行這項工作(這個討論也適用於二進制數據的其他形式)。假設想從文件中讀取圖像,並將它們連同唯一的標識符存儲到表中。BLOB 類型對二進制數據來講是個很好的選擇,因此可以使用下面的表說明:
實際上,要想從文件中獲取圖像並放入images 表,利用下面的函數load_image() 可以實現,給出一個標識符號碼和一個指向包括這個圖像數據的打開文件的指針:
load_image() 不會分配非常大的查詢緩沖區( 10 0 K),因此它只能處理相對較小的圖形。
在實際的應用程序中,可以根據圖形文件的大小動態地分配緩沖區。處理從數據庫中恢復的圖形數據(或任何二進制數據)並不像開始把它放入時那樣問題重重,因為在變量MYSQL_ROW 中數據值的原始形式是有效的,通過調用MySQL_ fetch _length ( ),這個長度也是有效的。必須將值看作是計數串,而不是空終結串。
6.8.4 獲取表信息
MySQL允許使用下面的查詢獲取有關表結構的信息(下面兩者是等價的):
與SELECT 相類似,兩個語句都返回結果集。為了在表中找出有關列,所需做的就是處理結果集中的行,從中獲取有用的信息。例如,如果從MySQL客戶機上發布DESCRIBE images 語句,就會返回這樣的信息:
如果從自己的客戶機上執行同樣的查詢,可以得到相同的信息(沒有邊框)。如果只想要單個列的信息,則使用如下這個查詢:
SHOW FIELDS FROM tbl _ name LIKE “col _ name”
此查詢會返回相同的列,但只是一行(如果列不存在就不返回行)。
6.8.5 需要避免的客戶機程序設計錯誤
本節討論一些常見的MySQLC API 程序設計錯誤,以及如何避免其發生(這些問題在MySQL郵件清單中會周期性地突然出現)。
1. 錯誤1——使用未初始化的連接處理程序指針在本章的樣例中,我們已經通過傳遞NULL 參數調用了mysql_ i n i t ( ),這就是讓它分配並且初始化MYSQL 結構,然後返回一個指針。另外一種方法是將指針傳遞到一個已有的MYSQL 結構中。在這種情況下, mysql_init() 會將結構初始化並返回一個指針,而不必自己分配結構。如果要使用第二種方法,則要小心會出現一些微妙的問題。下面的討論指出了需要注意的一些問題。如果將一個指針傳遞給MySQL_ init( ),它應該實際指向某些東西。看下面的代碼段:
這個問題是,mysql_init() 得到了一個指針,但指針沒有指向所知的任何地方。conn 是一個局部變量,因此在main() 開始執行時它是一個能指向任何地方的未初始化的存儲器,這就是說MySQL_init() 將使用指針,並可在內存的一些任意區域濫寫。如果幸運的話, conn 將指向您的程序地址空間的外部,這樣,系統將立即終止,使您能盡早意識到代碼中出現的問題。
如果不幸的話, conn 將指向程序中以後才使用的一些數據的內部,直到再次使用那個數據時才發現問題。因此實際出現問題的地方遠比執行程序時出現的問題多,也更難捕捉到。下面是一段有問題的代碼:
此時, conn 是一個全局變量,因此在程序啟動前,將它初始化為0(就是NULL)。mysql_init() 遇到NULL 參數,因此初始化並分配一個新的連接處理程序。只要將conn 傳遞給需要非NULL 連接處理程序的MySQLCAPI 函數,系統就會崩潰。這些代碼段的修改就是確保conn 有一個可知的值。例如,可以將它初始化到已經分配的MySQL 結構地址中去:
然而,推薦的(較容易的!)解決方案僅僅是將NULL 顯式地傳遞給mysql_ init( ),讓該函數分配MySQL 結構,並將返回值賦值給conn:
無論如何不要忘記檢驗MySQL_init() 的返回值,以確保它不是NULL。
2. 錯誤2——有效結果集檢驗的失敗
請記住檢查希望得到的結果集的調用狀態。下面的代碼沒有做到這一點:
不幸地是,如果MySQL_store_result() 失敗,res_set 為NULL,while 循環也不執行了,應測試返回結果集函數的返回值,以確保實際上在進行工作。
3. 錯誤3—— NULL 列值引起的失敗
不要忘記檢查mysql_fetch_row() 返回的數組MySQL_ROW 中列值是否為NULL 指針。如果row[i] 為NULL,則在一些機器上,下面的代碼就會引起崩潰:
該錯誤危害最大的部分是,有些printf() 的版本很寬容地對NULL指針輸出了“( null )”,這就使錯誤很容易逃脫而沒有把錯誤定位。如果把程序給了朋友,而他只有不太寬容printf( )版本,程序就會崩潰,您的朋友會認為您是個無用的程序員。循環應該寫成下面這樣:
不需要檢查列值是否為NULL 的惟一一次是當已經從列信息結構確定IS _ NOT _ NULL( )為真時。
4. 錯誤4——傳遞無意義的結果緩沖區
需要您提供緩沖區的客戶機庫函數通常要使這些緩沖區真正存在,下面的代碼違反了這個規則:
問題是什麼呢?to_str 必須指向一個存在的緩沖區,而在這個樣例中沒有,因此,它指向了隨意的位置。不要向MySQL_escape_string 傳遞無意義的指針作為to_str 參數,否則它會恣意踐踏內存。