對於大多數web應用來說,數據庫都是一個十分基礎性的部分。如果你在使用PHP,那麼你很可能也在使用MySQL—LAMP系列中舉足輕重的一份子。對於很多新手們來說,使用PHP可以在短短幾個小時之內輕松地寫出具有特定功能的代碼。但是,構建一個穩定可靠的數據庫卻需要花上一些時日和相關技能。下面列舉了我曾經犯過的最嚴重的11個MySQL相關的錯誤(有些同樣也反映在其他語言/數據庫的使用上)。
MySQL有很多數據庫引擎,但是你最可能碰到的就是MyISAM和InnoDB。
MySQL默認使用的是MyISAM。但是,很多情況下這都是一個很糟糕的選擇,除非你在創建一個非常簡單抑或實驗性的數據庫。外鍵約束或者事務處理對於數據完整性是非常重要的,但MyISAM都不支持這些。另外,當有一條記錄在插入或者更新時,整個數據表都被鎖定了,當使用量增加的時候這會產生非常差的運行效率。
結論很簡單:使用InnoDB。
PHP自產生之日就提供了MySQL庫函數(or near as makes no difference)。很多應用仍然在使用類似mysql_connect、mysql_query、mysql_fetch_assoc等的函數,盡管PHP手冊上說:如果你在使用MySQL v4.1.3或者更新版本,強烈推薦使用您使用mysqli擴展。
mysqli(MySQL的加強版擴展)有以下幾個優點:可選的面向對象接口,prepared表達式,這有利於阻止SQL注入攻擊,還能提高性能,支持更多的表達式和事務處理,另外,如果你想支持多種數據庫系統,你還可以考慮PDO。
這或者可以這樣說#1:永遠不要相信用戶的輸入。用服務器端的PHP驗證每個字符串,不要寄希望與JavaScript。最簡單的SQL注入攻擊會利用如下的代碼:
$username = $_POST["name"]; $password = $_POST["password"]; $sql = "SELECT userid FROM usertable WHERE username='$username' AND password='$password';"; // run query...
只要在username字段輸入"admin';--",這樣就會被黑到,相應的SQL語句如下:SELECT userid FROM usertable WHERE username='admin'; 狡猾的黑客可以以admin登錄,他們不需要知道密碼,因為密碼段被注釋掉了。
美國、英國和澳大利亞的我們很少考慮除英語之外的其他語言。我們很得意地完成了自己的"傑作"卻發現它們並不能在其他地方正常運行。UTF-8解決了很多國際化問題。雖然在PHP v6.0之前它還不能很好地被支持,但這並不影響你把MySQL字符集設為UTF-8。
如果你接觸MySQL不久,那麼你會偏向於使用你已經掌握的語言來解決問題,這樣會導致寫出一些冗余、低效率的代碼。比如,你不會使用MySQL自帶的AVG()函數,卻會先對記錄集中的值求和然後用PHP循環來計算平均值。
此外,請注意PHP循環中的SQL查詢。通常來說,執行一個查詢比在結果中迭代更有效率。所以,在分析數據的時候請利用數據庫系統的優勢,懂一些SQL的知識將大有裨益。
99%的PHP性能問題都是由數據庫引起的,僅僅一個糟糕的SQL查詢就能讓你的web應用徹底癱瘓。MySQL的EXPLAIN statement、Query Profiler,還有很多其他的工具將會幫助你找出這些萬惡的SELECT。
MySQL提供了諸如numeric、string和date等的數據類型。如果你想存儲一個時間,那麼使用DATE或者DATETIME類型。如果這個時候用INTEGER或者STRING類型的話,那麼將會使得SQL查詢非常復雜,前提是你能使用INTEGER或者STRING來定義那個類型。
很多人傾向於擅自自定義一些數據的格式,比如,使用string來存儲序列化的PHP對象。這樣的話數據庫管理起來可能會變得簡單些,但會使得MySQL成為一個糟糕的數據存儲而且之後很可能會引起故障。
永遠不要使用*來返回一個數據表所有列的數據。這是懶惰:你應該提取你需要的數據。就算你需要所有字段,你的數據表也不可避免的會產生變化。
一般性原則是這樣的:select語句中的任何一個where子句表示的字段都應該使用索引。
舉個例子,假設我們有一個user表,包括numeric ID(主鍵)和email address。登錄的時候,MySQL必須以一個email為依據查找正確的ID。如果使用了索引的話(這裡指email),那麼MySQL就能夠使用更快的搜索算法來定位email,甚至可以說是即時實現。否則,MySQL就只能順序地檢查每一條記錄直到找到正確的email address。
有的人會在每個字段上都添加索引,遺憾的是,執行了INSERT或者UPDATE之後這些索引都需要重新生成,這樣就會影響性能。所以,只在需要的時候添加索引。
雖然比較罕見,但是數據庫還是有崩潰的危險。硬盤有可能損壞,服務器有可能崩潰,web主機提供商有可能會破產!丟失MySQL數據將會是災難性的,所以請確保你已經使用了自動備份或者已經復制到位。
對於PHP開發人員來說,MySQL可能是使用最廣泛的數據庫系統,但並不是唯一的選擇。PostgreSQL和Firebird是最強有力的競爭者:這個兩者都是開源的,而且都沒有被公司收購。微軟提供了sql server Express,甲骨文提供了10g Express,這兩者都是企業級數據庫的免費版本。有時候,對於一個較小的web應用或者嵌入式應用,SQLite也不失為一個可行的替代方案。