在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數,例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
SELECT SUM(population) FROM bbc 這裡的SUM作用在所有返回記錄的population字段上,結果就是該查詢只返回一個結果,即所有國家的總人口數。
通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬於一組的數據起作用。當你指定 GROUP BY region 時, 屬於同一個region(地區)的一組數據將只能返回一行值.也就是說,表中所有除region(地區)外的字段,只能通過 SUM, COUNT等聚合函數運算後返回一個值.
HAVING子句可以讓我們篩選成組後的各組數據. WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前.而 HAVING子句在聚合後對組記錄進行篩選。
讓我們還是通過具體的實例來理解GROUP BY 和 HAVING 子句,還采用第三節介紹的bbc表。
SQL實例:
一、顯示每個地區的總人口數和總面積.
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用聚合函數對每組中的不同字段(一或多條記錄)作運算。
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area) > 1000000
在這裡,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。相反,HAVING子句可以讓我們篩選成組後的各組數據.