在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數
例如: SUM(總數值), COUNT(計數), MAX(最大值), MIN(最小值),AVG(平均值)
這些函數和其它函數的根本差別就是它們一般作用在多條記錄上。
SELECT SUM(population) FROM "bbc"
這裡的SUM作用在所有傳回記錄的population字段上,結果就是該查詢隻傳回一個結果,即所有國家的總人口數.
通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬于一組的資料起作用。當你指定 GROUP BY region 時, 屬于同一個region(地區)的一組資料将隻能傳回一行值,也就是說,表中所有除region(地區)外的字段,隻能通過 SUM, COUNT等聚合函數運算後傳回一個值。
HAVING子句可以讓我們篩選成組後的各組資料,WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合後對組記錄進行篩選。
讓我們還是通過具體的執行個體來了解GROUP BY 和 HAVING 子句.
SQL執行個體:
一、顯示每個地區的總人口數和總面積:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把傳回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用聚合函數對每組中的不同字段(一或多條記錄)作運算。
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
SELECT region, SUM(population), SUM(area)
FROM "bbc"
GROUP BY region
HAVING SUM(area)>1000000
在這裡,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。
相反,HAVING子句可以讓我們篩選成組後的各組資料.