在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數,例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本差別就是它們一般作用在多條記錄上。
SELECT SUM(population) FROM bbc
這裡的SUM作用在所有傳回記錄的population字段上,結果就是該查詢隻傳回一個結果,即所有國家的總人口數。
通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬于一組的資料起作用。當你指定 GROUP BY region 時, 屬于同一個region(地區)的一組資料将隻能傳回一行值,也就是說,表中所有除region(地區)外的字段,隻能通過 SUM, COUNT等聚合函數運算後傳回一個值。
HAVING子句可以讓我們篩選成組後的各組資料,WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合後對組記錄進行篩選。
讓我們還是通過具體的執行個體來了解GROUP BY 和 HAVING 子句,還采用第三節介紹的bbc表。
SQL執行個體:
一、顯示每個地區的總人口數和總面積:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把傳回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用聚合函數對每組中的不同字段(一或多條記錄)作運算。
二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。
HAVING SUM(area)>1000000
在這裡,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。
相反,HAVING子句可以讓我們篩選成組後的各組資料.
*****************************
總體介紹如下:
個人覺得group by 與distinct 去除重複的值有相同的概念上的了解。
可以了解為group by 就是 distinct的一種形式,不過更加的功能多些。
1、sql語句select的執行過程
(1)根據where字句的條件表達式,從from子句指定的基本表或視圖中找到滿足條件的元組。
(2)再按select子句中的目标列的表達式,選出元組的屬性值形成結果表。
(3)如果有group子句,則将結果表按group中指定的列進行分組,該屬性列值相等的元組為一組,通常會在每組中作用集函數。
(4)如果group子句帶having短語,則隻有滿足having指定條件的組才輸出。
(5)如果有order子句,則将結果表按order子句指定的列升序或降序排序。
2、group by 子句的将查詢結果表按某一列或多列分組,值相等的為一組。對查詢結果分組的目的是為了細化集函數的作用對象。如果未對查詢結果分組,集函數将作用與整個查詢結果。
注意:如果沒有group by 子句,select 清單中不允許出現字段與分組函數混用的情況。出現在select清單中的字段,如果不是包含在分組函數中,那麼該字段必須同時出在Group by子句中。
eg:select deptno,count(*) from emp group by deptno;----前後的清單字段一緻
having子句允許使用者指定對一個記錄組的搜尋條件。而通常的where查詢條件隻針對單記錄,不針對記錄組。
eg:select deptno,count(*) from emp group by deptno having count(*)>3;
注意:group by 可以與where 來搭配使用,where 隻能在group by 的前面,group by後面不能使用where;where 子句不能包括分組函數,條件的表達隻能使用having表示。
本文轉自hcy's workbench部落格園部落格,原文連結:http://www.cnblogs.com/alterhu/archive/2012/03/07/2383685.html,如需轉載請自行聯系原作者。