天天看點

mysql 硬解析 軟解析_ORACLE sql語句的硬解析與軟解析(收藏)

我們都知道在Oracle中每條SQL語句在執行之前都需要經過解析,這裡面又分為軟解析和硬解析。那麼這兩種解析有何不同之處呢?它們又分别是如何進行解析呢?Oracle内部解析的步驟又是如何進行的呢?下面我們就這些話題進行共同探讨。

在Oracle中存在兩種類型的SQL語句,一類為DDL語句,他們是從來不會共享使用的,也就是每次執行都需要進行硬解析。還有一類就是DML語句,他們會根據情況選擇要麼進行硬解析,要麼進行軟解析。在Oracle

8i

OCP教材的023中1-12有說明SQL語句的解析步驟,當一條SQL語句從用戶端程序傳遞到伺服器端程序後,需要執行如下步驟:

在共享池中搜尋 SQL 語句的現有副本

驗證 SQL 語句的文法是否準确

執行資料字典查找來驗證表和列的定義

擷取對象的分析鎖以便在語句的分析過程中對象的定義不會改變

檢查使用者通路引用方案對象的權限

确定語句的最佳執行計劃

将語句和執行計劃載入共享的 SQL 區

這個先入為主的概念一直占據着我的腦海,我認為硬解析就是上面幾個步驟。相對于硬解析,軟解析的步驟就是上面第一步找到現有SQL語句的副本後,隻需要驗證使用者是否有權限執行就是了,這樣省略上面好幾個步驟,相對硬解析來說性能開銷就非常小了。即使是在論壇上和大家讨論時,我也一直堅持這個看法。直到前一天看了Tom的《Effective

Oracle By

Design》中關于語句處理的章節後,我才知道這個自己一直堅持的觀點事實上是錯誤的。

事實上,在Oracle中SQL語句的解析步驟如下:

1、 文法檢測。判斷一條SQL語句的文法是否符合SQL的規範,比如執行:SQL> selet *

from

emp;我們就可以看出由于Select關鍵字少了一個“c”,這條語句就無法通過文法檢驗的步驟了。

2、

語義檢查。文法正确的SQL語句在解析的第二個步驟就是判斷該SQL語句所通路的表及列是否準确?使用者是否有權限通路或更改相應的表或列?比如如下語句:

SQL> select * from emp;

select * from emp

*

ERROR at line 1:

ORA-00942: table or view does not exist

由于查詢使用者沒有可供通路的emp對象,是以該SQL語句無法通過語義檢查。

3、

檢查共享池中是否有相同的語句存在。假如執行的SQL語句已經在共享池中存在同樣的副本,那麼該SQL語句将會被軟解析,也就是可以重用已解析過的語句的執行計劃和優化方案,可以忽略語句解析過程中最耗費資源的步驟,這也是我們為什麼一直強調避免硬解析的原因。這個步驟又可以分為兩個步驟:

(1)驗證SQL語句是否完全一緻。在這個步驟中,Oracle将會對傳遞進來的SQL語句使用HASH函數運算得出HASH值,再與共享池中現有語句的HASH值進行比較看是否一一對應。現有資料庫中SQL語句的HASH值我們可以通過通路v$sql、v$sqlarea、v$sqltext等資料字典中的HASH_VALUE列查詢得出。如果SQL語句的HASH值一緻,那麼ORACLE事實上還需要對SQL語句的語義進行再次檢測,以決定是否一緻。那麼為什麼Oracle需要再次對語句文本進行檢測呢?不是SQL語句的HASH值已經對應上了?事實上就算是SQL語句的HASH值已經對應上了,并不能說明這兩條SQL語句就已經可以共享了。我們首先參考如下一個例子:假如使用者A有自己的一張表EMP,他要執行查詢語句:select

* from emp;使用者B也有一張EMP表,同樣要查詢select * from

emp;這樣他們兩條語句在文本上是一模一樣的,他們的HASH值也會一樣,但是由于涉及到查詢的相關表不一樣,他們事實上是無法共享的。假如這時候使用者C又要查詢同樣一條語句,他查詢的表為scott下的公有同義詞,還有就是SCOTT也查詢同樣一張自己的表emp,情況會是如何呢?

SQL> connect a/a

Connected.

SQL> create table emp ( x int );

Table created.

SQL> select * from emp;

no rows selected

SQL> connect b/b

Connected.

SQL> create table emp ( x int );

Table created.

SQL> select * from emp;

no rows selected

SQL> conn scott/tiger

Connected.

SQL> select * from emp;

SQL> conn c/c

Connected.

SQL> select * from emp;

SQL> conn/as sysdba

Connected.

SQL> select address,hash_value, executions,

sql_text

from v$sql

where upper(sql_text) like 'SELECT * FROM EMP%'

/

ADDRESS HASH_VALUE EXECUTIONS SQL_TEXT

-------- ---------- ----------

------------------------

78B89E9C 3011704998 1 select * from emp

78B89E9C 3011704998 1 select * from emp

78B89E9C 3011704998 2 select * from emp

我們可以看到這四個查詢的語句文本和HASH值都是一樣的,但是由于查詢的對象不同,隻有後面兩個語句是可以共享的,不同情況的語句還是需要硬解析的。是以在檢查共享池共同SQL語句的時候,是需要根據具體情況而定的。

我們可以進一步查詢v$sql_shared_cursor以得知SQL為何不能共享的原因:

SQL> select kglhdpar, address,

auth_check_mismatch, translation_mismatch

from v$sql_shared_cursor

where kglhdpar in

( select address

from v$sql

where upper(sql_text) like 'SELECT * FROM EMP%' )

/

KGLHDPAR ADDRESS A T

-------- -------- - -

78B89E9C 786C9D78 N N

78B89E9C 786AC810 Y Y

78B89E9C 786A11A4 Y Y

TRANSLATION_MISMATCH表示SQL遊标涉及到的資料對象是不同的;AUTH_CHECK_MISMATCH表示對同樣一條SQL語句轉換是不比對的。

(2、)驗證SQL語句執行環境是否相同。比如同樣一條SQL語句,一個查詢會話加了的HINT,另外一個使用者加的HINT,他們就會産生不同的執行計劃,盡管他們是查詢同樣的資料。我們下面就一個執行個體來說明SQL執行環境對解析的影響,我們通過将會話的workarea_size_policy變更來檢視對同樣一條SQL語句執行的影響:

SQL> alter system flush

shared_pool;

System altered.

SQL> show parameter

workarea_size_policy

NAME TYPE VALUE

------------------------------------ -----------

--------------

workarea_size_policy string AUTO

SQL> select count(*) from t;

COUNT(*)

----------

5736

SQL> alter session set

workarea_size_policy=manual;

Session altered.

SQL> select count(*) from t;

COUNT(*)

----------

5736

SQL> select sql_text, child_number, hash_value,

address

2 from v$sql

3 where upper(sql_text) = 'SELECT COUNT(*) FROM T'

4 /

SQL_TEXT CHILD_NUMBER HASH_VALUE ADDRESS

------------------------------ ------------ ----------

--------

select count(*) from t 0 2199322426 78717328

select count(*) from t 1 2199322426 78717328

可以看到由于不同會話workarea_size_policy設定得不同,即使是同樣一條SQL語句還是無法共享的。通過進一步查詢v$sql_shared_cursor我們可以發現兩個會話的優化器環境是不同的:

SQL> select optimizer_mismatch

from v$sql_shared_cursor

where kglhdpar in

( select address

from v$sql

where upper(sql_text) = 'SELECT COUNT(*) FROM T'

);

O

-

N

Y

通過如上三個步驟檢查以後,如果SQL語句是一緻的,那麼就會重用原有SQL語句的執行計劃和優化方案,也就是我們通常所說的軟解析。如果SQL語句沒有找到同樣的副本,那麼就需要進行硬解析了。

4、

Oracle根據送出的SQL語句再查詢相應的資料對象是否有統計資訊。如果有統計資訊的話,那麼CBO将會使用這些統計資訊産生所有可能的執行計劃(可能多達成千上萬個)和相應的Cost,最終選擇Cost最低的那個執行計劃。如果查詢的資料對象無統計資訊,則按RBO的預設規則選擇相應的執行計劃。這個步驟也是解析中最耗費資源的,是以我們應該極力避免硬解析的産生。至此,解析的步驟已經全部完成,Oracle将會根據解析産生的執行計劃執行SQL語句和提取相應的資料。