Apache的Mod_rewrite學習(二)
今天學習重寫規則的文法。
RewriteRule
Syntax: RewriteRule Pattern Substitution [flags]
一條RewriteRule指令,定義一條重寫規則,規則間的順序非常重要。對Apache1.2及以後的版本,模闆(pattern)是一個POSIX正則式,用以比對目前的URL。目前的URL不一定是用記最初送出的URL,因為可能用一些規則在此規則前已經對URL進行了處理。
對mod_rewrite來說,!是個合法的模闆字首,表示“非”的意思,這對描述“不滿足某種比對條件”的情況非常友善,或用作最後一條預設規則。當使用!時,不能在模闆中有分組的通配符,也不能做後向引用。
當比對成功後,Substitution會被用來替換相應的比對,它除了可以是普通的字元串以外,還可以包括:
- $N,引用RewriteRule模闆中比對的相關字串,N表示序号,N=0..9
- %N,引用最後一個RewriteCond模闆中比對的資料,N表示序号
- %{VARNAME},伺服器變量
- ${mapname:key|default},映射函數調用
這些特殊内容的擴充,按上述順序進行。
一個URL的全部相關部分都會被Substitution替換,而且這個替換過程會一直持續到所有的規則都被執行完,除非明确地用L标志中斷處理過程。
當susbstitution有”-”字首時,表示不進行替換,隻做比對檢查。
利用RewriteRule,可定義含有請求串(Query String)的URL,此時隻需在Sustitution中加入一個?,表示此後的内容放入QUERY_STRING變量中。如果要清空一個QUERY_STRING變量,隻需要以?結束Substitution串即可。
如果給一個Substitution增加一個http://thishost[:port]的字首,則mod_rewrite會自動将此字首去掉。是以,利用http://thisthost做一個無條件的重定向到自己,将難以奏效。要實作這種效果,必須使用R标志。
Flags是可選參數,當有多個标志同時出現時,彼此間以逗号分隔。
-
'redirect|R [=code]' (強制重定向)
給目前的URI增加字首http://thishost[:thisport]/, 進而生成一個新的URL,強制生成一個外部重定向(external redirection,指生的URL發送到用戶端,由用戶端再次以新的URL送出請求,雖然新URL仍指向目前的伺服器). 如果沒有指定的code值,則HTTP應答以狀态值302 (MOVED TEMPORARILY),如果想使用300-400(不含400)間的其它值可以通過在code的位置以相應的數字指定,也可以用标志名指定: temp (預設值), permanent, seeother.
注意,當使用這個标志時,要确實substitution是個合法的URL,這個标志隻是在URL前增加http://thishost[:thisport]/字首而已,重寫操作會繼續進行。如果要立即将新URL重定向,用L标志來中重寫流程。
-
'forbidden|F' (強制禁止通路URL所指的資源)
立即傳回狀态值403 (FORBIDDEN)的應答包。将這個标志與合适的RewriteConds 聯合使用,可以阻斷通路某些URL。
-
'gone|G' (強制傳回URL所指資源為不存在(gone))
立即傳回狀态值410 (GONE)的應答包。用這個标志來标記URL所指的資源永久消失了.
-
# 'proxy|P' (強制将目前URL送往代理子產品(proxy module))
這個标志,強制将substitution當作一個發向代理子產品的請求,并立即将共送往代理子產品。是以,必須確定substitution串是一個合法的URI (如, 典型的情況是以http://hostname開頭),否則會從代理子產品得到一個錯誤. 這個标志,是ProxyPass指令的一個更強勁的實作,将遠端請求(remote stuff)映射到本地伺服器的名字空間(namespace)中來。
注意,使用這個功能必須確定代理子產品已經編譯到Apache 伺服器程式中了. 可以用“httpd -l ”指令,來檢查輸出中是否含有mod_proxy.c來确認一下。如果沒有,而又需要使用這個功能,則需要重新編譯``httpd''程式并使用mod_proxy有效。
-
'last|L' (最後一條規則)
中止重寫流程,不再對目前URL施加更多的重寫規則。這相當于perl的last指令或C的break指令。
-
'next|N' (下一輪)
重新從第一條重寫規則開始執行重寫過程,新開的過程中的URL不應當與最初的URL相同。 這相當于Perl的next指令或C的continue指令. 千萬小心不要産生死循環。
-
# 'chain|C' (将目前的規則與其後續規則綑綁(chained))
當規則比對時,處理過程與沒有綑綁一樣;如果規則不比對,則綑綁在一起的後續規則也不在檢查和執行。
-
'type|T=MIME-type' (強制MIME類型)
強制将目标檔案的MIME-type為某MIME類型。例如,這可用來模仿mod_alias子產品對某目錄的ScriptAlias指定,通過強制将該目錄下的所有檔案的類型改為 “application/x-httpd-cgi”.
-
'nosubreq|NS' (used only if no internal sub-request )
這個标志強制重寫引擎跳過為内部sub-request的重寫規則.例如,當mod_include試圖找到某一目錄下的預設檔案時 (index.xxx),sub-requests 會在Apache内部發生. Sub-requests并非總是有用的,在某些情況下如果整個規則集施加到它上面,會産生錯誤。利用這個标志可排除執行一些規則。
-
'nocase|NC' (模闆不區分大小寫)
這個标志會使得模闆比對目前URL時忽略大小寫的差别。
-
'qsappend|QSA' (追加請求串(query string))
這個标志,強制重寫引擎為Substitution的請求串追加一部分串,則不是替換掉原來的。借助這個标志,可以使用一個重寫規則給請求串增加更多的資料。
-
'noescape|NE' (不對輸出結果中的特殊字元進行轉義處理)
通常情況下,mod_write的輸出結果中,特殊字元(如'%', '$', ';', 等)會轉義為它們的16進制形式(如分别為'%25', '%24', and '%3B')。這個标志會禁止mod_rewrite對輸出結果進行此類操作。 這個标志隻能在 Apache 1.3.20及以後的版本中使用。
-
'passthrough|PT' (通過下一個處理器)
這個标志強制重寫引擎用filename字段的值來替換内部request_rec資料結構中uri字段的值。. 使用這個标志,可以使後續的其它URI-to-filename轉換器的Alias、ScriptAlias、Redirect等指令,也能正常處理RewriteRule指令的輸出結果。用一個小例子來說明它的語義:如果要用mod_rewrite的重寫引擎将/abc轉換為/def,然後用mod_alas将/def重寫為ghi,則要:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
如果PT标志被忽略,則mod_rewrite也能很好完成工作,如果., 将 uri=/abc/... 轉換為filename=/def/... ,完全符合一個URI-to-filename轉換器的動作。接下來 mod_alias 試圖做 URI-to-filename 轉換時就會出問題。
注意:如果要混合都含有URL-to-filename轉換器的不同的子產品的指令,必須用這個标志。最典型的例子是mod_alias和mod_rewrite的使用。
-
'skip|S=num' (跳過後面的num個規則)
目前規則比對時,強制重寫引擎跳過後續的num個規則。用這個可以來模仿if-then-else結構:then子句的最後一條rule的标志是skip=N,而N是else子句的規則條數。
-
'env|E=VAR:VAL' (設定環境變量)
設定名為VAR的環境變量的值為VAL,其中VAL中可以含有正則式的後向引用($N或%N)。這個标志可以使用多次,以設定多個環境變量。這兒設定的變量,可以在多種情況下被引用,如在XSSI或CGI中。另外,也可以在RewriteCond模闆中以%{ENV:VAR}的形式被引用。
注意:一定不要忘記,在伺服器範圍内的配置檔案中,模闆(pattern)用以比對整個URL;而在目錄範圍内的配置檔案中,目錄字首總是被自動去掉後再進行模闆比對的,且在替換完成後自動再加上這個字首。這個功能對很多種類的重寫是非常重要的,因為如果沒有去字首,則要進行父目錄的比對,而父目錄的資訊并不是總能得到的。一個例外是,當substitution中有http://打頭時,則不再自動增加字首了,如果P标志出現,則會強制轉向代理。
注意:如果要在某個目錄範圍内啟動重寫引擎,則需要在相應的目錄配置檔案中設定“RewriteEngine on”,且目錄的“Options FollowSymLinks”必須設定。如果管理者由于安全原因沒有打開FollowSymLinks,則不能使用重寫引擎