天天看點

一篇關于session會話寫的很好的文章

雖然session機制在web應用程式中被采用已經很長時間了,但是仍然有很多人不清楚session機制的本質,以至不能正确的應用這一技術。本文将詳細讨論session的工作機制并且對在Java web application中應用session機制時常見的問題作出解答。

    一、術語session 

    在我的經驗裡,session這個詞被濫用的程度大概僅次于transaction,更加有趣的是transaction與session在某些語境下的含義是相同的。 

    session,中文經常翻譯為會話,其本來的含義是指有始有終的一系列動作/消息,比如打電話時從拿起電話撥号到挂斷電話這中間的一系列過程可以稱之為一個session。有時候我們可以看到這樣的話“在一個浏覽器會話期間,...”,這裡的會話一詞用的就是其本義,是指從一個浏覽器視窗打開到關閉這個期間①。最混亂的是“使用者(用戶端)在一次會話期間”這樣一句話,它可能指使用者的一系列動作(一般情況下是同某個具體目的相關的一系列動作,比如從登入到選購商品到結賬登出這樣一個網上購物的過程,有時候也被稱為一個transaction),然而有時候也可能僅僅是指一次連接配接,也有可能是指含義①,其中的差别隻能靠上下文來推斷②。 

    然而當session一詞與網絡協定相關聯時,它又往往隐含了“面向連接配接”和/或“保持狀态”這樣兩個含義,“面向連接配接”指的是在通信雙方在通信之前要先建立一個通信的管道,比如打電話,直到對方接了電話通信才能開始,與此相對的是寫信,在你把信發出去的時候你并不能确認對方的位址是否正确,通信管道不一定能建立,但對發信人來說,通信已經開始了。“保持狀态”則是指通信的一方能夠把一系列的消息關聯起來,使得消息之間可以互相依賴,比如一個服務員能夠認出再次光臨的老顧客并且記得上次這個顧客還欠店裡一塊錢。這一類的例子有“一個TCP session”或者“一個POP3 session”③。 

    而到了web伺服器蓬勃發展的時代,session在web開發語境下的語義又有了新的擴充,它的含義是指一類用來在用戶端與伺服器之間保持狀态的解決方案④。有時候session也用來指這種解決方案的存儲結構,如“把xxx儲存在session裡”⑤。由于各種用于web開發的語言在一定程度上都提供了對這種解決方案的支援,是以在某種特定語言的語境下,session也被用來指代該語言的解決方案,比如經常把Java裡提供的javax.servlet.http.HttpSession簡稱為session⑥。 

    鑒于這種混亂已不可改變,本文中session一詞的運用也會根據上下文有不同的含義,請大家注意分辨。 

在本文中,使用中文“浏覽器會話期間”來表達含義①,使用“session機制”來表達含義④,使用“session”表達含義⑤,使用具體的“HttpSession”來表達含義⑥ 

    二、HTTP協定與狀态保持 

    HTTP協定本身是無狀态的,這與HTTP協定本來的目的是相符的,用戶端隻需要簡單的向伺服器請求下載下傳某些檔案,無論是用戶端還是伺服器都沒有必要紀錄彼此過去的行為,每一次請求之間都是獨立的,好比一個顧客和一個自動售貨機或者一個普通的(非會員制)大賣場之間的關系一樣。 

    然而聰明(或者貪心?)的人們很快發現如果能夠提供一些按需生成的動态資訊會使web變得更加有用,就像給有線電視加上點播功能一樣。這種需求一方面迫使HTML逐漸添加了表單、腳本、DOM等用戶端行為,另一方面在伺服器端則出現了CGI規範以響應用戶端的動态請求,作為傳輸載體的HTTP協定也添加了檔案上載、cookie這些特性。其中cookie的作用就是為了解決HTTP協定無狀态的缺陷所作出的努力。至于後來出現的session機制則是又一種在用戶端與伺服器之間保持狀态的解決方案。 

    讓我們用幾個例子來描述一下cookie和session機制之間的差別與聯系。筆者曾經常去的一家咖啡店有喝5杯咖啡免費贈一杯咖啡的優惠,然而一次性消費5杯咖啡的機會微乎其微,這時就需要某種方式來紀錄某位顧客的消費數量。想象一下其實也無外乎下面的幾種方案: 

    1、該店的店員很厲害,能記住每位顧客的消費數量,隻要顧客一走進咖啡店,店員就知道該怎麼對待了。這種做法就是協定本身支援狀态。 

    2、發給顧客一張卡片,上面記錄着消費的數量,一般還有個有效期限。每次消費時,如果顧客出示這張卡片,則此次消費就會與以前或以後的消費相聯系起來。這種做法就是在用戶端保持狀态。 

    3、發給顧客一張會員卡,除了卡号之外什麼資訊也不紀錄,每次消費時,如果顧客出示該卡片,則店員在店裡的紀錄本上找到這個卡号對應的紀錄添加一些消費資訊。這種做法就是在伺服器端保持狀态。 

    由于HTTP協定是無狀态的,而出于種種考慮也不希望使之成為有狀态的,是以,後面兩種方案就成為現實的選擇。具體來說cookie機制采用的是在用戶端保持狀态的方案,而session機制采用的是在伺服器端保持狀态的方案。同時我們也看到,由于采用伺服器端保持狀态的方案在用戶端也需要儲存一個辨別,是以session機制可能需要借助于cookie機制來達到儲存辨別的目的,但實際上它還有其他選擇。 

    三、了解cookie機制 

    cookie機制的基本原理就如上面的例子一樣簡單,但是還有幾個問題需要解決:“會員卡”如何分發;“會員卡”的内容;以及客戶如何使用“會員卡”。 

    正統的cookie分發是通過擴充HTTP協定來實作的,伺服器通過在HTTP的響應頭中加上一行特殊的訓示以提示浏覽器按照訓示生成相應的cookie。然而純粹的用戶端腳本如JavaScript或者VBScript也可以生成cookie。 

    而cookie的使用是由浏覽器按照一定的原則在背景自動發送給伺服器的。浏覽器檢查所有存儲的cookie,如果某個cookie所聲明的作用範圍大于等于将要請求的資源所在的位置,則把該cookie附在請求資源的HTTP請求頭上發送給伺服器。意思是麥當勞的會員卡隻能在麥當勞的店裡出示,如果某家分店還發行了自己的會員卡,那麼進這家店的時候除了要出示麥當勞的會員卡,還要出示這家店的會員卡。 

    cookie的内容主要包括:名字,值,過期時間,路徑和域。 

    其中域可以指定某一個域比如.google.com,相當于總店招牌,比如寶潔公司,也可以指定一個域下的具體某台機器比如www.google.com或者froogle.google.com,可以用飄柔來做比。 

    路徑就是跟在域名後面的URL路徑,比如/或者/foo等等,可以用某飄柔專櫃做比。路徑與域合在一起就構成了cookie的作用範圍。如果不設定過期時間,則表示這個cookie的生命期為浏覽器會話期間,隻要關閉浏覽器視窗,cookie就消失了。這種生命期為浏覽器會話期的cookie被稱為會話cookie。會話cookie一般不存儲在硬碟上而是儲存在記憶體裡,當然這種行為并不是規範規定的。如果設定了過期時間,浏覽器就會把cookie儲存到硬碟上,關閉後再次打開浏覽器,這些cookie仍然有效直到超過設定的過期時間。 

    存儲在硬碟上的cookie可以在不同的浏覽器程序間共享,比如兩個IE視窗。而對于儲存在記憶體裡的cookie,不同的浏覽器有不同的處理方式。對于IE,在一個打開的視窗上按Ctrl-N(或者從檔案菜單)打開的視窗可以與原視窗共享,而使用其他方式新開的IE程序則不能共享已經打開的視窗的記憶體cookie;對于Mozilla Firefox0.8,所有的程序和标簽頁都可以共享同樣的cookie。一般來說是用javascript的window.open打開的視窗會與原視窗共享記憶體cookie。浏覽器對于會話cookie的這種隻認cookie不認人的處理方式經常給采用session機制的web應用程式開發者造成很大的困擾。 

下面就是一個goolge設定cookie的響應頭的例子 

    HTTP/1.1 302 Found 

    Location: http://www.google.com/intl/zh-CN/ 

    Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:S=KaeaCFPo49RiA_d8; 

    expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com 

    Content-Type: text/html 

一篇關于session會話寫的很好的文章

   這是使用HTTPLook這個HTTP Sniffer軟體來俘獲的HTTP通訊紀錄的一部分:

一篇關于session會話寫的很好的文章

   浏覽器在再次通路goolge的資源時自動向外發送cookie:

一篇關于session會話寫的很好的文章

  使用Firefox可以很容易的觀察現有的cookie的值,使用HTTPLook配合Firefox可以很容易的了解cookie的工作原理。

一篇關于session會話寫的很好的文章

    IE也可以設定在接受cookie前詢問:

 這是一個詢問接受cookie的對話框。

    四、了解session機制 

    session機制是一種伺服器端的機制,伺服器使用一種類似于散清單的結構(也可能就是使用散清單)來儲存資訊。 

    當程式需要為某個用戶端的請求建立一個session的時候,伺服器首先檢查這個用戶端的請求裡是否已包含了一個session辨別 - 稱為session id,如果已包含一個session id則說明以前已經為此用戶端建立過session,伺服器就按照session id把這個session檢索出來使用(如果檢索不到,可能會建立一個),如果用戶端請求不包含session id,則為此用戶端建立一個session并且生成一個與此session相關聯的session id,session id的值應該是一個既不會重複,又不容易被找到規律以仿造的字元串,這個session id将被在本次響應中傳回給用戶端儲存。 

    儲存這個session id的方式可以采用cookie,這樣在互動過程中浏覽器可以自動的按照規則把這個辨別發揮給伺服器。一般這個cookie的名字都是類似于SEEESIONID,而。比如weblogic對于web應用程式生成的cookie,JSESSIONID=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764,它的名字就是JSESSIONID。 

    由于cookie可以被人為的禁止,必須有其他機制以便在cookie被禁止時仍然能夠把session id傳遞回伺服器。經常被使用的一種技術叫做URL重寫,就是把session id直接附加在URL路徑的後面,附加方式也有兩種,一種是作為URL路徑的附加資訊,表現形式為http://...../xxx;jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 

另一種是作為查詢字元串附加在URL後面,表現形式為http://...../xxx?jsessionid=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 

這兩種方式對于使用者來說是沒有差別的,隻是伺服器在解析的時候處理的方式不同,采用第一種方式也有利于把session id的資訊和正常程式參數區分開來。 

為了在整個互動過程中始終保持狀态,就必須在每個用戶端可能請求的路徑後面都包含這個session id。 

    另一種技術叫做表單隐藏字段。就是伺服器會自動修改表單,添加一個隐藏字段,以便在表單送出時能夠把session id傳遞回伺服器。比如下面的表單: 

     <form name="testform" action="/xxx"> 

    <input type="text"> 

    </form> 

    在被傳遞給用戶端之前将被改寫成: 

    <form name="testform" action="/xxx"> 

    <input type="hidden" name="jsessionid" value="ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764"> 

    <input type="text"> 

    </form> 

    這種技術現在已較少應用,筆者接觸過的很古老的iPlanet6(SunONE應用伺服器的前身)就使用了這種技術。 

實際上這種技術可以簡單的用對action應用URL重寫來代替。 

    在談論session機制的時候,常常聽到這樣一種誤解“隻要關閉浏覽器,session就消失了”。其實可以想象一下會員卡的例子,除非顧客主動對店家提出銷卡,否則店家絕對不會輕易删除顧客的資料。對session來說也是一樣的,除非程式通知伺服器删除一個session,否則伺服器會一直保留,程式一般都是在使用者做log off的時候發個指令去删除session。然而浏覽器從來不會主動在關閉之前通知伺服器它将要關閉,是以伺服器根本不會有機會知道浏覽器已經關閉,之是以會有這種錯覺,是大部分session機制都使用會話cookie來儲存session id,而關閉浏覽器後這個session id就消失了,再次連接配接伺服器時也就無法找到原來的session。如果伺服器設定的cookie被儲存到硬碟上,或者使用某種手段改寫浏覽器發出的HTTP請求頭,把原來的session id發送給伺服器,則再次打開浏覽器仍然能夠找到原來的session。 

    恰恰是由于關閉浏覽器不會導緻session被删除,迫使伺服器為seesion設定了一個失效時間,當距離用戶端上一次使用session的時間超過這個失效時間時,伺服器就可以認為用戶端已經停止了活動,才會把session删除以節省存儲空間。 

    五、了解javax.servlet.http.HttpSession 

    HttpSession是Java平台對session機制的實作規範,因為它僅僅是個接口,具體到每個web應用伺服器的提供商,除了對規範支援之外,仍然會有一些規範裡沒有規定的細微差異。這裡我們以BEA的Weblogic Server8.1作為例子來示範。 

    首先,Weblogic Server提供了一系列的參數來控制它的HttpSession的實作,包括使用cookie的開關選項,使用URL重寫的開關選項,session持久化的設定,session失效時間的設定,以及針對cookie的各種設定,比如設定cookie的名字、路徑、域,cookie的生存時間等。 

    一般情況下,session都是存儲在記憶體裡,當伺服器程序被停止或者重新開機的時候,記憶體裡的session也會被清空,如果設定了session的持久化特性,伺服器就會把session儲存到硬碟上,當伺服器程序重新啟動或這些資訊将能夠被再次使用,Weblogic Server支援的持久性方式包括檔案、資料庫、用戶端cookie儲存和複制。 

    複制嚴格說來不算持久化儲存,因為session實際上還是儲存在記憶體裡,不過同樣的資訊被複制到各個cluster内的伺服器程序中,這樣即使某個伺服器程序停止工作也仍然可以從其他程序中取得session。 

    cookie生存時間的設定則會影響浏覽器生成的cookie是否是一個會話cookie。預設是使用會話cookie。有興趣的可以用它來試驗我們在第四節裡提到的那個誤解。 

    cookie的路徑對于web應用程式來說是一個非常重要的選項,Weblogic Server對這個選項的預設處理方式使得它與其他伺服器有明顯的差別。後面我們會專題讨論。 

    關于session的設定參考[5] http://e-docs.bea.com/wls/docs70/webapp/weblogic_xml.html#1036869 

六、HttpSession常見問題(在本小節中session的含義為⑤和⑥的混合) 

    1、session在何時被建立 

    一個常見的誤解是以為session在有用戶端通路時就被建立,然而事實是直到某server端程式調用HttpServletRequest.getSession(true)這樣的語句時才被建立,注意如果JSP沒有顯示的使用 <%@page session="false"%> 關閉session,則JSP檔案在編譯成Servlet時将會自動加上這樣一條語句HttpSession session = HttpServletRequest.getSession(true);這也是JSP中隐含的session對象的來曆。 

    由于session會消耗記憶體資源,是以,如果不打算使用session,應該在所有的JSP中關閉它。 

    2、session何時被删除 

    綜合前面的讨論,session在下列情況下被删除a.程式調用HttpSession.invalidate();或b.距離上一次收到用戶端發送的session id時間間隔超過了session的逾時設定;或c.伺服器程序被停止(非持久session) 

    3、如何做到在浏覽器關閉時删除session 

    嚴格的講,做不到這一點。可以做一點努力的辦法是在所有的用戶端頁面裡使用javascript代碼window.oncolose來監視浏覽器的關閉動作,然後向伺服器發送一個請求來删除session。但是對于浏覽器崩潰或者強行殺死程序這些非正常手段仍然無能為力。 

    4、有個HttpSessionListener是怎麼回事 

    你可以建立這樣的listener去監控session的建立和銷毀事件,使得在發生這樣的事件時你可以做一些相應的工作。注意是session的建立和銷毀動作觸發listener,而不是相反。類似的與HttpSession有關的listener還有HttpSessionBindingListener,HttpSessionActivationListener和HttpSessionAttributeListener。 

    5、存放在session中的對象必須是可序列化的嗎 

    不是必需的。要求對象可序列化隻是為了session能夠在叢集中被複制或者能夠持久儲存或者在必要時server能夠暫時把session交換出記憶體。在Weblogic Server的session中放置一個不可序列化的對象在控制台上會收到一個警告。我所用過的某個iPlanet版本如果session中有不可序列化的對象,在session銷毀時會有一個Exception,很奇怪。 

    6、如何才能正确的應付用戶端禁止cookie的可能性 

    對所有的URL使用URL重寫,包括超連結,form的action,和重定向的URL,具體做法參見[6] 

http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770 

    7、開兩個浏覽器視窗通路應用程式會使用同一個session還是不同的session 

    參見第三小節對cookie的讨論,對session來說是隻認id不認人,是以不同的浏覽器,不同的視窗打開方式以及不同的cookie存儲方式都會對這個問題的答案有影響。 

    8、如何防止使用者打開兩個浏覽器視窗操作導緻的session混亂 

    這個問題與防止表單多次送出是類似的,可以通過設定用戶端的令牌來解決。就是在伺服器每次生成一個不同的id傳回給用戶端,同時儲存在session裡,用戶端送出表單時必須把這個id也傳回伺服器,程式首先比較傳回的id與儲存在session裡的值是否一緻,如果不一緻則說明本次操作已經被送出過了。可以參看《J2EE核心模式》關于表示層模式的部分。需要注意的是對于使用javascript window.open打開的視窗,一般不設定這個id,或者使用單獨的id,以防主視窗無法操作,建議不要再window.open打開的視窗裡做修改操作,這樣就可以不用設定。 

    9、為什麼在Weblogic Server中改變session的值後要重新調用一次session.setValue 

    做這個動作主要是為了在叢集環境中提示Weblogic Server session中的值發生了改變,需要向其他伺服器程序複制新的session值。 

    10、為什麼session不見了 

    排除session正常失效的因素之外,伺服器本身的可能性應該是微乎其微的,雖然筆者在iPlanet6SP1加若幹更新檔的Solaris版本上倒也遇到過;浏覽器插件的可能性次之,筆者也遇到過3721插件造成的問題;理論上防火牆或者代理伺服器在cookie處理上也有可能會出現問題。 

出現這一問題的大部分原因都是程式的錯誤,最常見的就是在一個應用程式中去通路另外一個應用程式。我們在下一節讨論這個問題。 

    七、跨應用程式的session共享 

    常常有這樣的情況,一個大項目被分割成若幹小項目開發,為了能夠互不幹擾,要求每個小項目作為一個單獨的web應用程式開發,可是到了最後突然發現某幾個小項目之間需要共享一些資訊,或者想使用session來實作SSO(single sign on),在session中儲存login的使用者資訊,最自然的要求是應用程式間能夠通路彼此的session。 

    然而按照Servlet規範,session的作用範圍應該僅僅限于目前應用程式下,不同的應用程式之間是不能夠互相通路對方的session的。各個應用伺服器從實際效果上都遵守了這一規範,但是實作的細節卻可能各有不同,是以解決跨應用程式session共享的方法也各不相同。 

    首先來看一下Tomcat是如何實作web應用程式之間session的隔離的,從Tomcat設定的cookie路徑來看,它對不同的應用程式設定的cookie路徑是不同的,這樣不同的應用程式所用的session id是不同的,是以即使在同一個浏覽器視窗裡通路不同的應用程式,發送給伺服器的session id也可以是不同的。

一篇關于session會話寫的很好的文章
一篇關于session會話寫的很好的文章

  根據這個特性,我們可以推測Tomcat中session的記憶體結構大緻如下。

一篇關于session會話寫的很好的文章

 筆者以前用過的iPlanet也采用的是同樣的方式,估計SunONE與iPlanet之間不會有太大的差别。對于這種方式的伺服器,解決的思路很簡單,實際實行起來也不難。要麼讓所有的應用程式共享一個session id,要麼讓應用程式能夠獲得其他應用程式的session id。 

    iPlanet中有一種很簡單的方法來實作共享一個session id,那就是把各個應用程式的cookie路徑都設為/(實際上應該是/NASApp,對于應用程式來講它的作用相當于根)。 

    <session-info> 

    <path>/NASApp</path> 

    </session-info> 

    需要注意的是,操作共享的session應該遵循一些程式設計約定,比如在session attribute名字的前面加上應用程式的字首,使得setAttribute("name", "neo")變成setAttribute("app1.name", "neo"),以防止命名空間沖突,導緻互相覆寫。 

    在Tomcat中則沒有這麼友善的選擇。在Tomcat版本3上,我們還可以有一些手段來共享session。對于版本4以上的Tomcat,目前筆者尚未發現簡單的辦法。隻能借助于第三方的力量,比如使用檔案、資料庫、JMS或者用戶端cookie,URL參數或者隐藏字段等手段。 

    我們再看一下Weblogic Server是如何處理session的。

一篇關于session會話寫的很好的文章
一篇關于session會話寫的很好的文章

  從截屏畫面上可以看到Weblogic Server對所有的應用程式設定的cookie的路徑都是/,這是不是意味着在Weblogic Server中預設的就可以共享session了呢?然而一個小實驗即可證明即使不同的應用程式使用的是同一個session,各個應用程式仍然隻能通路自己所設定的那些屬性。這說明Weblogic Server中的session的記憶體結構可能如下:

一篇關于session會話寫的很好的文章

   對于這樣一種結構,在session機制本身上來解決session共享的問題應該是不可能的了。除了借助于第三方的力量,比如使用檔案、資料庫、JMS或者用戶端cookie,URL參數或者隐藏字段等手段,還有一種較為友善的做法,就是把一個應用程式的session放到ServletContext中,這樣另外一個應用程式就可以從ServletContext中取得前一個應用程式的引用。示例代碼如下, 

    應用程式A :

    context.setAttribute("appA", session); 

    應用程式B :

    contextA = context.getContext("/appA"); 

    HttpSession sessionA = (HttpSession)contextA.getAttribute("appA"); 

    值得注意的是這種用法不可移植,因為根據ServletContext的JavaDoc,應用伺服器可以處于安全的原因對于context.getContext("/appA");傳回空值,以上做法在Weblogic Server 8.1中通過。 

    那麼Weblogic Server為什麼要把所有的應用程式的cookie路徑都設為/呢?原來是為了SSO,凡是共享這個session的應用程式都可以共享認證的資訊。一個簡單的實驗就可以證明這一點,修改首先登入的那個應用程式的描述符weblogic.xml,把cookie路徑修改為/appA通路另外一個應用程式會重新要求登入,即使是反過來,先通路cookie路徑為/的應用程式,再通路修改過路徑的這個,雖然不再提示登入,但是登入的使用者資訊也會丢失。注意做這個實驗時認證方式應該使用FORM,因為浏覽器和web伺服器對basic認證方式有其他的處理方式,第二次請求的認證不是通過session來實作的。具體請參看[7] secion 14.8 Authorization,你可以修改所附的示例程式來做這些試驗。 

    八、總結 

    session機制本身并不複雜,然而其實作和配置上的靈活性卻使得具體情況複雜多變。這也要求我們不能把僅僅某一次的經驗或者某一個浏覽器,伺服器的經驗當作普遍适用的經驗,而是始終需要具體情況具體分析。 

繼續閱讀