天天看點

httpd基礎

内容:

1、http協定概述

2、http協定特點

3、http的工作模式(過程)

4、http請求封包、響應封包格式、常見狀态碼解析

5、web資源概述(靜态資源、動态資源)

http協定工作在TCP/IP模型的應用層,其定義web服務間通信的約定通信方式,HTTP基于tcp傳送資料,預設是80端口(伺服器端)

    幾個名詞:

        http:hyper texttransfer protocol,超文本傳輸協定,超文本傳輸協定(HTTP)是一種通信協定,它允許将超文本标記語言(HTML)文檔從Web伺服器傳送到用戶端的浏覽器。目前我們使用的是HTTP/1.1 版本。

        超文本:超文本檔案是與其它資料有關聯(links)的資料。包含與其他文檔連結的文檔;選擇連結時自動顯示第二個文檔。超文本檔案的一個簡單例子是大百科全書。假設你正在讀“樹”這個條目,在文章的最末有一個參考這樣寫到,“相關資訊參見‘植物’”。這最末一行就是一個關聯,從“樹”到“植物”這個條目。

        當然這隻是一個簡單例子,全球網是基于一個遠遠複雜得多的超文本檔案。特别的是,在檔案的任何地方都可能有關聯,不僅是在末尾。舉一個想象的例子。假設你正在用全球網閱讀樹的超文本檔案,每次提到一種新的樹就有一個關聯,每個關聯都以某種方式辨別起來以顯得突出。例如,有關聯的字可能被加亮或者加了下劃線,或者标注了一個數字。如果跟着關聯走,你将轉到那種類型的樹的條目去。在主條目裡還有其它題目的關聯,如“雨林”或“木”。這些關聯又引出完整的條目。你或許還能找到與技術術語的關聯,如“落葉科”和“針葉樹”。如果沿着這些關聯就會找到其定義。在全球網的語言裡,一個超文本檔案的檔案就是由一些資料組成,而這些資料又可能與其它檔案相關聯。

        html:hyper text marklanguage,超文本标記語

          URL:uniform resourcelocation,統一資源定位符,主要用于描述伺服器某特定資源的位置,現在幾乎和URI相同

        URL由三部分組成:資源類型、存放資源的主機域名、資源檔案名。

        URL的一般文法格式為:

      例如:http://www.sina.com.cn/index.html

scheme://<user>[:password:]@<host>[:<port>]/path;params?query#frag

  SCHEME:指明協定的

   如果是預設的公認端口,可以省略,比如80,如果改變了端口,需要指明

params:參數;name=value&name=value 

      query(查詢)

        可選,用于給動态網頁(如使用CGI、ISAPI、PHP/JSP/ASP/ASP。NET等技術制作的網頁)傳遞參數,可有多個參數,用“&”符号隔開,每個參數的名和值用“=”符号隔開。

   fragment(資訊片斷)

        字元串,用于指定網絡資源中的片斷。例如一個網頁中有多個名詞解釋,可使用fragment直接定位到某一名詞解釋。

        (1)c/s架構模式,也就是用戶端/伺服器端模式,一個伺服器可以為許多客戶服務

        (2)簡單快速:客戶向伺服器請求服務時,隻需要傳送請求方法和路徑,請求方法常用的隻有GET、HEAD、POST等幾種(後面有說明),由于HTTP協定簡單,使得HTTP伺服器的程式規模小,因而通信速度很快

        (3)靈活:HTTP允許傳輸任意類型的資料對象,傳輸的類型由Context'-Type加以标記

        (4)無連接配接:無連接配接的含義是限制每次連接配接隻處理一個請求。伺服器處理完客戶的請求,并收到客戶的應答後,即斷開連接配接。采用這種方式可以節省傳輸時間。

解決辦法:引入keep-alive機制

    (5)無狀态:無狀态是指協定對于事務處理沒有記憶能力,伺服器不知道用戶端是什麼狀态。即我們給伺服器發送 HTTP 請求之後,伺服器根據請求,會給我們發送資料過來,但是,發送完,伺服器不會記錄任何,也就是說服務端不能判斷是否是來源同一個使用者

解決的方法:引入cookie(作用與用戶端)、session(作用于伺服器端),具體工作過程說明這裡不詳細闡述,有興趣的可以查閱相關資料。

           (6)安全可靠

        http工作模式很簡單,用戶端請求,服務端響應回報,其實就是一個請求<---->響應的過程  

      (1)建立連接配接,伺服器接受請求或拒絕,接受的話,進行下一步

        (2)用戶端發送請求

        (3)服務端處理請求

        (4)從存儲中擷取相關的請求資源

        (5)建構響應

        (6)發送響應到用戶端

        (7)記錄相關日志

請求封包一般的格式如下(每個值之間都是空格進行隔開):

            請求首行:<method><URL><version>

            請求頭:Name : Value

            Name:Value

            ...

               請求實體:

    響應封包格式:

         響應首行:<Vertion> <status><reason>

        響應頭:Name : Value

        Name:Value

        ...

        響應實體

    (1)method方法:

        GET:從伺服器擷取資源

        HEAD:隻從伺服器擷取響應封包的頭部

        POST:向伺服器端送出伺服器需要處理的資料

        PUT:用戶端想伺服器上傳資料,該資料直接存儲在伺服器上,而不需要進行處理,這就是與POST的差別

        DELETE:删除伺服器指定路徑的文檔

   (2)常見錯誤代碼

        伺服器傳回狀态碼

            1xx:表明服務端接收了用戶端請求,用戶端繼續發送請求;

            2xx:用戶端發送的請求被服務端成功接收并成功進行了處理;

            3xx:服務端給用戶端傳回用于重定向的資訊;

            4xx:用戶端的請求有非法内容;

            5xx:服務端未能正常處理用戶端的請求而出現意外錯誤。

    舉例:

        “200”  ; 服務端成功接收并處理了用戶端的請求;對應的reason為OK

        “301”  ; 用戶端所請求的URL已經移走,而且是永久移動,需要用戶端重定向到其它的URL;對應的reason為Moved Permanently

        “302”  ; 與301相似,用戶端所請求的URL已經移走,但是是臨時的,對應的reason為Found

        “304”  ; 用戶端發起了條件式請求,用戶端緩存的URL是否發生了修改,請求的URL未發生變化;對應的reason為Not Modified

        “401”  ; 用戶端登入認證失敗;對應reason為Unauthorized

        “403”  ; 用戶端請求被服務端所禁止(使用者沒有權限通路相關資源);對應的reason為Forbbiden

        “404”  ; 用戶端所請求的URL在服務端不存在;對應的reason為Not Found

        “500”  ; 服務端在處理用戶端請求時出現異常;對應的reason為Internel server error

        “502”  ; 此為中間代理傳回給用戶端的出錯資訊,表明服務端傳回給代理時出錯;對應的reason為Bad Gateway

(3)首部的分類:

    通用首部

    請求首部

    響應首部

    實體首部

    擴充首部

5、web資源

       web資源:所謂web資源即放在Internet網上供外界通路的檔案或程式,又根據它們呈現的效果及原理不同,将它們劃分為靜态資源和動态資源。

        靜态資源:靜态資源是浏覽器能夠直接打開的,一個js檔案,在打開方式中選擇IE浏覽器打開,浏覽器可以直接打開沒有出現問題,那麼就說明它是一個靜态資源。html檔案、css檔案、js檔案等它們都是靜态資源。

        動态資源:一些資源浏覽器不能夠直接打開,但是經過翻譯之後浏覽器能夠打開的資源稱之動态資源。比如說jsp檔案、servlet、php、ASP等這些都是動态資源。這裡說的動态網頁,與網頁上的各種動畫、滾動字幕等視覺上的“動态效果”沒有直接關系,動态網頁也可以是純文字内容的,也可以是包含各種動畫的内容,這些隻是網頁具體内容的表現形式,無論網頁是否具有動态效果,采用動态網站技術生成的網頁都稱為動态網頁。 

6、httpd的三種MPM介紹

 # perfork MPM 

Apache 2.X  支援插入式并行處理子產品,稱為多路處理子產品(MPM)。在編譯apache時必須選擇也隻能選擇一個MPM,對類UNIX系統,有幾個不同的MPM可供選擇,它們會影響到apache的速度和可伸縮性。 

  Prefork MPM : 這個多路處理子產品(MPM)實作了一個非線程型的、預派生的web伺服器,它的工作方式類似于Apache 1.3。它适合于沒有線程安全庫,需要避免線程相容性問題的系統。它是要求将每個請求互相獨立的情況下最好的MPM,這樣若一個請求出現問題就不會影響到其他請求。

工作的過程:      

   httpd伺服器會根據<IfModulempm_prefork_module>指令定義的參數維護程序池中的程序。

  當使用者向httpd伺服器發起連接配接請求的時候,httpd的主程序就會從程序池中派一個子程序來負責響應使用者的請求,

   如果該伺服器的并發請求量為100的話,一下子就使用完,程序池中空閑程序數(我們定義了程序池中最小空閑程序數為5),90個使用者的連接配接請求隻好等待。這時主程序fork()出子程序,然後才能響應處于等待90個使用者的連接配接請求。

   雖然是一個程序負責響應一個使用者的請求,當該程序完成了使用者的請求之後,會話上司程序并不會馬上kill掉該程序。而是使用了重用的機制。意思是在程序的生命周期内它響應完負責的使用者請求後,還可以響應後續的使用者請求。這是為了減少消耗在建立程序上面的時間。

   實作快速地響應使用者請求的一種機制

  這個MPM具有很強的自我調節能力,隻需要很少的配置指令調整。最重要的是将MaxClients設定為一個足夠大的數值以處理潛在的請求高峰,同時又不能太大,以緻需要使用的記憶體超出實體記憶體的大小。

 Prefork 是UNIX平台上預設的MPM,它所采用的預派生子程序方式也是apache 1.3中采用的模式。prefork 本身并沒有使用到線程,2.0 版本使用它是為了與1.3版保持相容性;另一方面,perfork用單獨的子程序來處理不同的請示,之程之間是彼此獨立的,這也使其成為最穩定的MPM之一 。

<IfModulempm_prefork_module>StartServers 5

MinSpareServers 5

MaxSpareServers 10

MaxRequestWorkers 250

MaxConnectionsPerChild 0</IfModule>

# StartServers:  數量的伺服器程序開始

# MinSpareServers:  最小數量的伺服器程序,儲存備用

# MaxSpareServers:  最大數量的伺服器程序,儲存備用

# MaxRequestWorkers:  最大數量的伺服器程序

# MaxConnectionsPerChild:  最大連接配接數的一個伺服器程序服務

  prefork 控制程序在最初建立“StartServers”個子程序後,為了滿足MinSpareServers設定的需要建立一個程序,等待一秒鐘,繼續建立兩 個,再等待一秒鐘,繼續建立四個……如此按指數級增加建立的程序數,最多達到每秒32個,直到滿足MinSpareServers設定的值為止。這種模式 可以不必在請求到來時再産生新的程序,進而減小了系統開銷以增加性能。MaxSpareServers設定了最大的空閑程序數,如果空閑程序數大于這個 值,Apache會自動kill掉一些多餘程序。這個值不要設得過大,但如果設的值比MinSpareServers小,Apache會自動把其調整為 MinSpareServers+1。如果站點負載較大,可考慮同時加大MinSpareServers和MaxSpareServers。  

  MaxRequestsPerChild設定的是每個子程序可處理的請求數。每個子程序在處理了“MaxRequestsPerChild”個請求後将自 動銷毀。0意味着無限,即子程序永不銷毀。雖然預設設為0可以使每個子程序處理更多的請求,但如果設成非零值也有兩點重要的好處:

1、可防止意外的記憶體洩 漏。2、在伺服器負載下降的時侯會自動減少子程序數。

是以,可根據伺服器的負載來調整這個值。

  MaxRequestWorkers指令集同時将服務請求的數量上的限制。任何連接配接嘗試在MaxRequestWorkerslimit将通常被排隊,最多若幹基于上ListenBacklog指令。 

在apache2.3.13以前的版本MaxRequestWorkers被稱為MaxClients 。

(MaxClients是這些指令中最為重要的一個,設定的是 Apache可以同時處理的請求,是對Apache性能影響最大的參數。其預設值150是遠遠不夠的,如果請求總數已達到這個值(可通過ps -ef|grep http|wc -l來确認),那麼後面的請求就要排隊,直到某個已處理請求完畢。這就是系統資源還剩下很多而HTTP通路卻很慢的主要原因。雖然理論上這個值越大,可以 處理的請求就越多,但Apache預設的限制不能大于256。)

      如果調大了并發使用者數(伺服器的性能條件下),雖然一次性可以處理的使用者請求數增加了,但是在伺服器上程序的切換的次數也增加了。因為程序的切換是浪費CPU時間周期的。是以,我們要為伺服器定做一個黃金比例。既能處理更多的使用者并發請求,浪費在程序間切換的時間又很合理

# worker MPM 

  Worker MPM : 此多路處理子產品(MPM)使網絡伺服器支援混合的多線程多程序。由于使用線程來處理請求,是以可以處理海量請求,而系統資源的開銷小于基于程序的MPM。但是,它也使用了多程序,每個程序又有多個線程,以獲得基于程序的MPM的穩定性

      一個線程服務一個使用者的連接配接請求。線程比程序更輕量級,建立和消耗的速度比程序的建立和消耗要快得多。線程之間還可以共享資源,如:打開的檔案描述符等。這樣如果:兩個用戶端請求的是同一個檔案,就不需要從磁盤上加載兩次了,速度要比基于程序的響應速度快。但線程的管理要比程序複雜得多。線程之間很多資源是共享的,是以它沒有prefork模型,一個程序服務一個服務請求那麼安全穩定。況且,linux不是真線程的作業系統,worker 與 prefork 這兩種模型,在linux上的表現幾乎都一樣。通常使用prefork模型。windows 是真線程的作業系統,它對線程的支援就很好。

不管是Worker模式或是Prefork 模式,Apache總是試圖保持一些備用的(spare)或者是空閑的子程序(空閑的服務線程池)用于迎接即将到來的請求。這樣用戶端就不需要在得到服務前等候子程序的産生。

<IfModulempm_worker_module>StartServers 3

MinSpareThreads 75

MaxSpareThreads 250 

ThreadsPerChild 25

MaxRequestWorkers 400

# StartServers:  初始數量的伺服器程序開始

# MinSpareThreads:  最小數量的工作線程,儲存備用

# MaxSpareThreads:  最大數量的工作線程,儲存備用

# ThreadsPerChild:  固定數量的工作線程在每個伺服器程序

# MaxRequestWorkers:  最大數量的工作線程

  Worker 由主要制程序生成“StartServers”個子程序,每個子程序中包含固定的ThreadsPerChild線程數,各個線程獨立地處理請求。同樣, 為了不在請求到來時再生成線程,MinSpareThreads和MaxSpareThreads設定了最少和最多的空閑線程數

  而MaxRequestWorkers 設定了同時連入的clients最大總數。如果現有子程序中的線程總數不能滿足負載,控制程序将派生新的子程序 

  MinSpareThreads和 MaxSpareThreads的最大預設值分别是75和250。這兩個參數對Apache的性能影響并不大,可以按照實際情況相應調節 。

  ThreadsPerChild是worker MPM中與性能相關最密切的指令。ThreadsPerChild的最大預設值是64,如果負載較大,64也是不夠的。這時要顯式使用 ThreadLimit指令,它的最大預設值是20000。 

  Worker模式下所能同時處理的請求總數是由子程序總數乘以ThreadsPerChild 值決定的,應該大于等于MaxRequestWorkers。如果負載很大,現有的子程序數不能滿足時,控制程序會派生新的子程序。預設最大的子程序總數是16,加大時 也需要顯式聲明ServerLimit(最大值是20000)。需要注意的是,如果顯式聲明了ServerLimit,那麼它乘以 ThreadsPerChild的值必須大于等于MaxRequestWorkers,而且MaxRequestWorkers必須是ThreadsPerChild的整數倍,否則 Apache将會自動調節到一個相應值。

# Event MPM 

  Event MPM:以上兩種穩定的MPM方式在非常繁忙的伺服器應用下都有些不足。盡管HTTP的Keepalive方式能減少TCP連接配接數量和網絡負載,但是 Keepalive需要和服務程序或者線程綁定,這就導緻一個繁忙的伺服器會耗光所有的線程。 Event MPM是解決這個問題的一種新模型,它把服務程序從連接配接中分離出來。在伺服器處理速度很快,同時具有非常高的點選率時,可用的線程數量就是關鍵的資源限 制,此時Event MPM方式是最有效的。一個以Worker MPM方式工作的繁忙伺服器能夠承受每秒好幾萬次的通路量(例如在大型新聞服務站點的高峰時),而Event MPM可以用來處理更高負載。值得注意的是,Event MPM不能在安全HTTP(HTTPS)通路下工作。 

<IfModule mpm_event_module>StartServers3

MaxSpareThreads 250

# StartServers:初始數量的伺服器程序開始

 在httpd2.2中并不支援event,生産環境中特别不穩定,2.4中event則已經可以在生産環境中使用了

如何檢視目前安裝的Apache 的三種MPM。

在2.2中:

[root@Cent6 ~]#  ps aux | grep http
root       2197  0.0  1.0 139212  4936 pts/0    S+   12:52   0:00 vim conf/httpd.conf
root       2798  0.0  0.9 184120  4452 ?        Ss   13:20   0:00 /usr/sbin/httpd.worker
apache     2963  0.0  0.7 528380  3432 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker
apache     2964  0.0  0.7 528380  3420 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker
apache     2965  0.0  0.7 528380  3420 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker      

httpd -l 的方式并不可靠。

在2.4中:

[root@centos7-2 httpd]# httpd -M | grep mpm
 mpm_worker_module (shared)      

另外2.2不支援DSO機制,使用安裝包的httpd編輯/etc/sysconfig/httpd,後需要重新啟動服務。

而2.4則很好的支援了DSO(平滑重新開機)的機制,修改/etc/httpd/conf.module.d/00-mpm.conf後立即生效

1. prefork 中沒有線程的概念,是多程序模型,一個程序處理一個連接配接;穩定;響應快。其缺點是在連接配接數比較大時就非常消耗記憶體。

2. worker 是多程序多線程模型,一個程序有多個線程,每個線程處理一個連接配接。與prefork相比,worker模式更節省系統的記憶體資源。不過,需要注意worker模式下的Apache與php等程式子產品的相容性。

3. event 是worker模式的變種,它把服務程序從連接配接中分離出來,在開啟KeepAlive場合下相對worker模式能夠承受的了更高的并發負載。event模式不能很好的支援https的通路(HTTP認證相關的問題)

7、httpd2.4的特性以及httpd2.2和2.4的差別

httpd-2.4

   新特性:

1.MPM支援運作為DSO機制,以子產品形式按需加載

2.eventMPM生産環境可用

3.異步讀寫機制

4.支援每子產品及每目錄的單獨日志級别定義

5.每請求相關的專用配置

6.增強版的表達式分析式

7.毫秒級持久連接配接時長定義

8.基于FQDN的虛拟主機時,不用使用namevirtualhost了

9.新指令,AllowOverridelist

10.支援使用者自定義變量

11.更低的記憶體消耗

1.新子產品:

    1.mod_proxy_fcgi

    2.mod_proxy_scgi

    3.mod_remotei

.切換使用的MPM的方式:

編輯/etc/httpd/conf.module.d/00-mpm.conf

2.基于IP的通路控制:

    允許所有主機通路:require allgranted

    拒絕所有主機通路:require all deny

    控制特定的ip通路:

    requireipIpaddr:授權指定來源的ip通路

    requirenotip IPADDR:拒絕

控制特定的主機通路:

    RequirehostHOSTNAME:授權指定來源的主機通路

    requirenothost HOSTNAME:拒絕

    HOSTNAME:這種比較少用,需要反解域名

    FQDN:特定主機

domin.tld;指定域名下的所有主機

  eg: 要加封裝

 <RequireAll>

     Requireall granted 

     Requirenot ip 172.16.100.2

  </RequireAll>

httpd2.2和httpd2.4的不同之處

1.在2中修改網頁檔案目錄直接修改DocumentRoot即可,而4需要修改DocumentRoot後限定目錄,使用Directory

2.在2中基于域名的虛拟主機需要加上NameVirtualHost*:80 ,4中不需要

3.修改MPM的工作模型2中可以通過修改/etc/sysconfig/httpd中的選項設定;4中可以修改/etc/httpd/conf.modules.d/00-mpm.conf中的子產品

4.httpd2.4中ssl的配置檔案ssl.conf中Listen443https(2.2中不需要加https)

繼續閱讀