httpd基礎

内容：

1、http協定概述

2、http協定特點

3、http的工作模式(過程)

4、http請求封包、響應封包格式、常見狀态碼解析

5、web資源概述(靜态資源、動态資源)

http協定工作在TCP/IP模型的應用層，其定義web服務間通信的約定通信方式，HTTP基于tcp傳送資料，預設是80端口(伺服器端)

幾個名詞：

http：hyper texttransfer protocol，超文本傳輸協定，超文本傳輸協定(HTTP)是一種通信協定，它允許将超文本标記語言(HTML)文檔從Web伺服器傳送到用戶端的浏覽器。目前我們使用的是HTTP/1.1 版本。

超文本：超文本檔案是與其它資料有關聯(links)的資料。包含與其他文檔連結的文檔；選擇連結時自動顯示第二個文檔。超文本檔案的一個簡單例子是大百科全書。假設你正在讀“樹”這個條目，在文章的最末有一個參考這樣寫到，“相關資訊參見‘植物’”。這最末一行就是一個關聯，從“樹”到“植物”這個條目。

當然這隻是一個簡單例子，全球網是基于一個遠遠複雜得多的超文本檔案。特别的是，在檔案的任何地方都可能有關聯，不僅是在末尾。舉一個想象的例子。假設你正在用全球網閱讀樹的超文本檔案，每次提到一種新的樹就有一個關聯，每個關聯都以某種方式辨別起來以顯得突出。例如，有關聯的字可能被加亮或者加了下劃線，或者标注了一個數字。如果跟着關聯走，你将轉到那種類型的樹的條目去。在主條目裡還有其它題目的關聯，如“雨林”或“木”。這些關聯又引出完整的條目。你或許還能找到與技術術語的關聯，如“落葉科”和“針葉樹”。如果沿着這些關聯就會找到其定義。在全球網的語言裡，一個超文本檔案的檔案就是由一些資料組成，而這些資料又可能與其它檔案相關聯。

html：hyper text marklanguage，超文本标記語

URL：uniform resourcelocation，統一資源定位符，主要用于描述伺服器某特定資源的位置，現在幾乎和URI相同

URL由三部分組成：資源類型、存放資源的主機域名、資源檔案名。

URL的一般文法格式為：

例如：http://www.sina.com.cn/index.html

scheme://<user>[:password:]@<host>[:<port>]/path;params?query#frag

SCHEME:指明協定的

如果是預設的公認端口，可以省略，比如80，如果改變了端口，需要指明

params:參數；name=value&name=value

query(查詢)

可選，用于給動态網頁（如使用CGI、ISAPI、PHP/JSP/ASP/ASP。NET等技術制作的網頁）傳遞參數，可有多個參數，用“&”符号隔開，每個參數的名和值用“=”符号隔開。

fragment（資訊片斷）

字元串，用于指定網絡資源中的片斷。例如一個網頁中有多個名詞解釋，可使用fragment直接定位到某一名詞解釋。

(1)c/s架構模式，也就是用戶端/伺服器端模式，一個伺服器可以為許多客戶服務

(2)簡單快速：客戶向伺服器請求服務時，隻需要傳送請求方法和路徑，請求方法常用的隻有GET、HEAD、POST等幾種(後面有說明)，由于HTTP協定簡單，使得HTTP伺服器的程式規模小，因而通信速度很快

(3)靈活：HTTP允許傳輸任意類型的資料對象，傳輸的類型由Context'-Type加以标記

(4)無連接配接：無連接配接的含義是限制每次連接配接隻處理一個請求。伺服器處理完客戶的請求，并收到客戶的應答後，即斷開連接配接。采用這種方式可以節省傳輸時間。

解決辦法：引入keep-alive機制

(5)無狀态：無狀态是指協定對于事務處理沒有記憶能力，伺服器不知道用戶端是什麼狀态。即我們給伺服器發送 HTTP 請求之後，伺服器根據請求，會給我們發送資料過來，但是，發送完，伺服器不會記錄任何，也就是說服務端不能判斷是否是來源同一個使用者

解決的方法：引入cookie(作用與用戶端)、session(作用于伺服器端)，具體工作過程說明這裡不詳細闡述，有興趣的可以查閱相關資料。

（6）安全可靠

http工作模式很簡單，用戶端請求，服務端響應回報，其實就是一個請求<---->響應的過程

(1)建立連接配接，伺服器接受請求或拒絕，接受的話，進行下一步

(2)用戶端發送請求

(3)服務端處理請求

(4)從存儲中擷取相關的請求資源

(5)建構響應

(6)發送響應到用戶端

(7)記錄相關日志

請求封包一般的格式如下(每個值之間都是空格進行隔開)：

請求首行：<method><URL><version>

請求頭：Name : Value

Name:Value

...

請求實體：

響應封包格式：

響應首行：<Vertion> <status><reason>

響應頭：Name : Value

Name:Value

...

響應實體

(1)method方法：

GET:從伺服器擷取資源

HEAD：隻從伺服器擷取響應封包的頭部

POST：向伺服器端送出伺服器需要處理的資料

PUT：用戶端想伺服器上傳資料，該資料直接存儲在伺服器上，而不需要進行處理，這就是與POST的差別

DELETE：删除伺服器指定路徑的文檔

(2)常見錯誤代碼

伺服器傳回狀态碼

1xx：表明服務端接收了用戶端請求，用戶端繼續發送請求；

2xx：用戶端發送的請求被服務端成功接收并成功進行了處理；

3xx：服務端給用戶端傳回用于重定向的資訊；

4xx：用戶端的請求有非法内容；

5xx：服務端未能正常處理用戶端的請求而出現意外錯誤。

舉例：

“200” ; 服務端成功接收并處理了用戶端的請求；對應的reason為OK

“301” ; 用戶端所請求的URL已經移走，而且是永久移動，需要用戶端重定向到其它的URL；對應的reason為Moved Permanently

“302” ; 與301相似，用戶端所請求的URL已經移走，但是是臨時的，對應的reason為Found

“304” ; 用戶端發起了條件式請求，用戶端緩存的URL是否發生了修改，請求的URL未發生變化；對應的reason為Not Modified

“401” ; 用戶端登入認證失敗；對應reason為Unauthorized

“403” ; 用戶端請求被服務端所禁止(使用者沒有權限通路相關資源)；對應的reason為Forbbiden

“404” ; 用戶端所請求的URL在服務端不存在；對應的reason為Not Found

“500” ; 服務端在處理用戶端請求時出現異常；對應的reason為Internel server error

“502” ; 此為中間代理傳回給用戶端的出錯資訊，表明服務端傳回給代理時出錯；對應的reason為Bad Gateway

（3）首部的分類：

通用首部

請求首部

響應首部

實體首部

擴充首部

5、web資源

web資源：所謂web資源即放在Internet網上供外界通路的檔案或程式，又根據它們呈現的效果及原理不同，将它們劃分為靜态資源和動态資源。

靜态資源：靜态資源是浏覽器能夠直接打開的，一個js檔案，在打開方式中選擇IE浏覽器打開，浏覽器可以直接打開沒有出現問題，那麼就說明它是一個靜态資源。html檔案、css檔案、js檔案等它們都是靜态資源。

動态資源：一些資源浏覽器不能夠直接打開，但是經過翻譯之後浏覽器能夠打開的資源稱之動态資源。比如說jsp檔案、servlet、php、ASP等這些都是動态資源。這裡說的動态網頁，與網頁上的各種動畫、滾動字幕等視覺上的“動态效果”沒有直接關系，動态網頁也可以是純文字内容的，也可以是包含各種動畫的内容，這些隻是網頁具體内容的表現形式，無論網頁是否具有動态效果，采用動态網站技術生成的網頁都稱為動态網頁。

6、httpd的三種MPM介紹

# perfork MPM

Apache 2.X 支援插入式并行處理子產品，稱為多路處理子產品（MPM）。在編譯apache時必須選擇也隻能選擇一個MPM，對類UNIX系統，有幾個不同的MPM可供選擇，它們會影響到apache的速度和可伸縮性。

　　Prefork MPM : 這個多路處理子產品(MPM)實作了一個非線程型的、預派生的web伺服器，它的工作方式類似于Apache 1.3。它适合于沒有線程安全庫，需要避免線程相容性問題的系統。它是要求将每個請求互相獨立的情況下最好的MPM，這樣若一個請求出現問題就不會影響到其他請求。

工作的過程：

httpd伺服器會根據<IfModulempm_prefork_module>指令定義的參數維護程序池中的程序。

當使用者向httpd伺服器發起連接配接請求的時候，httpd的主程序就會從程序池中派一個子程序來負責響應使用者的請求，

如果該伺服器的并發請求量為100的話，一下子就使用完，程序池中空閑程序數(我們定義了程序池中最小空閑程序數為5)，90個使用者的連接配接請求隻好等待。這時主程序fork()出子程序，然後才能響應處于等待90個使用者的連接配接請求。

雖然是一個程序負責響應一個使用者的請求，當該程序完成了使用者的請求之後，會話上司程序并不會馬上kill掉該程序。而是使用了重用的機制。意思是在程序的生命周期内它響應完負責的使用者請求後，還可以響應後續的使用者請求。這是為了減少消耗在建立程序上面的時間。

實作快速地響應使用者請求的一種機制

　　這個MPM具有很強的自我調節能力，隻需要很少的配置指令調整。最重要的是将MaxClients設定為一個足夠大的數值以處理潛在的請求高峰，同時又不能太大，以緻需要使用的記憶體超出實體記憶體的大小。

　Prefork 是UNIX平台上預設的MPM，它所采用的預派生子程序方式也是apache 1.3中采用的模式。prefork 本身并沒有使用到線程，2.0 版本使用它是為了與1.3版保持相容性；另一方面，perfork用單獨的子程序來處理不同的請示，之程之間是彼此獨立的，這也使其成為最穩定的MPM之一。

<IfModulempm_prefork_module>StartServers 5

MinSpareServers 5

MaxSpareServers 10

MaxRequestWorkers 250

MaxConnectionsPerChild 0</IfModule>

# StartServers:　　數量的伺服器程序開始

# MinSpareServers:　　最小數量的伺服器程序,儲存備用

# MaxSpareServers:　　最大數量的伺服器程序,儲存備用

# MaxRequestWorkers:　　最大數量的伺服器程序

# MaxConnectionsPerChild:　　最大連接配接數的一個伺服器程序服務

　　prefork 控制程序在最初建立“StartServers”個子程序後，為了滿足MinSpareServers設定的需要建立一個程序，等待一秒鐘，繼續建立兩個，再等待一秒鐘，繼續建立四個……如此按指數級增加建立的程序數，最多達到每秒32個，直到滿足MinSpareServers設定的值為止。這種模式可以不必在請求到來時再産生新的程序，進而減小了系統開銷以增加性能。MaxSpareServers設定了最大的空閑程序數，如果空閑程序數大于這個值，Apache會自動kill掉一些多餘程序。這個值不要設得過大，但如果設的值比MinSpareServers小，Apache會自動把其調整為 MinSpareServers+1。如果站點負載較大，可考慮同時加大MinSpareServers和MaxSpareServers。

　　MaxRequestsPerChild設定的是每個子程序可處理的請求數。每個子程序在處理了“MaxRequestsPerChild”個請求後将自動銷毀。0意味着無限，即子程序永不銷毀。雖然預設設為0可以使每個子程序處理更多的請求，但如果設成非零值也有兩點重要的好處：

1、可防止意外的記憶體洩漏。2、在伺服器負載下降的時侯會自動減少子程序數。

是以，可根據伺服器的負載來調整這個值。

　　MaxRequestWorkers指令集同時将服務請求的數量上的限制。任何連接配接嘗試在MaxRequestWorkerslimit将通常被排隊，最多若幹基于上ListenBacklog指令。

在apache2.3.13以前的版本MaxRequestWorkers被稱為MaxClients 。

（MaxClients是這些指令中最為重要的一個，設定的是 Apache可以同時處理的請求，是對Apache性能影響最大的參數。其預設值150是遠遠不夠的，如果請求總數已達到這個值（可通過ps -ef|grep http|wc -l來确認），那麼後面的請求就要排隊，直到某個已處理請求完畢。這就是系統資源還剩下很多而HTTP通路卻很慢的主要原因。雖然理論上這個值越大，可以處理的請求就越多，但Apache預設的限制不能大于256。）

如果調大了并發使用者數(伺服器的性能條件下)，雖然一次性可以處理的使用者請求數增加了，但是在伺服器上程序的切換的次數也增加了。因為程序的切換是浪費CPU時間周期的。是以，我們要為伺服器定做一個黃金比例。既能處理更多的使用者并發請求，浪費在程序間切換的時間又很合理

# worker MPM

　　Worker MPM : 此多路處理子產品(MPM)使網絡伺服器支援混合的多線程多程序。由于使用線程來處理請求，是以可以處理海量請求，而系統資源的開銷小于基于程序的MPM。但是，它也使用了多程序，每個程序又有多個線程，以獲得基于程序的MPM的穩定性

一個線程服務一個使用者的連接配接請求。線程比程序更輕量級，建立和消耗的速度比程序的建立和消耗要快得多。線程之間還可以共享資源，如：打開的檔案描述符等。這樣如果：兩個用戶端請求的是同一個檔案，就不需要從磁盤上加載兩次了，速度要比基于程序的響應速度快。但線程的管理要比程序複雜得多。線程之間很多資源是共享的，是以它沒有prefork模型，一個程序服務一個服務請求那麼安全穩定。況且，linux不是真線程的作業系統，worker 與 prefork 這兩種模型，在linux上的表現幾乎都一樣。通常使用prefork模型。windows 是真線程的作業系統，它對線程的支援就很好。

不管是Worker模式或是Prefork 模式，Apache總是試圖保持一些備用的(spare)或者是空閑的子程序（空閑的服務線程池）用于迎接即将到來的請求。這樣用戶端就不需要在得到服務前等候子程序的産生。

<IfModulempm_worker_module>StartServers 3

MinSpareThreads 75

MaxSpareThreads 250

ThreadsPerChild 25

MaxRequestWorkers 400

# StartServers:　　初始數量的伺服器程序開始

# MinSpareThreads:　　最小數量的工作線程,儲存備用

# MaxSpareThreads:　　最大數量的工作線程,儲存備用

# ThreadsPerChild:　　固定數量的工作線程在每個伺服器程序

# MaxRequestWorkers:　　最大數量的工作線程

　　Worker 由主要制程序生成“StartServers”個子程序，每個子程序中包含固定的ThreadsPerChild線程數，各個線程獨立地處理請求。同樣，為了不在請求到來時再生成線程，MinSpareThreads和MaxSpareThreads設定了最少和最多的空閑線程數

　　而MaxRequestWorkers 設定了同時連入的clients最大總數。如果現有子程序中的線程總數不能滿足負載，控制程序将派生新的子程序

　　MinSpareThreads和 MaxSpareThreads的最大預設值分别是75和250。這兩個參數對Apache的性能影響并不大，可以按照實際情況相應調節。

　　ThreadsPerChild是worker MPM中與性能相關最密切的指令。ThreadsPerChild的最大預設值是64，如果負載較大，64也是不夠的。這時要顯式使用 ThreadLimit指令，它的最大預設值是20000。

　　Worker模式下所能同時處理的請求總數是由子程序總數乘以ThreadsPerChild 值決定的，應該大于等于MaxRequestWorkers。如果負載很大，現有的子程序數不能滿足時，控制程序會派生新的子程序。預設最大的子程序總數是16，加大時也需要顯式聲明ServerLimit（最大值是20000）。需要注意的是，如果顯式聲明了ServerLimit，那麼它乘以 ThreadsPerChild的值必須大于等于MaxRequestWorkers，而且MaxRequestWorkers必須是ThreadsPerChild的整數倍，否則 Apache将會自動調節到一個相應值。

# Event MPM

　　Event MPM：以上兩種穩定的MPM方式在非常繁忙的伺服器應用下都有些不足。盡管HTTP的Keepalive方式能減少TCP連接配接數量和網絡負載，但是 Keepalive需要和服務程序或者線程綁定，這就導緻一個繁忙的伺服器會耗光所有的線程。 Event MPM是解決這個問題的一種新模型，它把服務程序從連接配接中分離出來。在伺服器處理速度很快，同時具有非常高的點選率時，可用的線程數量就是關鍵的資源限制，此時Event MPM方式是最有效的。一個以Worker MPM方式工作的繁忙伺服器能夠承受每秒好幾萬次的通路量（例如在大型新聞服務站點的高峰時），而Event MPM可以用來處理更高負載。值得注意的是，Event MPM不能在安全HTTP（HTTPS）通路下工作。

<IfModule mpm_event_module>StartServers3

MaxSpareThreads 250

# StartServers:初始數量的伺服器程序開始

在httpd2.2中并不支援event，生産環境中特别不穩定，2.4中event則已經可以在生産環境中使用了

如何檢視目前安裝的Apache 的三種MPM。

在2.2中：

[root@Cent6 ~]#  ps aux | grep http
root       2197  0.0  1.0 139212  4936 pts/0    S+   12:52   0:00 vim conf/httpd.conf
root       2798  0.0  0.9 184120  4452 ?        Ss   13:20   0:00 /usr/sbin/httpd.worker
apache     2963  0.0  0.7 528380  3432 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker
apache     2964  0.0  0.7 528380  3420 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker
apache     2965  0.0  0.7 528380  3420 ?        Sl   13:26   0:00 /usr/sbin/httpd.worker

httpd -l 的方式并不可靠。

在2.4中：

[root@centos7-2 httpd]# httpd -M | grep mpm
 mpm_worker_module (shared)

另外2.2不支援DSO機制，使用安裝包的httpd編輯/etc/sysconfig/httpd,後需要重新啟動服務。

而2.4則很好的支援了DSO（平滑重新開機）的機制，修改/etc/httpd/conf.module.d/00-mpm.conf後立即生效

1. prefork 中沒有線程的概念，是多程序模型，一個程序處理一個連接配接；穩定；響應快。其缺點是在連接配接數比較大時就非常消耗記憶體。

2. worker 是多程序多線程模型，一個程序有多個線程，每個線程處理一個連接配接。與prefork相比，worker模式更節省系統的記憶體資源。不過，需要注意worker模式下的Apache與php等程式子產品的相容性。

3. event 是worker模式的變種，它把服務程序從連接配接中分離出來,在開啟KeepAlive場合下相對worker模式能夠承受的了更高的并發負載。event模式不能很好的支援https的通路（HTTP認證相關的問題）

7、httpd2.4的特性以及httpd2.2和2.4的差別

httpd-2.4

新特性：

1.MPM支援運作為DSO機制，以子產品形式按需加載

2.eventMPM生産環境可用

3.異步讀寫機制

4.支援每子產品及每目錄的單獨日志級别定義

5.每請求相關的專用配置

6.增強版的表達式分析式

7.毫秒級持久連接配接時長定義

8.基于FQDN的虛拟主機時，不用使用namevirtualhost了

9.新指令，AllowOverridelist

10.支援使用者自定義變量

11.更低的記憶體消耗

1.新子產品：

1.mod_proxy_fcgi

2.mod_proxy_scgi

3.mod_remotei

.切換使用的MPM的方式：

編輯/etc/httpd/conf.module.d/00-mpm.conf

2.基于IP的通路控制：

允許所有主機通路：require allgranted

拒絕所有主機通路：require all deny

控制特定的ip通路：

requireipIpaddr：授權指定來源的ip通路

requirenotip IPADDR：拒絕

控制特定的主機通路：

RequirehostHOSTNAME：授權指定來源的主機通路

requirenothost HOSTNAME：拒絕

HOSTNAME：這種比較少用，需要反解域名

FQDN：特定主機

domin.tld；指定域名下的所有主機

eg: 要加封裝

Requireall granted

Requirenot ip 172.16.100.2

</RequireAll>

httpd2.2和httpd2.4的不同之處

1.在2中修改網頁檔案目錄直接修改DocumentRoot即可，而4需要修改DocumentRoot後限定目錄，使用Directory

2.在2中基于域名的虛拟主機需要加上NameVirtualHost*:80 ，4中不需要

3.修改MPM的工作模型2中可以通過修改/etc/sysconfig/httpd中的選項設定；4中可以修改/etc/httpd/conf.modules.d/00-mpm.conf中的子產品

4.httpd2.4中ssl的配置檔案ssl.conf中Listen443https(2.2中不需要加https)

httpd基礎

繼續閱讀

debian9更新4.9.0核心到4.19.2核心過程

centOS7 配置 vsftpd 虛拟使用者及權限Vsftpd配置虛拟使用者及權限

linux-svn解除安裝與安裝

vsftp虛拟多使用者多權限一鍵部署腳本

Ubuntu14.04 LTS下安裝mongodb

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容的通路3案例3：配置網頁内容通路

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三