天天看點

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

本文位址

分享提綱:

  1. 概述

  2. 知識點

 1.概述

  

  1)【書名及連結】

  《大型網站技術架構 核心原理與案例分析》

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

   2)【主要内容】

    由李智慧著作的《大型網站技術架構(核心原理與案例分析)》通過梳理大型網站技術發展曆程,剖析大型網站技術架構模式,深入講述大型網際網路架構設計的核心原理,并通過一組典型網站技術架構設計案例,為讀者呈現一幅包括技術SHOU*選型、架構設計、性能優化、web安全、系統釋出、運維監控等在内的大型網站開發全景視圖。 

    大型網站技術架構(核心原理與案例分析)》不僅适用于指導網站工程師、架構師進行網站技術架構設計,也可用于指導産品經理、項目經理、測試運維人員等了解網站技術架構的基礎概念;還可供包括企業系統開發人員在内的各類軟體開發從業人員借鑒,了解大型網站的解決方案和開發理念。

  3)【目錄結構】  

第YI篇 概述 
1 大型網站架構演化 
1.1 大型網站軟體系統的特點 
1.2 大型網站架構演化發展曆程 
1.2.1 初始階段的網站架構 
1.2.2 應用服務和資料服務分離 
1.2.3 使用緩存改善網站性能 
1.2.4 使用應用伺服器叢集改善網站的并發處理能力 
1.2.5 資料庫讀寫分離 
1.2.6 使用反向代理和CDN加速網站響應 
1.2.7 使用分布式檔案系統和分布式資料庫系統 
1.2.8 使用NoSQL和搜尋引擎 
1.2.9 業務拆分 
1.2.10 分布式服務 
1.3 大型網站架構演化的價值觀 
1.3.1 大型網站架構技術的核心價值是随網站所需靈活應對 
1.3.2 驅動大型網站技術發展的主要力量是網站的業務發展 
1.4 網站架構設計誤區 
1.4.1 一味追随大公司的解決方案 
1.4.2 為了技術而技術 
1.4.3 企圖用技術解決所有問題 
1.5 小結 
2 大型網站架構模式 
2.1 網站架構模式 
2.1.1 分層 
2.1.2 分割 
2.1.3 分布式 
2.1.4 叢集 
2.1.5 緩存 
2.1.6 異步 
2.1.7 備援 
2.1.8 自動化 
2.1.9 安全 
2.2 架構模式在新浪微網誌的應用 
2.3 小結 
3 大型網站核心架構要素 
3.1 性能 
3.2 可用性 
3.3 伸縮性 
3.4 擴充性 
3.5 安全性 
3.6 小結 
第2篇 架構 
4 瞬時響應:網站的高性能架構 
4.1 網站性能測試 
4.1.1 不同視角下的網站性能 
4.1.2 性能測試名額 
4.1.3 性能測試方法 
4.1.4 性能測試報告 
4.1.5 性能優化政策 
4.2 Web前端性能優化 
4.2.1 浏覽器通路優化 
4.2.2 CDN加速 
4.2.3 反向代理 
4.3 應用伺服器性能優化 
4.3.1 分布式緩存 
4.3.2 異步操作 
4.3.3 使用叢集 
4.3.4 代碼優化 
4.4 存儲性能優化 
4.4.1 機械硬碟vs. 固态硬碟 
4.4.2 B+樹vs. LSM樹 
4.4.3 RAID vs. HDFS 
4.5 小結 
5 萬無一失:網站的高可用架構 
5.1 網站可用性的度量與考核 
5.1.1 網站可用性度量 
5.1.2 網站可用性考核 
5.2 高可用的網站架構 
5.3 高可用的應用 
5.3.1 通過負載均衡進行無狀态服務的失效轉移 
5.3.2 應用伺服器叢集的Session管理 
5.4 高可用的服務 
5.5 高可用的資料 
5.5.1 CAP原理 
5.5.2 資料備份 
5.5.3 失效轉移 
5.6 高可用網站的軟體品質保證 
5.6.1 網站釋出 
5.6.2 自動化測試 
5.6.3 預釋出驗證 
5.6.4 代碼控制 
5.6.5 自動化釋出 
5.6.6 灰階釋出 
5.7 網站運作監控 
5.7.1 監控資料采集 
5.7.2 監控管理 
5.8 小結 
6 永無止境:網站的伸縮性架構 
6.1 網站架構的伸縮性設計 
6.1.1 不同功能進行實體分離實作伸縮 
6.1.2 單一功能通過叢集規模實作伸縮 
6.2 應用伺服器叢集的伸縮性設計 
6.2.1 HTTP重定向負載均衡 
6.2.2 DNS域名解析負載均衡 
6.2.3 反向代理負載均衡 
6.2.4 IP負載均衡 
6.2.5 資料鍊路層負載均衡 
6.2.6 負載均衡算法 
6.3 分布式緩存叢集的伸縮性設計 
6.3.1 Memcached分布式緩存叢集的通路模型 
6.3.2 Memcached分布式緩存叢集的伸縮性挑戰 
6.3.3 分布式緩存的一緻性Hash算法 
6.4 資料存儲伺服器叢集的伸縮性設計 
6.4.1 關系資料庫叢集的伸縮性設計 
6.4.2 NoSQL資料庫的伸縮性設計 
6.5 小結 
7 随需應變:網站的可擴充架構 
7.1 建構可擴充的網站架構 
7.2 利用分布式消息隊列降低系統耦合性 
7.2.1 事件驅動架構 
7.2.2 分布式消息隊列 
7.3 利用分布式服務打造可複用的業務平台 
7.3.1 Web Service與企業級分布式服務 
7.3.2 大型網站分布式服務的需求與特點 
7.3.3 分布式服務架構設計 
7.4 可擴充的資料結構 
7.5 利用開放平台建設網站生态圈 
7.6 小結 
8 固若金湯:網站的安全架構 
8.1 道高一尺魔高一丈的網站應用攻擊與防禦 
8.1.1 XSS攻擊 
8.1.2 注入攻擊 
8.1.3 CSRF攻擊 
8.1.4 其他攻擊和漏洞 
8.1.5 Web應用防火牆 
8.1.6 網站安全漏洞掃描 
8.2 資訊加密技術及密鑰安全管理 
8.2.1 單向散列加密 
8.2.2 對稱加密 
8.2.3 非對稱加密 
8.2.4 密鑰安全管理 
8.3 資訊過濾與反垃圾 
8.3.1 文本比對 
8.3.2 分類算法 
8.3.3 黑名單 
8.4 電子商務風險控制 
8.4.1 風險 
8.4.2 風控 
8.5 小結 
第3篇 案例 
9 淘寶網的架構演化案例分析 
9.1 淘寶網的業務發展曆程 
9.2 淘寶網技術架構演化 
9.3 小結 
10 維基百科的高性能架構設計分析 
10.1 Wikipedia網站整體架構 
10.2 Wikipedia性能優化政策 
10.2.1 Wikipedia前端性能優化 
10.2.2 Wikipedia服務端性能優化 
10.2.3 Wikipedia後端性能優化 
11 海量分布式存儲系統Doris的高可用架構設計分析 
11.1 分布式存儲系統的高可用架構 
11.2 不同故障情況下的高可用解決方案 
11.2.1 分布式存儲系統的故障分類 
11.2.2 正常情況下系統通路結構 
11.2.3 瞬時故障的高可用解決方案 
11.2.4 臨時故障的高可用解決方案 
11.2.5 永JIU故障的高可用解決方案 
12 網購秒殺系統架構設計案例分析 
12.1 秒殺活動的技術挑戰 
12.2 秒殺系統的應對政策 
12.3 秒殺系統架構設計 
12.4 小結 
13 大型網站典型故障案例分析 
13.1 寫日志也會引發故障 
13.2 高并發通路資料庫引發的故障 
13.3 高并發情況下鎖引發的故障 
13.4 緩存引發的故障 
13.5 應用啟動不同步引發的故障 
13.6 大檔案讀寫獨占磁盤引發的故障 
13.7 濫用生産環境引發的故障 
13.8 不規範的流程引發的故障 
13.9 不好的程式設計習慣引發的故障 
13.10 小結 
第4篇 架構師 
14 架構師上司藝術 
14.1 關注人而不是産品 
14.2 發掘人的YOU秀 
14.3 共享美好藍圖 
14.4 共同參與架構 
14.5 學會妥協 
14.6 成就他人 
15 網站架構師職場攻略 
15.1 發現問題,尋找突破 
15.2 提出問題,尋求支援 
15.3 解決問題,達成績效 
16 漫話網站架構師 
16.1 按作用劃分架構師 
16.2 按效果劃分架構師 
16.3 按職責角色劃分架構師 
16.4 按關注層次劃分架構師 
16.5 按口碑劃分架構師 
16.6 非主流方式劃分架構師 
附錄A 大型網站架構技術一覽 
附錄B Web開發技術發展曆程 
後記      

目錄結構

2. 知識點

    1)【軟體視圖模型】

    機械制圖的時候,通常使用三視圖描述一個機械零件,從正視、側視、俯視三個角度對一個零件繪圖,進而全面描述一個零件的結構。軟體架構設計中常用的4+1視圖模型,也是一種多角度描述軟體系統設計的手段

   2) 【垃圾回收】

    JVM為例,其記憶體主要可劃分為堆(heap)和堆棧(stack)。堆棧用于存儲線程上下文資訊,如方法參數、局部變量等。堆則是存儲對象的記憶體空間,對象的建立和釋放、垃圾回收就在這裡進行。通過對對象生命周期的觀察,發現大部分對象的生命周期都極其短暫,這部分對象産生的垃圾應該被更快地收集,以釋放記憶體,這就是JVM分代垃圾回收,其

  3)【重複請求】

    應用調用服務失敗後,會将調用請求重新發送到其他伺服器,但是這個失敗可能是虛假的失敗。比如服務已經處理成功,但因為網絡故障應用沒有收到響應,這時應用重新送出請求就導緻服務重複調用,如果這個服務是一個轉賬操作,就會産生嚴重後果

  4)【資料庫連接配接池】

    應用程式的資料庫連接配接基本都使用連接配接池(Connection Pool)的方式。資料庫連接配接對象建立好以後,将連接配接對象放入對象池容器中,應用程式要連接配接的時候,就從對象池中擷取一個空閑的連接配接使用,使用完畢再将該對象歸還到對象池中即可,不需要建立新的連接配接。

  5) 【資料庫索引結構】

     目前資料庫多采用兩級索引的B+樹,樹的層次最多三層。是以可能需要5次磁盤通路才能更新一條記錄(三次磁盤通路獲得資料索引及行ID,然後再進行一次資料檔案讀操作及一次資料檔案寫操作)。

  6) 【網站的不可用】

    網站不可用也被稱作網站故障,業界通常用多少個9來衡量網站的可用性,如QQ的可用性是4個9,即QQ服務99.99%可用,這意味着QQ服務要保證其在所有運作時間中,隻有0.01%的時間不可用,也就是一年中大約最多53分鐘不可用。

  7) 【幂等性】

    數學和計算機概念,任意多次執行所産生的影響均與一次執行的影響相同

  8) 【預釋出伺服器】

    預釋出伺服器是一種特殊用途的伺服器,它和線上的正式伺服器唯一的不同就是沒有配置在負載均衡伺服器上,外部使用者無法通路

  9)【火車釋出模型】

    由于火車釋出模型是基于規則驅動的流程,是以這個流程可以自動化。采用火車釋出模型的網站會開發一個自動化釋出的工具實作釋出過程的自動化。

  10) 【網站伸縮性】

    一般說來,網站的伸縮性設計可分成兩類,一類是根據功能進行實體分離實作伸縮,一類是單一功能通過叢集實作伸縮。前者是不同的伺服器部署不同的服務,提供不同的功能;後者是叢集内的多台伺服器部署相同的服務,提供相同的功能。

  11)【DNS負載均衡缺點】

    但是DNS域名解析負載均衡也有缺點,就是目前的DNS是多級解析,每一級DNS都可能緩存A記錄,當下線某台伺服器後,即使修改了DNS的A記錄,要使其生效也需要較長時間,這段時間,DNS依然會将域名解析到已經下線的伺服器,導緻使用者通路失敗;而且DNS負載均衡的控制權在域名服務商那裡,網站無法對其做更多改善和更強大的管理。

  12)【LVS】

    使用三角傳輸模式的鍊路層負載均衡是目前大型網站使用最廣的一種負載均衡手段。在Linux平台上最好的鍊路層負載均衡開源産品是LVS(Linux Virtual Server)。

  13)【貧血模型 充血模型】

    引申出曠日持久的業務對象貧血模型與充血模型之争

  14)【NoSql的放棄】

    NoSQL資料庫産品都放棄了關系資料庫的兩大重要基礎:以關系代數為基礎的結構化查詢語言(SQL)和事務一緻性保證(ACID)。而強化其他一些大型網站更關注的特性:高可用性和可伸縮性。

    開源社群有各種NoSQL産品,其支援的資料結構和伸縮特性也各不相同,目前看來,應用最廣泛的是Apache HBase。

  15)【高手定律。救世主定律】

     高手定律:這個世界隻有遇不到的問題,沒有解決不了的問題,高手之是以成為高手,是因為他們遇到了常人很難遇到的問題,并解決了。

     救世主定律:遇到問題,分析問題,最後總能解決問題

  16)【ColumnFamily結構的NoSQL】

     而使用支援ColumnFamily結構的NoSQL資料庫,建立表的時候,隻需要指定ColumnFamily的名字,無需指定字段(Column),可以在資料寫入時再指定,通過這種方式,資料表可以包含數百萬的字段,使得應用程式的資料結構可以随意擴充。而在查詢時,可以通過指定任意字段名稱和值進行查詢。

  17)【API接口】

    API 接口:是開放平台暴露給開發者使用的一組API,其形式可以是RESTful、WebService、RPC等各種形式。

  18)【資訊加密技術】

    資訊加密技術可分為三類:單項散列加密、對稱加密和非對稱加密。

  19)【風控】

    大型電商網站都配備有專門的風控團隊進行風險控制,風控的手段也包括自動和人工兩種。機器自動識别為高風險的交易和資訊會發送給風控稽核人員進行人工稽核,機器自動風控的技術和方法也不斷通過人工發現的新風險類型進行逐漸完善。

    機器自動風控的技術手段主要有規則引擎和統計模型。

  20)【CGI技術】

    一般來說CGI技術(廣義上也包括Java Servlet)被稱作腳本模式,CGI程式需要解析HTTP請求,處理業務邏輯,并在輸出流中構造響應資訊的HTML。這種技術的優點和缺點是同一個特性——可以在CGI程式中做任何事情。

3.思維導圖 

參考連結:

1. 大型網站架構演化

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

2. 大型架構模式

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

3. 大型網站核心架構要素

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

4. 瞬時響應:網站的高性能架構

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

5. 萬無一失:網站的高可用架構

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

6. 永無止境:網站的伸縮性架構

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

7. 随機應變:網站的可擴充性架構

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》

8. 固若金湯:網站的安全機構

【讀書筆記】2017.01.06 星期五 《大型網站架構技術》