分布式系統之異常

2022-12-18 20:25:28

異常的概念

分布式系統的一台伺服器或者伺服器上運作的一個程序稱為一個節點，節點和節點之間通過網際網路互聯，然而伺服器節點是不可靠的，節點和節點之間也是不可靠的，是以在系統運作過程中出現異常。

異常類型

1）伺服器當機

引起伺服器當機的原因可能是記憶體錯誤，資源耗盡，伺服器停電等，當伺服器當機時，節點會失去所有的記憶體資訊，是以應該考慮如何通過讀取持久化的媒體，如機械鍵盤，固态硬碟等來恢複記憶體資訊，使其恢複到當機前某個一緻的狀态。

2）網絡異常

引起網絡異常的原因可能是消息丢失，消息亂序或者網絡包資料錯誤。

還有一些特殊的網絡異常稱為“網絡分區”，叢集劃分為多個網絡分區，網絡分區之間無法通信，而每個網絡分區内部可以通信的情況。

3）磁盤故障

磁盤故障是一種發生機率很高的異常，磁盤故障分為兩種情況：磁盤損壞和磁盤資料錯誤。

磁盤損壞：丢失了磁盤上的所有資料，是以，需要考慮将資料部署到多台伺服器，即使其中一台伺服器發生磁盤錯誤，也可以從其他的伺服器中恢複。

磁盤錯誤恢複：可以采用校驗和機制來解決，可以選擇在作業系統層面實作，也可以在上層的分布式系統層面實作。

分布式系統的三态

由于網絡異常的存在，分布式系統中請求結果存在“三态”的概念。

在分布式系統中，如果某個節點向另一個節點發起 RPC(Remote procedure call)調用，即某個節點 A 向另一個節點 B 發送一個消息，節點 B 根據收到的消息内容完成某些操作，并将操作的結果通過另一個消息傳回給節點 A，那麼這個 RPC 執行的結果有三種狀态：“成功”、“失敗”、“逾時（未知）”，稱之為分布式系統的三态。

如果請求 RPC 的節點 A 收到了執行 RPC 的節點 B 傳回的消息，并且消息中說明執行成功，則該 RPC 的結果為“成功”。

如果請求 RPC 的節點 A 收到了執行 RPC 的節點 B 傳回的消息，并且消息中說明執行失敗，則該 RPC 的結果為“失敗”。

但是，如果請求 RPC 的節點 A 在給定的時間内沒有收到執行 RPC 的節點 B 傳回的消息，則認為該操作“逾時”。原因可能是伺服器當機，網絡異常，磁盤故障等

分布式系統之異常

異常的概念

異常類型

分布式系統的三态

繼續閱讀

《黑色行動4》伺服器當機48小時玩家稱一直黑屏

天翼網盤—垃圾中的戰鬥機。百度網盤，天翼網盤，我也用了十幾年了，沒有發現百度網盤有任何的問題，但是可笑的天翼網盤，在同一

妹妹看到網上說“ofo小黃車用戶端已經無法接收到短信驗證碼，使用者無法登入。”的消息後，一氣之下把手機砸了，沒多久她又後悔

#共享單車#最近要登入ofo小黃車用戶端，但發現手機已經接收不到短信驗證碼了，無法登入；改用ofo的小程式登入，卻一直提

仰望 U8 前元就像小弟弟比亞迪釋出了仰望U8和比亞迪元的同框宣傳視訊，兩者體型差别巨大，在仰望U8面前，比亞迪元就像是

VMware15虛拟機網絡突然無法連接配接三種解決方案（基于方案一）

pubgm手遊國際服下載下傳登陸失敗網絡異常卡頓波動解決辦法

#AI繪畫生成新年專屬頭像#發現這個AI繪畫有BUG，把第三張圖送出給AI會提示網絡異常，AI繪畫失敗，反複試驗都是如圖

Python 爬蟲2例:爬網絡小說

Ajax的應用③(nodemon、請求逾時與網絡異常、取消請求、重複請求)

華為聯機對戰服務斷線重連解決方案

伺服器當機了，Redis 如何避免資料丢失？

遊戲研發心得之斷線重連以及異常網絡處理1. 伺服器判定用戶端是否線上的依據2.用戶端異常處理 3.用戶端連接配接狀态的設計以及具體實作4.背景切換重連的一些注意點5.協定的是否丢棄

spring-retry使用介紹

軟體日志引發關注，資料報告收集驗證，将要開啟全新時代近年來，由于技術的快速發展，自動分析軟體日志引起了廣泛關注。目前，在

Kubernetes 網絡排錯骨灰級指南！