天天看點

《UNIX/Linux 系統管理技術手冊(第四版)》——第1章 從何處入手 1.1 系統管理者的基本任務

本節書摘來自異步社群《unix/linux 系統管理技術手冊(第四版)》一書中的第1章,第1.1節,作者:【美】evi nemeth , garth snyder , trent r.hein , ben whaley著,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

unix/linux 系統管理技術手冊(第四版)

《UNIX/Linux 系統管理技術手冊(第四版)》——第1章 從何處入手 1.1 系統管理者的基本任務

現如今,有關unix和linux的知識太多太多,由手冊、部落格、期刊、圖書以及其他參考資料構成了浩如煙海的知識庫,是以,我們在策劃本書内容的時候,就從上述的知識庫中遴選出滄海一粟,力求專門滿足系統管理者的需求。

首先,本書是一本入門教育訓練指南。書中探讨了主要的管理性系統,先區分它們彼此間的不同之處,然後又闡述它們如何協同工作。在很多情況下,同一概念有若幹種不同的實作,系統管理者必須要在其中做出自己的選擇,我們則介紹每種實作的優缺點。

其次,本書是一本快速參考手冊。書中總結了很多知識,在各種常見的unix和linux系統上,如果系統管理者要履行日常職責,就需要掌握它們。例如,ps指令,它能夠給出正在運作的程序的狀态。在linux系統上,這條指令支援80多個指令行參數。但隻要用極少的指令行參數組合,就能滿足系統管理者99%的需求;具體請參見本書5.7節的内容。

最後,本書集中介紹對企業級伺服器和網絡的系統管理。換言之,就是對重大系統的管理。配置一個單機桌面系統很簡單;但要保持一個虛拟化網絡平穩運作,就會困難得多,因為要面臨負載高峰、硬碟故障和惡意攻擊等問題。我們介紹了技術和經驗方法,它們能幫助網絡從災難中恢複過來。我們還幫助讀者選擇解決方案,方案會随着系統規模、複雜度以及異構性的增大而擴充。

我們不是說要絕對客觀地實作這些目标,但是我們認為,透過字裡行間的意思,我們已經相當清楚地講出了我們自己的偏好。在系統管理領域裡,存在這樣一個有趣的現象:“該由什麼構成最合适的政策和步驟?”對于這一問題,理性的人們可能會有相當不同的觀點。我們把我們的主觀意見作為原始資料提供給讀者。對于我們的建議,讀者必須自己決定能接受多少,并在多大程度上用于自己的環境。

在維基百科上,對“系統管理者”一詞的解釋中,有一段很不錯的讨論,探讨了通常認為的系統管理工作應該包括的任務。對于系統管理和軟體開發之間的界限,這個名詞解釋網頁現在劃分得很清楚,但是根據我們的經驗,在編寫腳本程式上,專業的系統管理者花了很多自己的時間。讀者可參考第2章來了解更多有關腳本程式設計的知識。雖說這并不會讓系統管理者本身變成開發人員,但确實意味着系統管理者同樣需要具備分析和結構設計的能力。

下面各小節簡要介紹了要求系統管理者履行的一些主要任務。這些職責未必是由一個人來執行的,在許多地方,這項工作會配置設定給幾個人。不過,确實至少要有一個人懂得全部工作,并確定每項任務都能正确完成。

1.1.1 賬号管理

系統管理者負責為新使用者增設賬号,将不再活動的使用者賬号删除,還要處理在賬号存在期間所有與該賬号有關的事務(例如,忘記密碼)。增删使用者的處理過程可以自動進行,但在增設新使用者之前,仍然必須做出某些管理上的決定(把使用者的主目錄放在什麼位置、在哪些機器上建立賬号等)。參考第7章了解有關添加新使用者的更多知識。

當某個使用者不應該再通路系統時,必須禁用該使用者的賬号。該賬号擁有的所有檔案必須在備份後予以清除,以使系統不會随着時間的增長而積累不想要的資訊。

1.1.2 增删硬體

購買了新硬體或把硬體從一台機器移到另外一台機器上時,必須配置系統,使之識别并使用該硬體。硬體支援的任務可能很簡單,例如添加列印機,也可能是更複雜的任務,例如添加磁盤陣列。參考第8章、第13章和第26章了解有關這些專題的更多知識。

現如今,虛拟化技術已經運用到企業級計算環境中來了,硬體的配置也比以前更複雜。裝置可能要安裝在虛拟化層次結構中的多個層面,系統管理者需要制定規範的政策,讓硬體能夠安全和公平地被共享。

1.1.3 執行備份

執行備份可能是系統管理者最重要的工作了,這也是經常被忽視,或者不經心去做的工作。備份工作耗時且單調,但又絕對必要。備份可以自動進行,且能授權給下屬去做,但系統管理者仍然要確定備份工作在按計劃正确進行(備份媒體确實可以恢複出原檔案來)。參考第10章來了解有關備份的更多知識。

1.1.4 安裝和更新軟體

在獲得新軟體以後,必須安裝并測試它,而且經常要在幾種類型的作業系統和硬體下進行安裝和測試。一旦軟體能夠正常工作,就必須通知使用者可以用這個軟體,還要告訴使用者這個軟體的位置。在更新檔和安全更新釋出出來的同時,也必須平穩地将它們融入到本地環境裡。參考第12章來了解有關軟體管理的更多知識。

應該把本地軟體和管理腳本正确地打包和管理,使之适用于本地系統自身采取的更新機制。随着該軟體向前發展,新的釋出版本應該先安排測試,然後再部署到整個站點上去。

1.1.5 監視系統

大型的部署環境需要時刻進行監視。除非事态嚴重,否則不要指望使用者向系統管理者報告問題。比起花時間寫說明報告問題,繞過問題通常要快得多,是以使用者往往怎麼省事怎麼來。

定期做檢查,確定電子郵件和web服務正确運作;檢視日志檔案,掌握故障出現的早期迹象;確定本地網絡都連接配接正确;監視系統資源(例如磁盤空間)的可用性。所有這些工作都很有可能自動執行,各種各樣現成的監視系統能夠幫助系統管理者完成這項任務。

1.1.6 故障診斷

系統發生故障在所難免。充當技工來診斷故障,在必要時請來專家排除故障等,都成了管理者的工作職責。找出問題往往比修複難上十倍。

1.1.7 維護本地文檔

系統為适合機關的需要而逐漸改造,随着改造的進行,該系統便開始變得和文檔當初所描述的那個基本系統不一樣。既然系統管理者負責做這些定制工作,那麼寫文檔講清楚變化也是管理者的職責。這項職責包括把電纜的走線位置、電纜連接配接方式等資訊寫入文檔,保留所有硬體的維護記錄,記錄備份的狀态,編寫本地處理過程和政策的文檔等。參考32.5節來了解有關文檔的建議。

1.1.8 時刻警惕系統安全

系統管理者必須實施某種安全政策,并且做定期檢查,確定系統安全沒有受到侵害。在安全要求低的系統上,這項工作任務可能僅僅包括對非授權通路進行粗略的檢查。在安全要求高的系統上,這可能包括仔細布置由陷阱和審計程式建構的監視網。有關安全主題的更多知識,請參考第22章。

1.1.9 救火

盡管在系統管理者工作的規定範圍之内,很少會包括幫助使用者解決各種問題,但對于大多數系統管理者而言,這通常占據了他們日常工作的很大一部分。系統管理者往往遭到形形色色問題的狂轟濫炸,問題從“我的程式昨天正常工作了,今天卻不幹活了!您改變了什麼?”,到“我把咖啡灑在鍵盤上了!我應該把水倒到鍵盤上洗掉咖啡麼?”,什麼都有。

在大多數情況下,系統管理者對這些事情的響應,要比他可能具備的任何實際技術技能,更能夠讓别人感覺到他作為一個系統管理者的價值所在。要麼對此憤憤不平,要麼就欣然接受這樣的事實:深更半夜花5個小時調試問題,和妥善處理一張故障工單相比,在績效評定上都一樣。

繼續閱讀