天天看點

我在華為寫代碼

回首過去這半年,軟體總工、軟體專家的任命,還有新年伊始任總《全面提升軟體工程能力,打造可信的高品質産品》的發文,都讓我們這些寫了十多年代碼的軟體工程師激動不已。我2006年進入公司,幾乎參與了華為3G控制器産品的完整生命周期,見證了華為3G從起步、上升、靈魂深處的改進、巅峰、回落的波瀾壯闊曆程,并在35歲“高齡”有幸加入到5G開發部的大家庭。

十幾年來,我一直堅持在編碼崗位,經曆了普通開發人員、TL、MDE、MDEL、SDM(雲化團隊)、Committer、軟體專家等各種崗位。然而我卻深知,不算大牛的我,從事編碼這個“高危”職業十幾年而沒有被拿去“祭天”,依靠的是一個程式員的自我修養——紮實的基礎軟體能力、如履薄冰的工作态度、對技術孜孜不倦的追求。

1

好代碼長什麼模樣?

記得幾年前部門第一次評選優秀代碼,我成為“金碼獎”獲得者之一。是因為代碼很炫嗎?并不是。我參與評選的代碼,遵循着簡單的原則:簡潔、邏輯清晰、函數職責單一、合理的資料結構設計。并沒有使用高深的編碼技巧,也沒有應用某某設計模式。正如公司最新的C/C++語言程式設計規範,也是将編寫簡潔的程式放在首位。簡潔、邏輯清晰的代碼,易于閱讀和維護,這段代碼後面也因需求變化而被修改,但卻從來沒有引入過網上問題。

當然,簡單不代表沒有思考,恰恰相反,更需要我們在寫代碼之前謀定而後動、三思而後行。有一次項目組安排我做性能優化,通過反複分析熱點函數、反複測試比對不同話務模型下的性能差異,前前後後花了3個星期的時間,我找到了引起性能惡化的最關鍵因素。最終我決定采用修改備份機制、減小備份資料的優化措施。這些方案代碼改動都很小、很簡單,但實際優化效果卻很好,滿足了未來幾年業務發展的需求。

再來看另一個例子,某局點更新新版本後出現CPU負載上升的問題。經過近兩周的攻關,我最終定位是新版本在業務處理流程中新增了直接讀取DB核心的操作。直接讀取DB核心,代碼處理簡單,也能正常實作業務功能,但是性能卻非常差。如果開發過程中能多想一步,采用緩存的方案,性能會有天壤之别,也是更好的代碼。

人們常說唯一不變的就是變化,客戶需求一直在變化,我們的代碼也會被動或者主動地在變化。設計出可擴充、自動适應客戶需求變化的軟體架構,是軟體工程師永恒的追求。這說說容易,做起來卻很難。需要我們不停積累業務知識,擴充知識面,勤于思考,識别技術未來演進趨勢。我們無法從一開始就做一個無所不能的架構,來包含未來的千變萬化,即使能,傳遞節奏也不一定允許。滿足目前及未來一定時間内業務需要的設計,或許就是最合适的。

2

練好紮實的基本功

能寫出好代碼,更要能持續地寫出好代碼,需要我們深刻了解技術原理和業務邏輯。前提是具備紮實的程式設計基礎,即基礎軟體能力,如基礎的資料結構和算法、編譯原理等。

去年底,我跟部門幾個軟體高手一起,去外部參加了一次網際網路架構大會。AI、區塊鍊、物聯網、雲、中間件等時尚、熱點、風口相關的議題非常多。但是我沒想到,最火爆的卻是一些基礎軟體設計、架構設計和演進之類的專題。就像武俠小說寫的一樣,練好基本功、練好内功,後續無論什麼精妙招式,都會信手拈來。

另外,一些程式設計習慣,如果堅持下去,對于程式設計修養提升也是非常有用的。比如快捷鍵的使用、有效的代碼注釋、命名規則、代碼風格等。每次寫代碼除了追求好代碼之外,我都會時刻去思考軟體上的優化,能否能使用更少的記憶體,能否有更好的性能。重視資料結構中的每一個字段,重視每一處小的代碼優化,都有可能給我們帶來意想不到的收獲。比如去年做性能優化,我們僅僅是将流程中的一處動态記憶體申請修改為靜态記憶體池,卻意外獲得了30 CAPS(每秒呼叫次數)的性能提升。

3

一行代碼引發的慘案

有人問,道理我都懂,為什麼卻依然寫不出好代碼?

很多開發人員,因為個人習慣、趕工期、外部要求不高等多種原因,在程式設計時特别随意,直接Copy-Paste。我覺得程式員應當像追求生活品質一樣,養成不将就的程式設計習慣、嚴謹的程式設計态度。

對于代碼上庫,我一直都是戰戰兢兢,如履薄冰。上庫前我會反複看自己修改的代碼,看修改代碼的上下文,并進行修改前後代碼比對。代碼上庫後再看幾遍,確定都已按預期合入。進入公司這麼多年,自己從來沒有多合、漏合、錯合過任何一行代碼。

大家可能會覺得我這是小題大做,但事實上,這都是曆史上曾經發生過的慘痛教訓。我們在某國更新新版本後發現使用者接入成功率惡化,最後定位是由于一行代碼被誤删除導緻的。事後回溯,開發人員自己都不記得這一行代碼為什麼會被删除。還有一次,一行代碼被誤删除,導緻一個關鍵KPI名額:軟切換統計次數有變更。部門把這兩起事件總結為“一行代碼引發的慘案”,無論是對産品品牌、客戶印象、還是對于個人,都造成了惡劣的影響。

事後大家都在思考,我們有結對程式設計、代碼檢視、開發者自測試等非常完善的開發流程,還有MDE(子產品設計師)檢視作為代碼上庫前的“守門員”,為什麼還會發生這麼低級的錯誤?是流程沒執行到位,還是MDE疏忽、沒把好關?

在IPD 2.0變革中,公司借鑒開源組織的Committer運作,來加強我們的Committer機制和文化。5G開發部也選拔、任命了一批Committer,我有幸成為其中之一。剛開始履行Committer職責時,我有點疑惑:這不就是給MDE角色披上了新的外衣,把MDE原先“私下”做的事情,通過Committer統計資料給呈現出來嘛?

不過,經過幾個月的摸索、實踐後,我漸漸地明白,Committer機制應該是一種文化上的變革,牽引大家提升自己的軟體能力。Committer的職責很多,作為代碼送出前的最後一道關卡,這是在目前人員能力不足階段有效果,但是最終應該被弱化的一項實踐。參與編碼前的軟體設計、持續做好架構看護和技術債務清理,讓大家都有更大的機會寫出更好的代碼,我認為這是Committer更大的價值。

随着個人群組織的軟體工程能力提升,自動化測試防護網和變更防護牆建設完善之後,前面提到的“一行代碼引起的慘案”,是可以避免的。

4

“變更防護牆”夠不夠可靠?

對于大部分老員工,特别是無線2G/3G/4G等部門的老員工來說,一提到變更控制,都會如臨大敵。版本更新後,KPI變差是絕對不允許的,嚴重時可能面臨版本回退、客戶投訴和上報事故。而KPI變好,除了要向客戶解釋,還有可能面臨商務風險,客戶會覺得之前吃虧了。現實世界對我們就是這麼苛刻,誰讓我們是影響世界的通信軟體工程師呢,他們這是愛之深、責之切啊!

我們開發一個版本,動辄涉及幾十萬代碼的新增、修改或重構。要想不引入變更問題,除了做好設計、結對編碼、代碼檢視和測試之外,我認為最關鍵的就是完善的自動化防護網。在3G時,我帶着兩個同僚将IT測試工程從隻有幾百個用例擴充到上萬個用例。全方位的場景覆寫、嚴密的信元有效性檢查、完善的用例失敗判決機制、無死角的資源洩漏檢查等手段,讓變更錯誤無所遁形,給3G留下了一道變更防護牆。

開發過程中補充IT和PC-ST測試用例,不是為了提升代碼覆寫率,而是為了自動化防護。而要能達成自動化防護的前提,是每個用例都具備完善的有效性檢查,否則防護網就是形同虛設。幾年前,我跟一個同僚開玩笑:“我會故意将某行代碼改錯,看看你補充的用例是否能檢查出來。”讓我意外的是,在傳遞緊張的情況下,他仍然多花了半天時間完善用例有效性檢查,并請我故意改錯代碼來做試驗。當然,最終的結果是,他準備得很充分,我沒能發現問題。多麼有自我追求的一個程式員!

5

保持對于新興技術的好奇心

說起程式員的追求,我還想起了2016年參與的一個産品雲化項目,我負責彈性伸縮特性的方案設計。在此之前,我一直在投入嵌入式軟體開發,雖然期間産品也換了好幾代的硬體,經曆了産品與平台解耦、制式間解耦、軟體與硬體解耦等過程,但是對于服務化、微服務化、雲化等概念,我卻基本處于懵懂的狀态。

不懂怎麼辦,隻能是“站在巨人肩膀上,為我所用”。兄弟産品線不是已經做了嗎,那就找他們做同行協助;友商不是有路标和規劃了嗎,那就在他們的有限材料中尋找可借鑒的地方;網際網路的亞馬遜雲、阿裡雲不是有非常成熟的方案了嗎,那就下載下傳他們的産品手冊和使用者指南……那段時間感覺自己就像是入了魔一樣,瘋狂地學習分布式軟體相關技術,瘋狂地吸收各方面的能量為我所用,最終給出了一個令自己和項目滿意的設計方案。

這也讓我充分意識到自己之前把眼光局限于所在産品、系統、子系統的不足。作為一個程式員,除了要提升自己的基礎軟體能力,我們也要始終保持對于新興技術的好奇心,孜孜不倦的追求,不斷拓寬自己的視野。而這方面的能力和訴求,在5G時代更是如此。

目前我們華為5G面臨的網絡安全問題,雖然有着很大的政治因素,但也從側面反映了5G的戰略意義。超高速率、超大連接配接數、超高可靠低延遲時間,對我們在軟體處理時延、可靠性、安全、韌性等方面的能力都提出了更高的要求。同時,5G承載的垂直行業應用、接口開放和硬體“白盒化”等趨勢,也必将對我們目前的知識和技術體系,提出更大的挑戰。