嘉賓?| 何琦
(資料圖)
出品 | CSDN云原生
2022年9月15日,在中國信通院、騰訊云、FinOps產業標準工作組聯合發起的《原動力x云原生正發聲 降本增效大講堂》系列直播活動第8講上,針對游戲平臺上云到底是花錢還是省錢這一話題,三七互娛SRE負責人何琦進行了經驗分享。本文整理自何琦的分享。
當前,我們的業務通過機房A與機房B進行部署,機房A、B之間通過網絡專線的方式實現網絡互通,形成一張內網,且兩機房均部署大量虛擬化的物理機。
在IDC運維中,由于單臺物理機易產生故障,故業務的每一臺虛擬機都分布在不同的物理機上,形成雙機房、多機部署的高可用穩定架構。在這樣的架構環境下,該如何進行擴容處理呢?
如上圖所示,若紅線所示的業務需擴容一臺虛擬機,由于當前機房中所有服務器的虛擬機資源均被占用,故需新增一臺物理設備作為宿主機,并對其做虛擬化處理。
與此同時,也帶來了新增物理機剩余虛擬機資源的浪費問題。
在業務縮容時,同樣存在資源浪費現象。如上圖所示,當紅框標注的業務下線時,由于其他業務仍占據著該物理機的其余資源,所以無法回收,仍需保留。從成本角度看,其余業務此時需承擔更多的成本,總成本消耗并未得到優化,浪費現象依然存在。
在IDC環境下,若想在資源隔離的同時,提升資源利用率及穩定性,該怎么做呢?
對于大企業來說,可以提高投入,完善基礎設施,為業務提供更好的設備與更穩定的資源。此外,其強大的團隊能夠為運維體系“量體裁衣”,資源騰挪空間也相對較大。
但這種運維方式能否直接應用在中小規模公司呢?答案是否定的。此時中小企業若想解決IDC環境下缺乏彈性資源管理的困境,只有上云。
先規劃,后上云
如上圖所示,我們可以將上云想象成為一座“圍墻”,圍墻內是企業的內部業務,可進一步分為運維和生產兩個區域,且圍墻共有VPN、負載均衡以及NAT三座“大門”。
用戶訪問業務必須從“負載均衡”大門進入,以負載均衡的方式訪問生產區域的業務服務器及對應數據庫。
運維人員從“VPN”大門進入,通過堡壘機內網控制生產區域的所有機器。
生產區域的機器通過“NAT網關”大門實現對外網的訪問。
這樣的架構不但能夠清晰內、外網邊界,且“VPN”、“負載均衡”及“NAT”均在企業可管控范圍內,能夠做到事前有審批、事中有監控、事后可審計。生產區域做網段隔離,為不同業務分配不同網段,使業務與業務之間通過網段借用云產品的安全組實現隔離,以此形成上云的統一規范。
從IDC到云,紅利顯著
服務器、內存等均可按業務需求進行精確分配。
資源層面隔離使安全性更高、交付速度顯著提升。
通過上云控制成本、提升效率,不同角色都能夠形成安全與成本意識,提升DevOps協同。
Dev & Ops的使命和協同
通常情況下,產品和運營人員負責設計功能并對開發人員提出相應需求,開發完善后,由SRE進行部署、發現問題并處理,同時聯動運維側DBA、網絡、安全等人員。
開發看重效率,運維看重穩定,這其中必然會產生矛盾,二者的協同也離不開“效率”與“穩定”兩大使命。
降本增效,用數據讓業務看得見成效
作為深度參與游戲平臺上云的策略者,我們希望通過自身的努力整體呈現業務的穩定、安全、成本及效率。于是我們采取定期性的工作,如將成本運營的數據組織起來進行例會,查看并分析可用性數據、容量數據、安全數據及成本數據等。
如上圖所示,這是一張PV趨勢圖,可以看到數據平穩且具有一定的周期性,無突增或突降現象,說明整體業務在過去處于平穩運行中。
平穩運行的背后離不開充足的容量支持。如上圖所示,我們可以清晰看到總容量始終是實際業務峰值的5~7倍,且處在周期性的更新變化中。容量可控代表成本可控,這也為降本或增量提供了良好的決策依據,因此可以通過削減總容量的方式降低成本。
在安全層面,上層接入WAF后,若請求在經過時觸碰規則,便會觸發攔截。通過WAF攔截能夠在提升安全性的同時,使后端資源及成本得到極大釋放,實現資源利用率的提升。
上云為什么能省錢?
案例1:https證書卸載
IDC環境下,https卸載會占據極大的CPU資源。在上云后,所有的業務請求都會經過負載均衡,負載均衡在按照流量計費的同時,具有https證書卸載的功能,一次購買實現兩類功能,避免了在后端CPU資源上的成本消耗。
案例2:WAF攔截黑產
上云并定義WAF及相應規則后,非正常請求在前端就可以被攔截,后端資源不會被消耗。
當前,我們正處在IDC與云原生之間,微服務化并不能一步實現,因此我們遵循“兩步走”策略來擁抱云原生。
將虛擬機更換為云虛擬機架構。
在云上部署架構的基礎上向云原生轉型。
最后,對于上云究竟是在花錢還是省錢這一問題,不同階段的考量不同。IDC部署階段,由于中小企業基礎設施薄弱,需投入成本增強穩定性與安全性。云原生時期,計費模式帶來的成本消耗已作為產品選擇的一條標準早早被納入考量,除此之外,架構改造與云原生的結合能夠有效提升工作效率,為實現長期節約資源及成本提供了可能性。
【原動力×云原生正發聲降本增效大講堂】第一期聚焦在優秀實踐方法論、資源與彈性、架構設計;第二期聚焦全場景在離線混部、K8s GPU資源效率提升、K8s資源拓撲感知調度主題;第三期邀請4家業界知名企業分享各企業云原生降本增效技術實踐,為開發者帶來更多樣化場景業務下的技術干貨。點擊『此處』進入活動專題頁,帶你體驗云原生降本增效實踐案例、了解如何解決企業用云痛點、掌握降本增效關鍵技能……
關鍵詞: