了解最新公司動(dòng)態(tài)及行業(yè)資訊
之前我們介紹了農(nóng)行在分布式系統(tǒng)環(huán)境下運(yùn)維面臨的挑戰(zhàn)和困難,分布式運(yùn)維的建設(shè)模式,分布式系統(tǒng)下運(yùn)維工具的實(shí)施建議。但是,工具的建設(shè)并不意味著運(yùn)維轉(zhuǎn)型升級(jí)的成功。運(yùn)維體系建設(shè)需要科學(xué)的指導(dǎo)思想和系統(tǒng)的建設(shè)理念。
本文以經(jīng)典的運(yùn)維系統(tǒng)概念——SRE為例。通過(guò)對(duì)SRE主要內(nèi)容的分析,梳理一下SRE與運(yùn)維開發(fā)的關(guān)系。同時(shí),我們將通過(guò)對(duì)典型 SRE 落地案例的解讀與大家進(jìn)行講解。 SRE在金融行業(yè)的落地經(jīng)驗(yàn)。
01.SRE 主題演講內(nèi)容概覽1)什么是 SRE
首先,我們來(lái)看看SRE的幾個(gè)定義:
從單獨(dú)的角度來(lái)看,源自 Goole 的 SRE 的定義更適合其組織。首先,它擁有強(qiáng)大的人才庫(kù)。其次,經(jīng)過(guò)大量?jī)?nèi)部實(shí)踐,經(jīng)得起考驗(yàn)。同時(shí),由內(nèi)而外的推進(jìn)it運(yùn)維,推動(dòng)了這一制度的實(shí)施更加全面。但對(duì)于外企來(lái)說(shuō),全能型人才的稀缺和傳統(tǒng)觀念的固化,讓這個(gè)定義并不那么成立。
從國(guó)外公司本身的角度,我們更傾向于第三種:從實(shí)踐的角度來(lái)看,SRE的關(guān)鍵點(diǎn)就一個(gè)字:系統(tǒng)化,我們需要從全局的角度去更透徹的理解. SRE實(shí)際上需要多個(gè)團(tuán)隊(duì)、多個(gè)崗位來(lái)承擔(dān)不同的職能,但每個(gè)團(tuán)隊(duì)可以相互配合,對(duì)外對(duì)接業(yè)務(wù)團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì),建立工具實(shí)現(xiàn)日常運(yùn)維。
2)SRE 和關(guān)系
本質(zhì)上,SRE 與 SRE 并沒(méi)有太大的不同。它們都是從分布式、云原生、容器化、微服務(wù)等技術(shù)衍生出來(lái)的概念。我們可以將其理解為 SRE 核心概念的通用版本。相比之下,它更加具體,SRE是經(jīng)過(guò)具體實(shí)踐提煉出來(lái)的理論體系。
3)SRE指導(dǎo)思想和關(guān)鍵概念
SRE 有以下指導(dǎo)原則:
關(guān)于以上指導(dǎo)思想,我們可以把SRE的一些關(guān)鍵概念聯(lián)系起來(lái),讓我們對(duì)SRE體系有一個(gè)更清晰的認(rèn)識(shí)。
在關(guān)鍵概念上,主要分為四個(gè)層次
4)SRE職位/團(tuán)隊(duì)主要工作
了解了整個(gè)SRE體系的工作方式和技巧之后,具體的SRE團(tuán)隊(duì)在做什么內(nèi)容呢?主要分為以下三只藍(lán)籌股:
在這個(gè)過(guò)程中,我們可以得出下一個(gè)結(jié)論,即:運(yùn)維模式/系統(tǒng)的下一站是SRE,運(yùn)維技術(shù)的下一站是AIOps。
5)SRE 方法
在方法論層面,有以下幾個(gè)重點(diǎn):
02.SRE運(yùn)維平臺(tái)及運(yùn)維開發(fā)1)運(yùn)維管理平臺(tái):實(shí)現(xiàn)SRE運(yùn)維開發(fā)的基礎(chǔ)
SRE多次指出,運(yùn)維組織需要參與運(yùn)維工具的開發(fā),才能實(shí)現(xiàn)SRE的變革。在工具的開發(fā)上,傳統(tǒng)公司和互聯(lián)網(wǎng)公司會(huì)有很大的不同。
因此,對(duì)于大多數(shù)企業(yè)來(lái)說(shuō),要實(shí)現(xiàn)SRE運(yùn)維開發(fā)it運(yùn)維,需要一個(gè)統(tǒng)一的基礎(chǔ)——具備通用的能力和通用的開發(fā)框架,同時(shí)提供統(tǒng)一的資源管理和資源驅(qū)動(dòng)能力。在此基礎(chǔ)上統(tǒng)一管理上層資源,實(shí)現(xiàn)數(shù)據(jù)接入和能力擴(kuò)展,下層通用能力框架實(shí)現(xiàn)工具化開發(fā)、可控增長(zhǎng),構(gòu)建完整的平臺(tái)化運(yùn)維開發(fā)體系.
包括幾個(gè)典型場(chǎng)景:
CMDB——SRE運(yùn)維管理體系的基石,構(gòu)建消費(fèi)驅(qū)動(dòng)、可見、可用、可信、可靠的運(yùn)維優(yōu)質(zhì)CMDB,支撐運(yùn)維發(fā)展改革。
可觀察性 - 幫助 SRE 實(shí)現(xiàn)全鏈路跟蹤和問(wèn)題根源定位。根據(jù)平臺(tái)建立trace、log、關(guān)聯(lián)分析鏈接,實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一處理。
手動(dòng)編排引擎 - SRE 手動(dòng)操作和維護(hù)的機(jī)會(huì)。人工場(chǎng)景的構(gòu)建需要底層引擎的支持,調(diào)用基礎(chǔ)能力建立下層人工體系,支持SRE工具能力的擴(kuò)展。
03.SRE對(duì)金融行業(yè)的介紹1)落地案例分析
以國(guó)外某小型建設(shè)銀行的SRE實(shí)踐為例,其SRE落地過(guò)程有以下幾個(gè)關(guān)鍵點(diǎn):
①確定SRE落地的核心概念:
符合常年戰(zhàn)略,提升運(yùn)維自動(dòng)化重復(fù)性工作,完善SRE團(tuán)隊(duì),提升運(yùn)維價(jià)值。
②組建SRE試點(diǎn)團(tuán)隊(duì):
包括組長(zhǎng)、輪值組長(zhǎng)、業(yè)務(wù)核心技術(shù)人員,以及其他部門的助理,對(duì)應(yīng)的人員從不同的團(tuán)隊(duì)中挑選出來(lái),保證大家對(duì)建設(shè)目標(biāo)有清晰的認(rèn)識(shí)SRE 并為其做出貢獻(xiàn)。
③SRE工作模式:采取和平與戰(zhàn)爭(zhēng)相結(jié)合的模式。
戰(zhàn)時(shí)應(yīng)急依賴于常用的施工工具、自動(dòng)化能力、問(wèn)題總結(jié)等,形成了平時(shí)與戰(zhàn)時(shí)相結(jié)合的工作模式。
④SRE團(tuán)隊(duì)OKR:
團(tuán)隊(duì)OKR的制定與工作模式緊密配合。通過(guò)平時(shí)與戰(zhàn)時(shí)結(jié)合,可以看到全景業(yè)務(wù)系統(tǒng),可以管控應(yīng)急響應(yīng),可以計(jì)算分析業(yè)務(wù)指標(biāo)。同時(shí),SRE團(tuán)隊(duì)建立了周會(huì)、月會(huì)、專題會(huì)三會(huì)機(jī)制,確保日常工作和特殊問(wèn)題的快速處理。
目前,該行的SRE實(shí)踐比較成功。其核心在于SRE團(tuán)隊(duì)的建立。一方面,開發(fā)商需要介入。核心業(yè)務(wù)人員必須懂發(fā)展,懂結(jié)構(gòu),有經(jīng)營(yíng)和維持發(fā)展的能力。另一方面,要有組織能力。將SRE建設(shè)目標(biāo)分解為各個(gè)團(tuán)隊(duì),實(shí)現(xiàn)人員之間能力的整合,形成系統(tǒng)化的組織,推動(dòng)整個(gè)SRE流程。
此外,我們還對(duì)多家企業(yè)的SRE流程和實(shí)施實(shí)踐進(jìn)行了詳細(xì)深入的分析,包括農(nóng)業(yè)建設(shè)銀行、騰訊、美圖等,感興趣的請(qǐng)點(diǎn)擊了解更多!
2)經(jīng)驗(yàn)分析
①SRE適合落地金融行業(yè)嗎?
SRE 是一個(gè)系統(tǒng)化的過(guò)程。從組織架構(gòu),到文化推廣,到工具的建立,到人員能力的提供,都會(huì)產(chǎn)生一個(gè)完整的SRE體系。
我們建議我們可以先專注于其中一個(gè)方向,例如將工具移近平臺(tái)級(jí)別。同時(shí),如果有余力,可以考慮建設(shè)一部分運(yùn)維開發(fā)能力。除了組織能力,還可以適當(dāng)培養(yǎng),讓它一步步走向SRE,而不是一飛沖天。
②如果要落地,需要注意什么?
主要有三點(diǎn):
標(biāo)準(zhǔn)規(guī)范制定:標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)化是完善系統(tǒng)的第一步。運(yùn)維的標(biāo)準(zhǔn)規(guī)范必須與開發(fā)和業(yè)務(wù)保持一致。
具備軟件開發(fā)能力:只有將運(yùn)維需求轉(zhuǎn)化為運(yùn)維產(chǎn)品,運(yùn)維產(chǎn)品最終實(shí)現(xiàn)為具體的工具和系統(tǒng)。
組織變革:SRE是運(yùn)維和開發(fā)能力的結(jié)合。它需要一些懂開發(fā)的運(yùn)維人員和一些懂運(yùn)維系統(tǒng)的開發(fā)人員。運(yùn)維和開發(fā)需要互相了解,然后結(jié)合對(duì)方的需求到自己的工作中。
24小時(shí)免費(fèi)咨詢
請(qǐng)輸入您的聯(lián)系電話,座機(jī)請(qǐng)加區(qū)號(hào)