課程簡介
歡迎踏上《SLO兵法》的探索之旅,一場引領(lǐng)你進(jìn)入Site Reliability Engineering(SRE)精髓的深度學(xué)習(xí)之旅。這門課程將為你揭示系統(tǒng)穩(wěn)定性的奧秘,為構(gòu)建可靠、穩(wěn)定、安全的服務(wù)打開全新的思維之門。
為何選擇《SLO兵法》?
這不僅僅是一門課程,更是通往業(yè)務(wù)系統(tǒng)可靠性和可觀測性的鑰匙。對于所有希望在生產(chǎn)環(huán)境領(lǐng)域取得卓越業(yè)務(wù)戰(zhàn)績的你,《SLO兵法》將成為你事業(yè)道路上的重要里程碑。
目標(biāo)收益
1.在組織中對SRE相關(guān)的核心理念基礎(chǔ)、SLO實(shí)踐流程達(dá)成高度一致和認(rèn)同
2.詳細(xì)了解在組織中為業(yè)務(wù)系統(tǒng)制定 SLO的詳細(xì)實(shí)施的方式
3.徹底梳理SRE知識體系結(jié)構(gòu)和最相關(guān)的重要技術(shù)實(shí)踐
4.對SLO的實(shí)施過程和相關(guān)案例做針對性的研討
培訓(xùn)對象
1、DevOps工程師、SRE工程師
2、開發(fā)人員、應(yīng)用架構(gòu)師、服務(wù)交付經(jīng)理
3、產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理、一線運(yùn)維經(jīng)理
4、敏捷教練,DevOps教練
課程大綱
第一模塊: 對齊 SRE 中與 SLO 相關(guān)的術(shù)語概念 |
1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學(xué)員對這兩個關(guān)鍵術(shù)語有清晰準(zhǔn)確的理解。 2.SLO 與客戶體驗(yàn)之間的關(guān)系:探討 SLO 與客戶體驗(yàn)之間的緊密聯(lián)系,幫助學(xué)員建立起對服務(wù)質(zhì)量目標(biāo)與最終用戶體驗(yàn)之間的敏感性 |
第二模塊: 業(yè)務(wù)系統(tǒng)為何需要 SLO ? |
1.可靠性是應(yīng)用系統(tǒng)的最重要特性:強(qiáng)調(diào)應(yīng)用系統(tǒng)可靠性的至關(guān)重要地位,為學(xué)員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。 2.深入理解 SLO 目標(biāo)數(shù)值的設(shè)定原則:深入研究 SLO 目標(biāo)數(shù)值的設(shè)定流程,引導(dǎo)學(xué)員理解背后的原則與方法,以確保系統(tǒng)的運(yùn)行水平符合組織的期望。 |
第三模塊: 使用錯誤預(yù)算 |
1.理解錯誤預(yù)算的概念和應(yīng)用:解讀錯誤預(yù)算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學(xué)員理解如何通過錯誤預(yù)算合理管理業(yè)務(wù)系統(tǒng)風(fēng)險。 2.錯誤預(yù)算與運(yùn)維操作和監(jiān)控告警的關(guān)系:深入研究如何運(yùn)用錯誤預(yù)算進(jìn)行運(yùn)維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務(wù)系統(tǒng)發(fā)生關(guān)鍵異常時能夠準(zhǔn)確、迅速的響應(yīng)。 |
第四模塊: 實(shí)戰(zhàn)演練 - 實(shí)施SLO案例實(shí)戰(zhàn) |
1.閱讀學(xué)員手冊:引導(dǎo)學(xué)員仔細(xì)閱讀學(xué)員手冊,以建立對實(shí)操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學(xué)員能夠理解并分組準(zhǔn)確執(zhí)行實(shí)際操作。 3.小組工作成果展示:學(xué)員展示他們在演練案例中所完成的成果,促進(jìn)知識分享與團(tuán)隊(duì)協(xié)作。 |
第五模塊:綜合答疑&總結(jié) | 回答學(xué)員提出的問題,深化對課程內(nèi)容的理解,并進(jìn)行全面總結(jié),確保學(xué)員能夠充分領(lǐng)會并應(yīng)用所學(xué)的關(guān)鍵概念。 |
第一模塊: 對齊 SRE 中與 SLO 相關(guān)的術(shù)語概念 1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學(xué)員對這兩個關(guān)鍵術(shù)語有清晰準(zhǔn)確的理解。 2.SLO 與客戶體驗(yàn)之間的關(guān)系:探討 SLO 與客戶體驗(yàn)之間的緊密聯(lián)系,幫助學(xué)員建立起對服務(wù)質(zhì)量目標(biāo)與最終用戶體驗(yàn)之間的敏感性 |
第二模塊: 業(yè)務(wù)系統(tǒng)為何需要 SLO ? 1.可靠性是應(yīng)用系統(tǒng)的最重要特性:強(qiáng)調(diào)應(yīng)用系統(tǒng)可靠性的至關(guān)重要地位,為學(xué)員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。 2.深入理解 SLO 目標(biāo)數(shù)值的設(shè)定原則:深入研究 SLO 目標(biāo)數(shù)值的設(shè)定流程,引導(dǎo)學(xué)員理解背后的原則與方法,以確保系統(tǒng)的運(yùn)行水平符合組織的期望。 |
第三模塊: 使用錯誤預(yù)算 1.理解錯誤預(yù)算的概念和應(yīng)用:解讀錯誤預(yù)算的概念,著重探究其與 SLO 密切的邏輯關(guān)系,幫助學(xué)員理解如何通過錯誤預(yù)算合理管理業(yè)務(wù)系統(tǒng)風(fēng)險。 2.錯誤預(yù)算與運(yùn)維操作和監(jiān)控告警的關(guān)系:深入研究如何運(yùn)用錯誤預(yù)算進(jìn)行運(yùn)維操作的優(yōu)化,以及如何構(gòu)建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務(wù)系統(tǒng)發(fā)生關(guān)鍵異常時能夠準(zhǔn)確、迅速的響應(yīng)。 |
第四模塊: 實(shí)戰(zhàn)演練 - 實(shí)施SLO案例實(shí)戰(zhàn) 1.閱讀學(xué)員手冊:引導(dǎo)學(xué)員仔細(xì)閱讀學(xué)員手冊,以建立對實(shí)操案例的基本理解。 2.講解小組工作流程:解釋小組工作流程,確保學(xué)員能夠理解并分組準(zhǔn)確執(zhí)行實(shí)際操作。 3.小組工作成果展示:學(xué)員展示他們在演練案例中所完成的成果,促進(jìn)知識分享與團(tuán)隊(duì)協(xié)作。 |
第五模塊:綜合答疑&總結(jié) 回答學(xué)員提出的問題,深化對課程內(nèi)容的理解,并進(jìn)行全面總結(jié),確保學(xué)員能夠充分領(lǐng)會并應(yīng)用所學(xué)的關(guān)鍵概念。 |