SRE技术实战分享

2人 购买 好评度 - 收藏
  • SRE技术实战分享
更多班级

SRE技术实战分享

支持随到随学,24年07月过期

¥53.22

本班因教学质量问题暂时不能报名。 查看详情

课程因违反平台规定暂时不能报名。

立即购买

课程概述

目录

评论

老师介绍

  • 王老师

    王老师

    程序员/架构师,SRE/DevOps爱好者,致力于软件开发、提升组织效能
  • 张老师

    张老师

    咨询顾问,DevOps和敏捷、精益IT认证讲师,凤凰沙盘教练,专注项目实践和组织转型,SRE爱好者
  • 牛老师

    牛老师

    互联网IT管理领域资深实战专家,具备超过15年IT服务管理以及开发运维一体化咨询领域工作和讲师经历。作为国内SRE第一批实践者,具备甲方乙方、外企国企的咨询经验。 为招商银行、平安银行、华夏银行、国家开发银行、上海银行、郑州银行、IBM、中国惠普、埃森哲、中国移动、中国电信等提供过专业服务。
  • 大猫~

    大猫~

    某大型机构首席技术官。负责领导研发团队设计,开发和交付技术解决方案。曾担任某机构中国区云计算首席架构师。
简  介 第16章 跟踪故障 谷歌的如何跟踪故障,有哪些最佳实践; 第17章 为可靠性而测试 软件测试和大规模测试在谷歌SRE团队的实践; 第18章 SRE部门中的软件工程实践 软件工程给SRE部门带来的收益及如何在SRE团队培养软件工程风气;

第16章 跟踪故障——谷歌的如何跟踪故障,有哪些最佳实践;

一、跟踪故障 – 为什么使用故障跟踪系统

1、提高可靠性的唯一可靠的方法论就是,建立一个基线,同时不断跟踪改变。

Outalator – 一个故障跟踪工具,被动收集监控系统发出的所有警报,同时提供标记、分组和数据分析功能。

2、 系统性地从发生过的问题中学习,是服务运维的必要手段。

事后总结 – 单个故障详细信息(影响非常大的故障)

故障跟踪工具 可以跟进从全局看非常有用,但是对单个故障不那么划算的改进讨论。

二、跟踪故障 – Escalator 报警通知系统
三、跟踪故障 – Outalator – 聚合
四、跟踪故障 – 未预料到的好处


第17章 为可靠性而测试——软件测试和大规模测试在谷歌SRE团队的实践;
一、为什么SRE也使用软件测试技术?
二、SRE使用哪类软件测试?
三、大规模测试在SRE团队的应用


第18章  SRE部门中的软件工程实践——软件工程给SRE部门带来的收益及如何在SRE团队培养软件工程风气;
一、为什么软件工程对SRE很重要?
二、Auxon案例分析
三、解决方案:基于意图的容量规划
四、在SRE团队中培养软件工程风气


      

 

资料下载报名后支持下载

* 课程提供者:雅菲奥朗

老师还为你推荐了以下几门课程