课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 程序员/架构师,SRE/DevOps爱好者,致力于软件开发、提升组织效能

  • 咨询顾问,DevOps和敏捷、精益IT认证讲师,凤凰沙盘教练,专注项目实践和组织转型,SRE爱好者

  • 互联网IT管理领域资深实战专家,具备超过15年IT服务管理以及开发运维一体化咨询领域工作和讲师经历。作为国内SRE第一批实践者,具备甲方乙方、外企国企的咨询经验。 为招商银行、平安银行、华夏银行、国家开发银行、上海银行、郑州银行、IBM、中国惠普、埃森哲、中国移动、中国电信等提供过专业服务。

  • 某大型机构首席技术官。负责领导研发团队设计,开发和交付技术解决方案。曾担任某机构中国区云计算首席架构师。

  • 课程详情

    第16章 跟踪故障——谷歌的如何跟踪故障,有哪些最佳实践;

    一、跟踪故障 – 为什么使用故障跟踪系统

    1、提高可靠性的唯一可靠的方法论就是,建立一个基线,同时不断跟踪改变。

    Outalator – 一个故障跟踪工具,被动收集监控系统发出的所有警报,同时提供标记、分组和数据分析功能。

    2、系统性地从发生过的问题中学习,是服务运维的必要手段。

    事后总结 – 单个故障详细信息(影响非常大的故障)

    故障跟踪工具 可以跟进从全局看非常有用,但是对单个故障不那么划算的改进讨论。

    二、跟踪故障 – Escalator 报警通知系统
    三、跟踪故障 – Outalator – 聚合
    四、跟踪故障 – 未预料到的好处


    第17章 为可靠性而测试——软件测试和大规模测试在谷歌SRE团队的实践;
    一、为什么SRE也使用软件测试技术?
    二、SRE使用哪类软件测试?
    三、大规模测试在SRE团队的应用


    第18章  SRE部门中的软件工程实践——软件工程给SRE部门带来的收益及如何在SRE团队培养软件工程风气;
    一、为什么软件工程对SRE很重要?
    二、Auxon案例分析
    三、解决方案:基于意图的容量规划
    四、在SRE团队中培养软件工程风气


          

     

    温馨提示
    • 请勿私下交易
      请勿在平台外交易。与机构和老师私下交易造成的任何损失及纠纷,腾讯课堂不承担任何责任
    • 听课说明

      1、电脑:访问腾讯课堂官网 ke.qq.com 查看我的课表或下载win/mac客户端听课

      2、手机/平板:下载腾讯课堂APP, 进入学习页面听课