《凤凰项目:一个IT运维的传奇故事》读书心得

本书主要讲述IT运维如何为了达到企业目标,通过借用工厂管理的约束理论、精益生产以及全面质量管理的理论,来改进IT的运维。
像作者说的,CEO和CIO的关系被描述为一场不和谐的婚姻,也就是说双方都感到无能为力,并感到自己被另一方所挟持。作者通过将故事的方式,把主人公在与CEO斗智斗勇的过程中,借助三步工作法,使IT的价值得到了体现,间接的也让业务的价值得到了体现。


三步工作法脑图

文章摘要

  • 作为IT运维部,主要的工作是确保形成一条迅速、可预测、持续不断的计划内工作流,从而向业务部门交付工作价值,同时尽可能降低计划外工作的影响与破坏,那样IT运维部才能提供稳定的、可预期的、安全的IT服务
  • 管理运动:约束理论、精益生产或者丰田生产系统,以及全面质量管理。虽然每个运动的起源地各不相同,但他们都赞成一点:半成品是个隐形杀手。因此,管理任何一家工厂最关键的机制之一,就是工作任务和原材料的发布。没有这个机制,就无法控制半成品。
  • 像工厂经理那样去思考(跨越IT部门和业务部门的界限)。他们着眼于整个工作流,确认约束点的位置,并且尽其所能地运用各种技术和流程知识来确保工作得到有效执行。
  • 《团队发展的五大障碍》中提到,想要在团队中达到互相信任,你需要展现出自己脆弱的一面。
  • 举办了弱点分享会,分享自己最脆弱的故事,去掉身上的盾牌。分享最多的、最感人的还是发生在家人身上的故事。
  • 开发提供代码、基础架构要求(硬件参数、配置参数、网络、防火墙等)
  • 控制IT运维部的工作导入量,确保绝大多数受约束的人力资源都只能投放在为整个系统的目标所服务的工作上,而不只是为了一个部门的目标服务。
  • 这也是一种系统思维,始终确保整个企业达成共同的目标,而不只是其中的一部分。
  • 相比于向系统中投入更多的工作,将无用的工作剔除出系统更为重要。
  • 变更就是对应用程序、数据库、操作系统、网络或硬件进行的物理、逻辑或虚拟操作,并且这样的操作可能对相关服务产生影响。
  • 80%的风险是由20%的变更产生的,需要对变更按照风险进行分类,对不同类别进行不同的授权。
  • 工作计划表:工作的分类,工作需求,优先级,工作进度,可用资源
  • 不应该根据第一个工作站的效率来安排工作,而是根据瓶颈资源所能完成的工作的速度来安排工作。
  • 关键资源所从事的任何活动都必须通过看板,不可以通过电子邮件、即时信息、电话,诸如此类的渠道。
  • 变更管理:按照风险分类、合规审计系统分类的变更授权管理
  • 你最希望我做什么?最不希望我做什么?
  • 我强迫自己深吸一口气......我缓缓的点头,不上她的当。“我期待你提出的任何建议。” ... 我在心里默数三下才开口。
  • 总是IT运维部在通宵达旦地为那些糟糕的代码埋单,每隔一小时重启一次服务器,就像电影里的超级英雄那样,尽可能向世人隐瞒糟糕的真相。
  • 日期驱动的项目。
  • 追求完美是成事的大敌。
  • 这种全员出动的工作状态是IT人的生活的一部分。
  • ITIL代表IT基础架构库,记录着许多最好的IT实践和流程。
  • 事故及故障修复工作,占用了运维员工大概75%的工作时间,并且这些常常涉及关键业务系统,优先级最高。...导致总是无法把精力集中到对公司最为重要的事情上。
  • 创建约束理论的艾利·高德拉特告诉我们,在瓶颈之外的任何地方做出的改进都是假象。...在瓶颈之前做出的任何改进只会导致瓶颈处堆积更多的库存。
  • 汇报的时候,一要做演练,二要考虑各种可能的应对,并且要考虑最坏的情况。就像足球比赛,要考虑领先、落后、落后几个球的打法等等,做到有备无患。
  • 在发射的当口,他们还在往太空飞船上安装零件,这可不是个好兆头。
  • 提出问题的同时,最好有理有据,然后带着解决方案来汇报。 而不只是嚷嚷,我早就告诉过你了。
  • 就像免费赠送的小狗,搞死你的不是前期的投入,而是后台的运行和维护。(总体拥有成本)
  • 她就像个不粘锅,什么都粘不到她的身上。
  • 合作而不是对立,人情往来的重要性。
  • 预防措施有个问题,就是你很少能知道自己究竟避开了哪些灾难。
  • 开发部把所有的工作周期都花在了功能开发,而没有用在稳定性、安全性、可扩展性、可维护性、可操作性、持续性以及诸如此类的美好性能上。
  • 故障报告:故障时间线(含场景)
  • IT很重要。公司的每一项重大活动都有IT的参与,而且IT对日常运作的方方面面起到关键作用。... IT不只是一个部门,IT是我们在整个公司层面需要发展的一种能力。
  • 当每个人都习惯于相信,说“不”是不能够接受的回答,我们就都成了百依百顺的接单员,盲目地按照既定路线办事。...我们付给你们工资,是为了让你们思考,而不是执行。
  • 管理就是为了达到业务目标,有效组织以及激发员工,体系的完成工作。
  • 可以得到他人诚实的反馈也是一种恩赐。
  • CFO的工作职责:管理公司财务风险、领导财务计划和运营流程。
  • 和高层打交道时,告诉他们坏消息要找适当的时机、适当的场合。
  • 5W1H:
    高层思维
    Why:目的, 达成公司的目标
    What:做什么,把业务的重要评估指标作为IT任务的前提条件
    具体行动
    How: 包括 Who、When、Where等。
  • 他终于把头从头从屁股上抬起来,开始正眼看这个世界了。
  • 再没什么比吐槽IT更能让人团结一致了。
  • 访谈:业务的考核指标是什么,完成考核指标有哪些困难,IT在其中有没有什么障碍,IT可以提供什么样的帮助。
  • 技术改变也要工作方式的改变,不然不会真正减少工作上的桎梏。
  • 在IT部门创建一个向前的工作系统,记住,目标是单一工作流!一旦看到工作向后移动,我就会想到浪费,想到不合格品。
  • 也许IT工作比生产制造复杂得多。IT工作不仅是无形的,因此更难追踪,而且可能出错的地方也要多得多。
  • 把环境标准化,支持同一时刻构建开发、QA、生产环境,并且让他们保持同步。 在部署的时候,开发除了提供代码(最好是打包好的代码),还需要提供部署这些代码需要的确切环境,并且在版本控制中一并对部署环境的情况进行检查。
  • t+1的大规模运算可以考虑放云端。
  • 库存型生产 订单型生产
  • 游的开发团队不再给下游的工作(比如QA、IT运维以及信息安全部)造成麻烦,开发部将20%的时间用于帮助确保工作顺利地通过整个价值流,加快自动化测试,改进部署基础架构,并确保所有应用程序建立有用的产品遥测。...每个人都像重视功能性需求一样重视非功能性要求。...因为非功能性需求对于实现业务目标同样重要。
  • 开发运维(DevOps)是在IT价值流中应用精益理论的结果
  • 我现在的愿望是,在生活的各方面,都不要惧怕冲突,不怕说出真相,不怕说出真实的想法。当然,完全做到这些是痴心妄想,但我认为这仍然是一个有价值的目标。
  • Wip WIP(Work In Process,在制品)
    WIP的意思即为Work In Process ,也就是在制品的意思。在制品指的是正在加工,尚未完成的产品。有广狭二义:广义的包括正在加工的产品和准备进一步加工的半成品;狭义的仅指正在加工的产品。