切尔诺贝利的教训

1986年4月26日当地时间01:23:40,乌克兰苏维埃社会主义共和国VI列宁核电站的总工程师Alexander Akimov按下了导致世界上最严重的核事故的按钮。 它仍然是国际核事件规模上仅有的两起7级事故之一,另一起是福岛第一核电站。

我目前正在重新阅读安德鲁· 莱瑟鲍罗 (Andrew Leatherbarrow)撰写的关于灾难的书, 切尔诺贝利(Chernobyl)01:23:40 。 多年来,我已经读过一些有关事故的信息,因为这是我童年时期最重要的事件之一,但是像作者一样,我感到沮丧的是,大多数文章和书籍都只是该事件的一个方面,大部分是清理操作或环境影响。 但是,他将这种挫败感转化为一本书,试图解释导致按下该按钮以及后果的物理学,政治和历史。

我为他所做的一切感到特别高兴,因为他为敏捷实践者提供了很多经验教训。 现在,我并不是说敏捷可以阻止爆炸,但是它肯定会以灾难性的形式显示出,如果我们不遵循良好的做法会发生什么。

在开篇中,莱瑟鲍罗(Leatherbarrow)提到了较早的三英里岛事故,并引用了总统委员会的报告:

在许多方面都缺乏控制室,通过该控制室执行[反应器]的操作。 控制面板巨大,有数百个警报,并且一些关键指示器放置在操作员看不到的位置……在事故发生的前几分钟,发出了100多个警报,并且没有任何系统可以抑制不重要的信号,以便操作员可以将精力集中在重要的警报上。

-主席约翰·凯梅尼(Kemene)。 总统三英里岛事故委员会报告。 华盛顿特区,USGPO,1979。

因此,糟糕的用户体验并不想让自己变得轻率,导致了三英里岛事故。 想象一下如果在紧急情况下与用户一起对控制面板进行了测试,情况会是多么不同。

这段话使我重新阅读了这本书。

一点历史

从根本上讲,切尔诺贝利核电站使用的RBMK反应堆设计如果不严格控制参数,将是危险的设计,并且与西方国家建造的反应堆不符。 莱瑟鲍罗(Leatherbarrow)详细介绍了这一点,我不再赘述。 但例如,该设计避开了常规压力容器,并且安全壳建筑的设计不足以根据国际标准来考虑。

切尔诺贝利灾难并不是涉及RBMK反应堆的第一起事故。 距维尔纽斯约100公里的圣彼得堡(当时的列宁格勒)和立陶宛伊格纳利纳的RBMK反应堆发生事故的报道在包括克格勃在内的各部委之间传递,最终被当权者忽略。 确实,1986年的灾难甚至不是切尔诺贝利的第一起事故。 1982年在反应堆1中发生了部分熔化。这也被掩盖了。

如果连克格勃都无法让人们采取行动来修复潜在危险的设计,那么该生态系统的文化就出了问题。 暂时考虑一下苏联的文化很重要(年轻的读者不妨问问他们的父母)。

尽管有平等的职业,苏联天生就是等级制的,挑战上级并不是一件好事,因为这会带来后果 。 因此,这些报道被刷在地毯下,没有被提及,尤其是对局外人。 除非高层管理人员首先要他们,否则就不能要求对安全性进行重大改进。 一个人无法辜负上级的任职,所以偷工减料到处都是。 为早日实现目标(例如在建设项目中)而设立的奖励和奖金制度加强了这一点。

这种文化导致从未进行过的测试未完全完成,因此切尔诺贝利可以按时开放。 令人难以想象的是,一个享有盛誉的项目可能会被推迟。 这会给国家和相关人员带来耻辱。

4月26日,当地时间01:23:40,在一个系统中按下了一个按钮,该系统以前的事故被忽略了,报告被锁在抽屉中,人们被要求保持安静,允许进行危险的设计危险 那个无辜的纽扣导致191,500平方公里的欧洲受到历史上最严重的爆炸袭击。 普里皮亚季的许多周边地区仍然具有放射性。

我正在上的课

敏捷的工作促进了扁平化团队,透明度和信息共享。 这是陈旧的,但可以想象如果建立和运营切尔诺贝利的生态系统更加开放会发生什么。 报告将被共享并采取行动,个人在安全改进方面将拥有平等的发言权和更大的声音。 甚至测试本身(由缺乏经验的夜班人员进行,交接不佳)也可能没有进行,因为相关人员将不必担心对上级拒绝。

我们已经一次又一次地看到-在医疗,犯罪和警务方面,您几乎希望提及生活的任何部分。 他们为什么不听? 为什么这些事情不断发生?

在工作中,我鼓励团队中的每个人都说出来。 如果一个人有问题,那么我们所有人都会有问题。 我们交谈,我们分享,我们达成妥协。 我们分享自己的失败,以便其他人可以向我们学习。 我们抵制那些试图使我们沉默的人。

这听起来有点过于戏剧化了; 我正在从事软件和服务设计,而不是核电站。 但是,从上个月在DeliverCon18上与同事交谈以来,这是许多敏捷从业人员日复一日面临的现实问题。 共享信息被视为一种选择,而不是日常工作的一部分。 它是对等完成的,而不是角色对角色的,因此,如果一个人离开,系统就会崩溃。 高级管理人员不愿分享任何负面的东西,而不是扭转现状并分享正面的教训。 这确实需要改变,这样我们就不再说他们为什么不听? 为什么这些事情不断发生?

共享信息并增强人们的能力可以真正挽救生命。 无论大小如何,都要正确执行并防止灾难。 这对我来说足够了。