我是一个自驱开发人员,管理着一个小型应用,背景环境/ API,并且在生产环境中(API 错误、服务器问题等)经常会遇到同一个问题。

每当在生产环境中某处出现问题(API 错误、服务器问题等),我并没有一个清晰明确的“第一步”。
我通常会跳来跳去,查看日志、仪表盘以及随机检查,一直到确定如何下一步为止,这就花费了太多的时间。

我知道经验丰富的工程师可能会背誓有一个心中的清单或流程来解决这些问题,但我觉得自己一直在反应性地应对问题。

因此,我开始用简单的流程来指引自己在遇到这些情况时的下一步——实际上是一种轻量级的方式来回答“接下来应该检查什么?”

在继续往下的时候,我想先问:

  • 你们是否有一个可重复的流程当你们的背景环境崩溃时?
  • 或者你们更多地依靠经验或直觉?
  • 那些时刻通常最容易引起困惑的是什么?

(特别想知道你们是否在开发游戏/应用时)

我也有一份非常粗糙的demo,有兴趣分享看看会不会有帮助。

非常感激任何建议 🙏

https://reddit.com/link/1srdt7n/video/mi1zr12o3hwg1/player