インシデント対応に関する覚書
インシデント対応の大半は「待つ」ことであり、多くの障害は自然に回復する。しかしエンジニアは焦って対処し、かえって事態を悪化させがちだ。有効な対応は「何もしない」ことから始め、システム知識に基づいてシンプルな変更(機能フラグの無効化など)を行うことにある。インシデント解決は政治的な信用を買うが、それだけを頼みにすると持続可能な立場にはならない。
インシデント対応の大半は「待つ」ことであり、多くの障害は自然に回復する。しかしエンジニアは焦って対処し、かえって事態を悪化させがちだ。有効な対応は「何もしない」ことから始め、システム知識に基づいてシンプルな変更(機能フラグの無効化など)を行うことにある。インシデント解決は政治的な信用を買うが、それだけを頼みにすると持続可能な立場にはならない。