このエピソードでは、Thomas Betts氏がMicha "Mies" Hernandez van Leuffen氏とオブザーバビリティとインシデント、そして開発者、SRE、その他のチームメンバーの役割について話す。一つの課題は、そもそもどのようなメトリクスを追跡すべきかを知ることだ。開発者ファーストのオブザーバビリティへのアプローチとは、アプリケーションに特化したメトリクスにフォーカスすることを意味する。
キーポイント
- システムのオブザーバビリティのための一般的な最初のステップは、ダッシュボードを作成することである。しかし、ダッシュボードはCPUやメモリなどの既知のメトリクスを追跡するようにあらかじめ設定されているため、アクティブな問題を調査するのにはあまり役に立たない。
- ダッシュボードは、システムがダウンしている理由や、アクティブなアラートの緊急度を教えてくれない。
- 調査ニーズにとって、オブザーバビリティはむしろデータサイエンスの問題である。
- Autometricsは、開発者が一般的な機能レベルのメトリクスを簡単に追加できる、オブザーバビリティのためのオープンソースのフレームワークである。
- そもそも何を追跡すべきかを理解するために時間をかけることは、インシデント・サポート・プロセスを改善するための最善のアドバイスである。
購読する
&nbsh;