概要
オブザーバビリティの最前線 from Software Designに参加しました。 感想を記述します。
参加理由
オブザーバビリティ(o11y)に関心があるため、参加しました。
セッション感想
「OpenTelemetry の Log を使いこなそう」
newmo の Shota Iwami さんの発表でした。
OpenTelemetry(OTel)の 3 つのシグナルの 1 つですが、トレースとメトリクスと異なり、あまり触れられないログについて解説した発表でした。
ログはほかの 2 つのシグナルよりも仕様の決定が遅かったことから、多くの言語で Stable になっていないこともあり、情報が少ない印象をもっていました。 その中で、知見共有の発表を聞けて、非常に勉強になりました。 特に、既存のログをラップするだけでトレース ID を自動的に attribute に追加したり、otel-tui でも見れるようになったことに驚嘆しました。 Bridge 機能を活用することで、既存のロギングライブラリを変更することなく OTel のエコシステムに統合できる点は、段階的な導入を検討している組織にとって大きなメリットだと感じました。
「なぜあなたのオブザーバビリティ導入は頓挫するのか」
New Relic の Ryotaro さんの発表でした。
主題の通り、なぜオブザーバビリティ導入が失敗するのかについてです。 発表では、3 つの壁(予算の壁、組織の壁、文化の壁)が導入を阻み、予算の神を説得するための手段について解説していました。 どの説明も明瞭で納得感があり、おもしろかったです。 その中でも特に、成熟度モデルを参考にしつつも順序にこだわらず、ゴールから逆算して取り組むといった姿勢に非常に共感しました。 実際の導入現場では、理想論だけでなく現実的な制約と向き合う必要があり、ビジネス価値を明確にして段階的に進めるアプローチは、多くの組織で参考になると思いました。
「Prometheus Native Histogram の現状」
サイボウズの Ikezoe さんの発表でした。
従来の Histogram の課題を克服しようとしている、Native Histogram の解説でした。
従来の Histogram ではバケットが固定位置だったり、バケットを増やすとカーディナリティが上がり、ストレージを圧迫します。
Native Histogram では観測した値に応じてバケットの分割を動的に決定することで、それらの課題を解決するといった内容です。
私は Grafana の Visualization や Expression に詳しくありませんが、解説が非常に丁寧でわかりやすく、理解しやすかったです。
まだ、Experimental とのことですが、より精度の高いレイテンシ分析が可能になることで、システムの問題箇所を特定しやすくなる点が非常に実用的だと感じました。
勉強会の全体的な感想
どの発表も o11y に関わる内容で楽しめました。 特に、直近の OTel の事情について非常に勉強になりました。
一方で、自身の o11y や OTel の知識不足をあらためて実感しました。 o11y 系の書籍を読んだり、引き続き勉強会に参加することで、知識を獲得していきます。 今回学んだ OTel Logs の Bridge 機能や Native Histogram については、早い段階で実際に手を動かして試してみることで、より深い理解につなげたいと考えています。