msksgm’s blog

msksgm’s blog

Webエンジニアです。日々の勉強記録、技術書感想、美術観賞感想を投稿します。

SRE NEXT 2023 参加感想

概要

SRE NEXT 2023」に現地参加しました。 感想を書きます。

sre-next.dev

前提

参加目的

SRE NEXT に興味を持ち、参加した理由は 2 つあります。 1 つめは、個人的な注力分野として SRE を掲げていたため、勉強の一環として勉強会を探していたからです。 2 つめは、SRE 関連の書籍は海外事例が多く、日本企業の事例を知りたかったためです。

事前知識

業務は SRE ではなく、プロダクト開発をしています。 そのため、SRE について経験がなく、ほとんど初学者の状態です。 プロダクト開発をやりつつ、独自の解釈で SRE の考え方・プラクティス(ポストモーテム、SLO など)を導入したり、運用改善に取り組んでいます。

SRE 関連では以下の書籍を読了済みです。現在は、サイトリライアビリティワークブックを読んでいます。

DevOps 関連で言えば以下の書籍を読んでいました。

感想

カンファレンス全体の感想と、聴講した発表についてそれぞれ感想を記述します。

全体の感想

各社の SRE に対する取り組みを詳細に知ることができ、非常に学びが多いカンファレンスでした。

SRE の関連の書籍だと、包括的な内容だったり海外の大企業の事例だったりと、参考にはなりつつも自分自身の解釈まで落とし込めない課題がありました。 その結果、独自に SRE を実践している場合、書籍と業務のギャップを埋めることが難しかったです。 SRE NEXT で発表された方々は、日本企業の方が多く、書籍では簡単に記述されていたプラクティスについて、業務で実践と運用されていました。 そのため、具体的かつ参考になるユースケースが数多く聴講でき、自分の中で今までの知識の解釈のアップデート、新しい知識の獲得、実践方法の考案ができました。 特に、SLO、オブザーバビリティ、エラーバジェット周りは一段階アップデートできたと考えています。

SRE NEXT を通じて、自身の SRE と所属組織に対する考え方がアップデートされ、普段の業務や勉強に対するモチベーションにもつながりました。 来年も参加しようと考えています。

参加する際に困ったことが 2 点だけあります。 1 つめは、スケジュールの発表前にチケットが販売され、スケジュールを見てから購入しようと思ったら、先に売り切れてしまったことです。 後で追加販売がありましたが、初参加で内容がわからないまま参加するのは、若干リスクがありました。 自身の確認ミスの可能性やプロポーザルを先に見ればよかった節もあります。
2 つめは、スケジュールに開場時刻の記載がなかったことです。 そのため、何分前につけば良いのかや、スポンサーブースはいつから行けたのか把握できませんでした。

聴講した発表の感想

ギークがイオンに飛び込んだ結果がやばい〜Reliability と経営〜

イオンネクスト株式会社の CTO の方の発表です。 入社経緯や、説明されたシステム構成から本来のシステム構成の可視化、信頼性とビジネスモデルについて聴講しました。 イオンで、あまり IT の土台がない状態から、どのようにエンジニアリング組織にしたのかについて興味深かったです。

LINE スタンプの SREing 事例集:大量のスパイクアクセスを捌くための SREing

LINE の SRE の方の発表です。 あけおめ LINE の負荷を乗り切るために、数ヵ月前ぐらいから 3 フェーズに分けてヒアリング、キャパプラ、カオスエンジニアリングによって対策をしていく話でした。 年に 1 回の高負荷のために、さまざまな予測と対策を打ち出しており、国内随一のトラフィック量をさばく企業の事例について学べました。

speakerdeck.com

備えあれば患いなし:効率的なインシデント対応を目指す SRE の取り組み

LOWYA 社のインシデント対策フローの発表です。 タイトル通り、インシデント発生時の備えについて、発生・収束・今後の備えの 3 フェーズで説明されていました。 自身はプロダクト開発がメインですので、インシデント対策フローが後回しになっています。 Severity Levels、Escalation Flow のそれぞれの定義や、Incident Fire Drill による訓練といった部分は手が届いておらず、重要性を痛感しました。 LOWYA 社が参考にした、Pager Duty や Atlassian の資料も非常に参考になりました。

speakerdeck.com

勘に頼らず原因を見つけるためのオブザーバビリティ

Bill One 社のオブザーバビリティの取り組みについての発表です。 書籍、オブザーバビリティ・エンジニアリングに記載されている以下の「オブザーバビリティが高い状況」を目指した事例でした。

ソフトウェアシステムのどんな状態でも、どんなに斬新で奇妙な問題でもデバッグして正しい原因を素早く見つけられる状況

「勘と経験に頼ったデバッグ」と「長く在籍するベテランエンジニアがチームの最高のデバッガー」なのは、自分の現場でも当てはまりすぎて非常に納得していました。

メトリクス・ログ・トレースのそれぞれのできている部分とそうでない部分を評価し対処領域を決めたり、理想的なデバッグ方法を言語化している内容が非常に参考になりました。

speakerdeck.com

【コミュニティコラボ企画】パネルディスカッション 〜信頼性に関わる、ご近所さんが集まりました〜

CloudNative DaysDevOpsDays TokyoPlatform Engineering Meetupの主催者によるパネルディスカッションです。 これらのカンファレンスが取り組んでいることは役割が似通っていたり、混合されたりするので、それぞれの第一人者が一堂に会して議論する場を聞けたのは非常に勉強になりました。 また、それぞれのカンファレンス運営について大事にしていることや意気込みについても非常におもしろかったです。

プロダクトオーナーの視座から見た信頼性とオブザーバビリティ

Chatwork 社のプロダクトオーナーの方による発表です。 現在リライト中のプロダクトについて、信頼性をどのように定義して、SLI/SLO/エラーバジェットを計測し、オブザーバビリティの導入などを進めているかの一連の流れでした。 自身が聴講した発表の中で、おそらく唯一、既存組織に対して信頼性の考え方のから技術的なプラクティスまでの発表でしたので、学びが多かったです。

speakerdeck.com

SRE を以てセキュリティエンジニアリングを制す ― class Dev"Sec"Ops の実装に向けて

Flat Security 社の CTO の方による発表です。 Reliablity と Security の類似性から、そのまま適応してしまうと発生しする問題、その解決策についての一連の発表でした。 これらの分野については自身は初学者でしたが、将来的に DevSecOps まで視野に入れたいと考えているので、新しい知見を学びました。

speakerdeck.com

SLO を組織文化にするための挑戦 〜 Biz/Dev/SRE が一丸で進める SLO ジャーニー 〜

GLOBIS 社で SLO を文化にするための実践した内容の発表でした。 SLO の重要性が認知されづらいことや、CUJ の決め方がわからないこと、SLI の計測が難しいといった内容について共感が多く、納得しながら聞いていました。 自身が所属する組織においても SLO が文化として根付いておらず、同じ課題にぶつかると考えているので、今後も参考にするような内容だと思いました。

speakerdeck.com

SRE の組織類型に応じたリーダーシップの考察

Topotal 社所属の方で、ポッドキャストの「もう一度読む SRE」の運営もされている方の発表でした。 組織的な信頼性についての文化について、リーダーシップ理論と紐づけて言語化されており、興味深かったです。 先述の「SLO を組織文化にするための挑戦」と同様に信頼性の文化作りについて一助になるのではないかと思いました。

speakerdeck.com

エラーバジェット運用までの取り組み - 信頼性の低下に対するアクションを定義しよう

Money Forward 社の方の発表でした。 エラーバジェットの運用という、SLO 文化において割と成熟した内容についての事例を発表されていました。 SRE のプラクティスでは、「エラーバジェットが急速に減っていたら原因調査の追求を優先」だったり、「エラーバジェットを使い切ったらリリースを禁止」などありますが、実践のハードルは高い印象でした。 本当にエラーバジェットの運用ができるのかというのが気になりましたが、本発表では実際に実践して得られたものや課題といったものを知れて、参考になりました。

speakerdeck.com

Yahoo!ショッピング商品管理システムにおける、問い合わせ駆動の信頼性向上の取り組み

ヤフー株式会社のヤフーショッピングに所属される方の発表でした。 既存の問い合わせ運用において、SRE チームがプロセスを改善することで、問い合わせから改善までが解決された事例についてでした。 Embedded SRE としての改善事例であり、プロセスそのものの改善事例として参考になりました。

参加感想まとめ

SRE NEXT の発表は、ほとんどが身近で、「書籍で学んだ内容を落とし込むとこうなるのか」といった気持ちになりました。 自分はまだまだ初学者ですが、参加することで SRE の解像度が向上し、モチベーションの向上にもつながりました。 引き続き、SRE を注力分野として掲げて学んでいきます。