概要
SRE Kaigi 2025 に参加してきました。 感想を記述します。
- 概要
- 参加理由
- LT 感想
- SRE, 開発, QA が協業して挑んだリリースプロセス改革
- 実践: Database Reliability Engineering ~ クラウド時代のデータベースエンジニアの役割 ~
- もっと SRE の裾野を広げるための初学者向け技術研修設計
- ブロックチェーン R&D 企業における SRE の実態
- 信頼性を支えるテレメトリーパイプラインの構築
- Improving Incident Response using Incident Key Metrics
- 2,000 万ユーザーを支える SRE チームの 6 年間のスクラムのカイゼン
- 2 週に 1 度のビッグバンリリースをデイリーリリース化するまでの苦悩 ~急成長するスタートアップのリアルな裏側~
- Platform Engineering があれば SRE はいらない!? 新時代の SRE に求められる役割とは
- あなたの興味は信頼性?それとも生産性? SRE としてのキャリアに悩むみなさまに伝えたい選択肢
- LT 大会 B
- 懇親会感想
- まとめ
参加理由
普段の業務で SRE 活動に従事しています。 SRE 界隈のプラクティスや動向を知る為に参加しました。
LT 感想
SRE, 開発, QA が協業して挑んだリリースプロセス改革
ニーリーの宮後さんの発表でした。 リリース頻度と変更失敗率という 2 つの指標を改善するために SRE チームが取り組んだことについての発表でした。 指標の改善に限らず、コスト面も考えられた取り組みで興味深かったです。
実践: Database Reliability Engineering ~ クラウド時代のデータベースエンジニアの役割 ~
DBRE という単語が書籍以外で聞く機会が珍しかったので聴講しました。 パブリッククラウドによって、DB 周りの責務をクラウドが果たすようになる中、より DB やデータに注力した信頼性について取り組む事例でした。 こちらも具体的なプラクティスとしておもしろかったです。
もっと SRE の裾野を広げるための初学者向け技術研修設計
GMO ペパボの染矢さんの発表でした。 効果的な研修をどのように実施していくかについて、科学的な根拠も交えながら解説および実践したことについての発表でした。 SRE に限らない学びや教えの考え方として知見を得られました。
ブロックチェーン R&D 企業における SRE の実態
Datachain の水落さんの発表でした。 ブロックチェーンの入門から始まり、Datachain におけるサービスや R&D 領域の解説、そして、ブロックチェーンにおける SRE の役割についての発表でした。 ブロックチェーン特有の問題があり、信頼性を確保しないといけない箇所に対して注力していく別分野の SREing 活動を学べてよかったです。
信頼性を支えるテレメトリーパイプラインの構築
AWS の山口さんの発表でした。 テレメトリーパイプラインの実装パターンから、今後の OTel の展望について発表されていました。 Learning OpenTelemetry の日本語訳も出版されたので、矢継ぎ早に最新の情報を得られてよかったです。
Improving Incident Response using Incident Key Metrics
Topotal の高村さんの発表でした。 MTTR の問題点を先行事例と合わせながら解説し、より実践的な TTX の定義および、活用について解説していました。 所属チームが MTTR 活用の際にぶつかった課題や回避策と一致している部分が多く、SRE as a Service を実践している企業でも同じ考えになることを知り心強かったです。 そういった背景も踏まえて、個人的には SRE Kaigi 2025 における最も印象に残った発表でした。
2,000 万ユーザーを支える SRE チームの 6 年間のスクラムのカイゼン
mixi のホンマークハントさんの発表でした。 みてねの SRE におけるスクラムの取り組みについての発表でした。 自分が CSM を持っていることもあり、興味をもち聴講しました。 スクラムで何度も強調される価値提供に対する取り組みや、属人化解消の取り組みなど、SRE のマネジメントについて赤裸々に語られていて興味深かったです。
2 週に 1 度のビッグバンリリースをデイリーリリース化するまでの苦悩 ~急成長するスタートアップのリアルな裏側~
Knowledge Work の mado さんの発表でした。 宮後さんの発表同様に、リリース速度の遅さをさまざまな観点から解決に取り組んだ内容でした。 リリース速度改善の一例としておもしろかったです。
Platform Engineering があれば SRE はいらない!? 新時代の SRE に求められる役割とは
メルカリの mshibuya さんと naka さんの発表でした。 メルカリハロ立ち上げの際の Platform Engineering と SRE のロールで実践したことについての共有でした。 メルカルハロによって得られた知見から来たものですので、地に足ついた内容からおもしろかったです。
あなたの興味は信頼性?それとも生産性? SRE としてのキャリアに悩むみなさまに伝えたい選択肢
Pager Dutry の jacopen さんの発表でした。 SRE についての歴史や Platform Engineering と SRE についての定義の違いについて解説されていました。 「SRE の探求」や「SRE をはじめよう」で言及されている SDLC パイプラインにおける「左から右」なのか「右から左」のどちらのに興味があるのかについて考えさせられる発表でした。
LT 大会 B
自分はルーム B の LT 大会を拝聴していました。 どれも、信頼性周りについての内容で、所属チームに関連する部分が多く勉強になりました。
懇親会感想
懇親会にも参加しました。 社内のオンライン勉強会で会話する機会はありつつもリアルで会う機会がなかった方や、登壇者の方とお話しすることで、理解が深まりモチベーションも高まりました。 当日の熱量を持ったまま懇親会に臨めるのは、ありがたい機会だと思いました。
まとめ
SRE Kaigi は初開催にもかかわらず進行がスムーズで、ほかのカンファレンスにはない特徴を持っていたりと非常に楽しめました。
次回はまだ未定とのことですが、来年の 2 月を予定しているとのことで楽しみです。
SRE NEXT は夏で、SRE Kaigi は冬にやってくれるので、SRE のトレンドを追いながら交流できる機会となり非常にありがたいです。
今年の SRE NEXT か来年の SRE Kaigi には登壇できるように頑張ろうと思えました。