概要
「ゆる SRE 勉強会 #10」に参加しました。 感想を記述します。
https://yuru-sre.connpass.com/event/348136/yuru-sre.connpass.com
参加理由
SRE の具体例を学びたく参加しました。 前回から参加しており、今回が 10 回目になります。 実は LT 枠で応募したものの、抽選に外れて落ちて、一般参加しました。
セッション感想
会場スポンサー LT :『小さく始める障害訓練』
ギフティの牧純平さんの発表でした。 初めて障害訓練に取り組んだ内容についての発表でした。 自身も障害訓練に初めて取り組むとき際、似たようなハードルがあったことを思い出しました。 SRE 系の書籍では重要性について説いているものが多いものの、具体性については深掘りできていないものが多いです。 そのため多くの日本企業が、このような経験をシェアして具体性を深めて、もっとハードルが下がれば良いのにと思いました。
スポンサー LT@Sentry
Sentry Japan のなるさんの発表でした。 Sentry はエラー検知の印象が強かったですが、APM ツールも提供していることが意外でした。
『入社後 SRE チームのミッションや課題の整理をした話』
tacoms の Morix さんの発表でした。 SRE のロードマップや目標決めについての発表でした。 SRE は業務の特性上、成果や貢献を定義しづらく優先順位付けが難しいです。 自身の経験でもやることや優先順位付けに難しさを実感した経験があるので、それについて体系的に取り組んだ内容で印象的でした。 一方で、個人的には品質特性が必ずしも SRE 業務にマッピングできたりせず、そのような時に方向性を見失いがちですので、どのように対処するのか気になりました。
『新しいプロダクトのデプロイパイプラインに Argo CD を使った話』
クラウドエースの北野敦資さんの発表でした。 自社 PJ に対して、Argo CD を導入した内容でした。 大規模なフレームワークの刷新は労力を必要としますが、試行錯誤の末に導入できていました。
『スロークエリとの戦いの軌跡 2024』
flyle の r_takaishi さんの発表でした。 スロークエリ問題の対処を、「早く気が付く」「早く直す」「発生を抑える」の 3 つの軸から取り組んでいました。 どの組織も抱えているか将来的に抱える問題をどのように対応したのか、具体的に説明されていて参考になりました。
『AWS Change Manager で PIM ライクな権限昇格の仕組みを構築した話』
metap ホールディンクスの、是永さんの発表でした。 PIM(Pivileged Indeity Management)を使うことで、権限を時限的に付与した話でした。 権限周りは問題が発生するまで一度付与した権限を再利用しがちですので、こういった問題をクラウドの機能から対処できるのは便利だと思いました。
『負荷試験で AWS から予想外の請求が来た話』
SUPER STUDIO の田幸久志さんの発表でした。
負荷試験の設定やスクリプトの問題で、高額の請求になってしまった話でした。 現地で共有した金額が、驚愕の金額でしたので、こういったことについて共有されると身が引き締まる想いになれました。
『SES 運用監視オペレーターから自社開発の SRE になるまでの話』
ファインディのこうじゅんさんの発表でした。 過去の SRE になるまでの来歴でした。 自身は SWE から SRE になったので、周知とは違うパターンが多いのですが、こういった話を聞くとあらためて異なることがわかります。
『SRE チームを分割する』
PrimeNumber の髙塚広貴さんの発表でした。 将来的な採用戦略を見据えた SRE の組織再編といった内容でした。
『(みんなやっているはずなのに情報の少ない) DNS レコード管理の改善』
ココナラの Kou さんの発表でした。 DNS レコード管理が「DNS レコード編集がトイル」「依頼がリードタイムを悪化させる」ということから改善に取り組んでいました。 最終的に IaC 管理をしていたり、承認フローを確立したりと、SRE だけができることは巻き取りつつ、開発者ができることは知識や責任を委譲しているのが本当に SREing しているという印象でした。
勉強会の全体的な感想
前回と引き続き参加者のモチベーションが高く、非常に勉強になる勉強会でした。 今回は抽選に落ちて発表できませんでしたが、SRE NEXT のプロポーザル次第では今後ぜひ発表したいと考えています。