Devin×Playbookで、大規模サービスの少人数運用を可能にするSREのチーム拡張戦略

技術・クリエイティブ

20以上のメディアサービスを展開する(株)CAMでは、大規模マイクロサービス運用における、突発的なアクセス急増への対策など、安定したサービス運用の必要性が高まっています。そんな中、自律型ソフトウェアエンジニアリングAI「Devin」の導入が進んでいます。本記事では、Devinをいち早く取り入れたSREチームによる、導入の背景から具体的な活用事例、PDCAを回した継続的改善など、CAMにおける「AIによる開発チームの拡張」をご紹介します。

Profile

  • 石川 諒 (株)CAM / Development Group Platform Engineering Unit)
    2019年にCAMにバックエンドエンジニアとして新卒入社。Node.js, TypeScript, Go を書きつつ、社内の多数のサービスを支えるプラットフォームの開発・運用に従事。現在は、プラットフォーム上で開発するエンジニアの開発者体験や生産性を向上させるため、SREと協力しながら Platform Engineering に取り組んでいる。

  • 岡 麦 (株)CAM / Development Group / SRE Unit)
    2022年にサイバーエージェントに新卒入社し、子会社であるCAMのSRE Unit に所属。マルチクラウド(AWS/Google Cloud/Azure)で構成されている複数のサービスの運用や保守、新規サービスの構築を行っている。

マイクロサービス運用課題から紐解くDevin活用の可能性

── お二人の現在のエンジニアとしてのバックグラウンドやミッションについて教えてください。

石川:私はバックエンドエンジニアとして、CAMのさまざまなサービスを効率的に運用することと、共通開発基盤を構築するプラットフォームエンジニアリングを担当しています。共通機能やプラットフォームの安定性を横断的に管理していて、岡さん達 SREチームと連携してパフォーマンス改善にも取り組んでいます。

:私は2022年に新卒でサイバーエージェントに入社し、CAMに配属されました。現在はSRE Unitのエンジニアリングマネージャーを務めています。主にKubernetesを採用したプラットフォームの運用と基盤改善を担当する他、CAMの開発生産性向上やAI活用による運用手法の導入にも取り組んでいます。

── CAMでは、どのようなビジネス課題やプロダクト課題があって、Devinを導入することになったのでしょうか。

石川:目下の課題はマイクロサービスアーキテクチャの採用に伴い、バックエンドエンジニアが管理すべきサービス数が膨大になっていることでした。現在、約40のマイクロサービスを十数名のバックエンドエンジニアで運用しており、エンジニアの人数よりもマイクロサービス数のほうが多いというヒューマンリソース的な組織課題を抱えていました。

特に負担が大きかったのは、フレームワークやライブラリのメンテナンス作業です。数ヶ月に一度、40のマイクロサービスすべてで一斉に実施していたのですが、作業そのものは単純であっても、開発チーム間で分担して進めるために本来の開発業務に支障が生じていました。

TerraformなどInfrastructure as Codeを活用した従来の自動化手法だけではカバーしきれず、パイプラインの構築や運用にかかるコストも高かったため、より効率的なソリューションを模索する中、自律型ソフトウェアエンジニアリングAIであるDevinに注目しました。

Devinが支える大規模イベントのアクセス急増対策

── 実際にどのようなケースでDevinを活用しているのでしょうか。

:CAMはファンクラブサイトを運営している特性上、突発的なアクセス増加が頻繁に発生し、予期せぬ大量アクセスへの対応が重要な課題でした。具体例として、通常は1秒間に数百アクセスだったサイトが、瞬間的に数万アクセスに跳ね上がることがあります。

テレビ番組での紹介はある程度予測できるのですが、SNSで話題になるタイミングは予測困難です。そのためクラウドの一般的なオートスケーリング機能では対応しきれず、常時大量のサーバーを待機させるのはコスト面で現実的ではありません。そのため、瞬間的な大量アクセスが発生した際に、SREチームが対応していたのですが、複数のサービス設定を手動で変更する複雑な作業が必要でした。

そこでDevinを導入しました。Devinのプレイブック機能を活用することで、Slackから「このサービスをこの設定でスケールアップ・スケールアウトしてください」と指示するだけで、必要な設定変更を含むGitHubプルリクエストが自動作成されます。

slack から Devin にスケールアウトの指示をしている様子
slack から Devin にスケールアウトの指示をしている様子

これまで、イベントの準備に半日かかっていたケースもありましたが、総じて15分~30分程度の準備時間に短縮されました。さらに、運用後の振り返り用のレポートも自動生成されるのも特徴です。メトリクスダッシュボードの閲覧をし、振り返りを行う作業も大幅に効率化されています。このように、SREチームの作業負荷が大幅に軽減されました。

スケールアウトの指示と一緒に作成されるイベントの振り返り用の GitHub Issue
スケールアウトの指示と一緒に作成されるイベントの振り返り用の GitHub Issue

── 急激なアクセス増加が発生した際、AIと人間の役割分担はどのようになっているのでしょうか。

:大規模イベントでは何が起こるか予測できません。SREチームのメンバーは必ずオンコール体制を維持し、何か問題が起きたときに即座に対応できるようにしています。

役割的には、Devinには「量は多いけれど単純で少し面倒な作業」を担当させ、運用設定の変更やスケーリング操作などを自動化しています。DevinはSlackからの指示で必要な設定変更を含むGitHubプルリクエストを自動作成し、指定時刻での自動スケールダウンや振り返り用ログの生成まで行います。その間、人間は監視と最終的な判断を担いつつ、イベント全体の安定運用を指揮しながら必要に応じて介入するのが実態です。

このように、Devinが単調かつ大量の作業を実行部隊としてこなす一方で、人間が司令塔としてシステムの健全性を見守ることで、互いの得意分野を活かした協働体制を実現しています。

石川:この導入によって、組織的な効果も大きく表れましたよね。

:はい。これまで私しかできなかった複雑な作業を他のSREメンバーも実行できるようになりました。人手不足を採用や異動で補うのではなく、Devinを活用したチーム全体のスキル向上によって、エンジニア組織の根本的な課題解決を図ることができたと思います。

継続的改善を実現するDevinのPDCA活用法

── 実際、イベント対応でDevinの運用を回されていると思いますが、どのくらいの頻度で活用されているのでしょうか?

:月に数回あるチケット販売や、グッズ販売などの大規模ライブイベントでDevinを運用しており、その都度PDCAサイクルを回して改善を重ねています。Devinの優れている点は、プレイブックのプロンプトを変更するだけで運用を調整できることです。その日、期待通りに動作しなかった場合には、「次回はミスしないよう、どのようなプレイブックにすればよいか考えて」と指示するだけで、Devin自身が改善提案を行っています。

人間とDevinが協働しながらプレイブックを磨き上げることで、運用精度は使えば使うほど向上しているのが特徴です。

石川:私が個人的に注目しているのは、Devin独自のナレッジ機能です。

Devinには組織固有の知識を蓄積・学習する機能があります。作業を進める中で「このリポジトリで作業する時はこういうルールがある」「この設定では注意すべき点がある」といった情報を自然言語で教えると、一度教えた内容が知識として蓄積され、次回以降は同じ説明が不要になります。これによりCAM特有のルールや慣習を学習し、より精度の高い作業が可能になります。

Ask Devin」という質問・調査に特化した機能と、「Devin’s Wiki」というコード解析から自動的にドキュメントを生成する機能も利用しています。これらによって、システムのアーキテクチャやデプロイ手順などを含む包括的な資料を自動生成できるようになりました。

実際、新メンバーのオンボーディングでも大きな効果がありました。これまでは特定のエンジニアに質問が集中していましたが、まずAsk Devinで調べてもらい、それでも分からない部分だけを相談してもらう流れに変わりました。Devinは単なる作業ツールではなく、組織の知識を集約・共有する仕組みとして機能することで、これまで属人化していた知識が組織全体の資産になりました。

── SRE以外のプロダクト開発でも同様にDevinを活用されているのでしょうか。

石川:バックエンド開発においてもDevinを積極的に活用しています。例えば、簡単なバグ修正や「ここを直せばよい」と分かっているものの時間が取れない作業は、すべてDevinに任せています。パフォーマンス改善の面でも高い効果を発揮しており、データベースのパフォーマンスログを渡して原因究明を指示すると、的確に分析してチューニング案を提示してくれます。

スロークエリーの解析指示をする様子
スロークエリーの解析指示をする様子
大幅なレイテンシー改善を Devin がしてる様子
大幅なレイテンシー改善を Devin がしてる様子

これまで忙しくて手がつけられなかった「やりたいと思っていたこと」をDevinに任せると、すぐに成果物が出来上がっている感覚です。ある程度答えが分かっているタスクをDevinに任せる使い方は、バックエンドの開発において非常に有効だと感じています。

Devin導入後のプラットフォーム改善とSREチームの拡張

── Devinの導入でSREエンジニアはどのようなことに注力できるようになったのでしょうか。

:CAMではプラットフォームを長年運用してきた結果、システムが複雑化・独自化していました。しかしDevinの導入によって運用業務が大幅に軽減されたため、これまで手が回らなかったプラットフォーム改善にもチームメンバーが参加できるようになりました。

私も主務はエンジニアリングマネージメントですが、運用負荷が減ったおかげでマネージャー業務をこなしながら技術的なタスクにも取り組めています。実体験として新たなチャレンジの機会が増えたと感じています。

石川:具体的な時間短縮効果も大きいですよね。

:はい。以前はプラットフォーム運用に1~2時間かかっていましたが、現在は10~15分で完了します。その空いた約1時間半を、より価値の高い業務に充てられるようになりました。何より重要なのは、以前は私しか実行できなかった作業を再現性のある形で他のメンバーに任せられるようになった点です。属人化が解消され、チーム全体の可用性が向上しました。

── AIの導入によって、CAMの開発組織は今後どのように変わると考えていますか?

:今回、約20のサービスを十数名で運用するという構造的課題を、Devinというもうひとりのチームメンバーを迎え入れることで解決できました。私たちが実践したDevinによるチーム拡張のアプローチは、他の開発組織にも応用可能だと考えています。

石川:CAMでは「やりたいけれど手が回らなかった」機能開発や品質改善が次々と実現できるようになっています。これからはサービス品質の向上や新機能開発に、これまで以上に時間とリソースを投資できます。エンジニアが本来注力すべき価値創造業務に集中できる組織へ、着実に近づいていると実感しています。

:SREチームとしては、AIが提供する膨大な情報を活用し、これまで経験のなかったフロントエンド領域や、より高度なシステム設計にも挑戦していきたいです。チーム全体のスキル領域が飛躍的に広がる事も期待できそうです。

石川:最終的に目指すのは、技術的制約ではなくビジネス価値で判断できる開発組織です。「人手が足りないから諦める」のではなく、「ユーザーにとって本当に価値があるか」で優先順位を決められる。そのような組織の実現可能性を、Devinとの協働を通じて強く感じています。

Devin Meetup Tokyo
Devin Meetup Tokyo

この記事をシェア

オフィシャルブログを見る

記事ランキング

女性エンジニアのための技術とキャリアのカンファレンス
「Women Tech Terrace 2025」開催レポート

技術・クリエイティブ

2025年6月28日(土)、今年で5回目となる「Women Tech Terrace 2025」を、翔泳社 CodeZine編集部が主催する女性ITエンジニアの学びと活躍を応援するカンファレンス「Women Developers Summit 2025」と共催いたしました。

昨年に引き続き「女性エンジニアが "長く自分らしく" 働くことを応援する」をコンセプトに技術やキャリアに関する様々なセッションのほか、「AI時代を生き抜くエンジニアのキャリア戦略~技術×ビジネス×教育 それぞれの視点から~」と題したパネルディスカッションをお届けしました。
こちらの記事ではたくさんの写真とともに、当日の様子をお伝えします。

Page Top