時代に流されないエンジニアでいるための
「本質的な課題解決と実用主義的な視点」

技術・デザイン

サイバーエージェントには「ABEMA」や「Ameba」など自社メディアから得たデータを活用し、大規模データ解析基盤「Patriot」の構築・運用や、自然言語処理、情報推薦、マルチメディア解析、データ分析などを担当する専門組織「秋葉原ラボ」が存在します。今回はこの「秋葉原ラボ」の設立者であり室長を務める福田一郎に本組織の取り組みや、これからのAI/ML人材に求められることを聞いてみました。

Profile

  • 福田一郎
    2008年新卒入社。サービス開発エンジニアを経て、2011年に秋葉原ラボを立ち上げ、データを利活用することでサービスを発展させるためのシステム開発およびそのチームマネジメント業務に従事。現在、秋葉原ラボ研究室長。

不確実な世の中に求められる「実用主義的な」エンジニア

ー 秋葉原ラボにはAI/ML人材が多く所属していますが、今後どんなエンジニアが必要とされていくのでしょうか?

共通して求められる素養は「事業課題に対して、本質的なアプローチを考えられるエンジニア」だと思います。

いわゆる機械学習やデータサイエンスの領域は「流行り」のような現象が起こっている一面もあり、興味を持つ人・実務経験がある人は増えてきました。その中でも長く活躍できる人材は、機械学習で具体的に動いているものだけでなく、そもそも機械学習を適用する領域の知識構造、裏側のより抽象的な構造など、その裏側にどういう要素があり、どのように構成され、何を準備しておくことでもって、それが効率的にできるか?といった考え方ができ、興味を持てる人だと思います。

ー そういった素養はどこに起因すると思いますか?

エンジニアリングの本質は「世の中の課題を解決する事」である一方、その手段となる技術は加速度的に発展し、新しいテクノロジーやソリューションが次々にリリースされる時代です。

「新しい技術がリリースされたのでプロダクトに使いたい」という気持ちもエンジニアとして充分わかります。しかしそれだと視野が「点」に留まってしまいます。

エンジニアリングとは、人類史が始まってから連綿と続いている課題解決の道のりであって、我々はそのレールを少しずつ伸ばし続けるのが努めだと思っています。新技術に着目するだけでなく、それが生まれた背景や課題を想像できるようになると、将来的にどんな技術があらわれるかも見通せるようになります。

非日常が常態化した世の中で、加速度的に技術が発展していく時代だからこそ、技術という「点」ではなく、世の中の課題を解決する「面」でとらえられるエンジニアを求めています。

ー 具体的にはどのようなとらえかたになりますか?

例えばGoogle Cloud Spanner(以下Spanner)というデータベースがあります。歴史を紐解くと、MySQLのようなRDBMS(relational database management system)があり、その次にBigtableのような分散Key-Value Storeが登場しました。その2つのデータベースシステムの良い点をかけ合わせたのが、Spannerというとらえ方をしてみます。

すると、Spannerもデータベース技術が進化する1つの通過点として考えることができます。「Spannerを使ってみたい」という視点から一歩身を引いて「データベース技術の発展や関係データベース理論」という俯瞰した視点でとらえてみると、データベース技術がどのような進化を遂げてきて、何の課題を解決するためにSpannerが作られたのか、今後どんなデータベース技術が求められるのかが見えてきます。さらに、どの場面でその技術を使うべきなのかも見えてくるでしょう。

ー そういった思考になるために、普段から習慣づけておく事はなんですか?

エンジニアは「プラグマティズム(実用主義)」を意識しているべきだと思います。「その技術が世の中の課題にどう役立つか?」を考えた上で、技術的なアプローチを試していく。企業で働くエンジニアであれば「事業や業績にどう貢献するか」がそれにあたります。

「Google Cloud Spannerがリリースされたので、それを使ってサービスを作りました」というのは実用主義的な考え方ではないですよね。使える道具ならレガシーだろうが古典的だろうと、低コストで安定運用できるのであれば、適切な技術を選定して解決するのが実用主義的な考え方です。「新しいから」「すごいから」という側面だけで技術選定したとしても、事業や業績に貢献しないのであれば、ただの自己満足に終わってしまいます。

事業の規模やエンジニアのリソースや採用状況を鑑みながら、最適な技術を選定できるようにありたいですね。

ABEMAのデータドリブンな施策を支えるデータマネジメント組織

ー 秋葉原ラボでは「ABEMA」やメディアのデータ分析やログ基盤を主としています。今、事業で顕在化している課題はなんですか?

機械学習をビジネスに導入する際、従来のシステム導入と異なるのが、確率的な要素やデータの質や量によって結果が大きく変わる点です。

機械学習エンジニアやデータサイエンティストが、アルゴリズムの精度を1%改善する事で、事業の収益が大きく向上するケースがあります。その際、前提となるのが機械学習のパフォーマンスを最大化するためのデータ基盤の存在です。「ABEMA」などのメディアの場合は、サービスのログがその精度を左右します。

コンピューター業界の格言に「Garbage In, Garbage Out (ゴミを入力するとゴミが出力される」という言葉がありますが、機械学習で特によく引用される言葉です。つまりアルゴリズムは、高信頼性があるデータや、高い精度と品質を保ったデータがあって、はじめてその精度を発揮できると言えます。

そのため、秋葉原ラボが注力しているのは、機械学習がもたらす成果を最大化するための、データ基盤の強化しています。例えば、データの管理も含めたバージョニングといったモデル管理のシステム、更にそれらをサービングするためのシステムの開発も進めています。

ー 「ABEMA」での活用事例を教えて下さい

「ABEMA」も開局当初はリニア放送のみでしたが、2017年にオンデマンド配信が加わり、2020年6月にはアーティストのライブ、イベント、スポーツ興行などをお楽しみいただける「ABEMA PPV ONLINE LIVE(アベマ ペイパービュー オンライン ライブ )」がスタートしました。最近ではレンタルサービス(※2020年12月にサービス開始)も始まりました。

事業の成長と共に、多様な視聴パターンが生まれることで、非常に複雑なデータになっています。使える機能が増えるのはユーザーにとってはメリットですが、事業の成長とともにシステムやデータのモデリングが複雑になるのは必然といえます。

現在、「ABEMA」の膨大な視聴ログやコンテンツデータから、ユーザー体験を向上させる新しい切り口を導きだす試みが、秋葉原ラボのメンバーを中心に行われています。

もし、視聴者の「もっと胸キュンしたい!」気持ちに寄り添うレコメンドが「ABEMA」でできたら?
機械学習が示す「ABEMA」の番組キャスティングの新しい地図

複雑化していくビジネスモデルをエンジニアが網羅的に把握し、データモデルを緻密に設計していく必要が一層求められているので、データマネジメントとデータ基盤へのニーズは増えていくでしょう。

機械学習も手段の1つ。必ずしも最適のアプローチであるとは限らない

― 機械学習やデータ分析を用いたソリューションを提供する際に、気を付けていることや重視していること等はありますか?

機械学習やAIの継続的な発展により、従来のシステムでは対応できないような課題に向き合うこともできるようになりました。その一方、機械学習はあくまで確率的なシステムであり「100%の結果を出すことはできない」という側面もあります。

例えば、「アメーバブログ」における不適切画像のフィルタリングを機械学習で対応する際、「不適切な画像を出さない」ほうに振るのか、「通常の画像を不適切だと判断しない」ほうに振るのか。どちらに振るのかを選ぶことはできます、しかし「100%の精度で不適切画像のみフィルタリングする」ことはできません。

サービスとしては「不適切な画像を表示させてしまう」方が問題なので、通常は「不適切な画像を表示させない」、つまり「不適切ではない画像でも、その一部が監視に回る」に振ることになります。

エンジニアリングの世界には「あらゆる課題を魔法のように解決する、銀の弾丸などない」という言葉があるように、技術が全てのビジネス課題を100%解決する事はあり得ません。サービスの課題やビジネスの要望に応えつつ、この辺りをどれだけコントロールできるか。そこはエンジニアの腕の見せ所でもあり、フォローアップのプランも必ず考える必要があります。

例えば「機械学習を用いたレコメンドシステムを追加したい」というニーズがあったとして、「そもそもレコメンドが最適のアプローチなのか?」という問いをエンジニアは考える必要があります。

「そのビジネス課題は、レコメンドの実装で本当に解決できるのか?」「レコメンドで伸ばしたいとするそのKPI設定はユーザーにとってメリットになっているのか?」。その問いを前提とし、サービスを俯瞰して見た上で、確かに機械学習を用いたレコメンドが最適だという結論であれば良いと思います。

しかしそこが曖昧なまま、ニーズに従って機械学習を導入したとしても、ビジネスが期待するような結果を得ることは難しくなります。機械学習を導入する前に、そのサービスでどういう価値を提供したいのかを、エンジニアは考える必要があると思います。

― 機械学習を導入する必要がなかったり、むしろ導入しないほうがいいケースもあると。

機械学習を用いるべき典型的な事例としては、人間が感覚だけでは操作・探索しきれない量があるようなケースです。10個しかないものから選ぶのであれば誰かが選べばいい。それが数十万、数百万というオーダーになってくると人力では難しい。そうなると機械学習が必要かもしれません。

その場合でも数値的に10以上はこっち、100以上ならこっちというように決定的な条件分岐が可能であれば機械学習を使わなくても自動化できます。実用主義的に考えれば機械学習を使う必要はないという結論になる。

これが画像の特徴を把握するとなると、やはり機械学習系のものが必要になってきます。ただその場合もディープラーニングまでは必要ないかもしれない。やや古典的な、広い意味では機械学習と言えるパターンマッチ等の方法で対応できることもあります。

レコメンドシステムも、人の属性やIDをクエリにして結果を返すという仕組みを考えれば広義の情報検索であるとも言えます。「Aというサービス向けのレコメンド」「Bというサービス専用のレコメンド」が求められがちですが、実のところ裏はほぼ一緒と言える。

もちろん特定のサービスゆえの要件も出てきますが、その部分はモジュールで作るのか本体に取り込むのか、細かく調整しながら色々なものに使えるところを取り揃えていく。つまり抽象化して体系化していくわけです。そうすれば次にレコメンドの案件が来た時もすぐに対応できますし、対応できることが技術力のある組織だと思います。

データ基盤から技術倫理までをカバーする秋葉原ラボ

― 現在、秋葉原ラボではどんな技術分野をミッションにしていますか?

現在は約40名が在籍しています。エンジニアのタイプは大別すると3つあり、基盤システムやインフラに近いレイヤーを担うエンジニア、機械学習系のエンジニア、データマイニングやデータ分析に携わるエンジニアです。また、タスクフォース的に計算社会科学や技術倫理といった分野に取り組んでいるメンバーもいます。

メンバーそれぞれが、得意分野に沿ってチームを構成しています。例えば「ABEMA」のようなサービスの成果に直接的ににコミットするチーム。インフラ的な基盤システムを担うチーム。最近力をいれているのがサービスやコンテンツの裏にある知識構造を解き明かすというような視点で取り組んでいるデータとナレッジのエンジニアリング、マネジメントを担当するチームです。

先程、事例に出た「ABEMA」のデータ基盤を担当するのが、機械学習の基盤を担うチームです。ここは同じ基盤でもインフラ基盤チームとはレイヤーが異なり、機械学習システムやMLOpsと呼ばれるところを整備するチームです。

秋葉原ラボは取り組みや知見を社内外に発信する「技術報告書」を2018年から刊行しています。その「技術報告書vol.3」の第1章「データ活用のための基盤システム」がインフラ系の基盤で、第2章「機械学習システム」が機械学習のための基盤になります。

― 今後、秋葉原ラボがやっていきたいことを教えてください。

機械学習系の基盤システムを始めとして、Kubernetesを用いたインフラの基盤、モデル管理のシステム、様々な分野の技術基盤が整ってきました。

こういった基盤システムを活用したサービスへの貢献に加え、我々の知見やソリューションを会社全体の技術力強化に貢献できればと思っています。

2022年度新卒採用エンジニアコースエントリー

この記事をシェア

オフィシャルブログを見る

「KEITA MARUYAMA」ブランド初のデジタルショーを通して感じた、ファッションとテクノロジーの融合が生み出す未来の可能性

技術・デザイン

サイバーエージェント、ファッションブランド「KEITA MARUYAMA」、若槻 善雄氏(DRUMCAN Inc.)がタッグを組み、ブランド初となるデジタルショー「KEITA MARUYAMA x PITTA MASKコラボレーション・ショー」の映像を制作。「Rakuten Fashion Week TOKYO」にてオンライン発表いたしました。

デジタルヒューマンや3DCGを用いて国内ファッション業界初のクリエイティブ表現に挑戦して感じた、ファッションとテクノロジーの融合が生み出す未来の可能性とは?

記事ランキング

Page Top