アカデミア出身のデータマイニングエンジニアが思う、「企業で働く」ということ

技術・デザイン

『データマイニングエンジニアの教科書』出版に寄せて

2019年6月27日、秋葉原ラボのメンバーが執筆した『データマイニングエンジニアの教科書』(森下壮一郎・編著、水上ひろき/高野雅典/數見拓朗/和田計也・著)が発売されました。
秋葉原ラボは、サイバーエージェントのメディア事業における研究開発組織で、展開するサービスから得られるデータを活用し、メディアサービスと会社の発展に寄与することを目的として2011年4月、秋葉原にオフィスを開設しました。秋葉原ラボには大規模データ処理や機械学習、データ分析などを専門とするエンジニア約40名が在籍しています。

今回は書籍のタイトルにもある「データマイニングエンジニア」として秋葉原ラボで働く森下に、サイバーエージェントでデータマイニングエンジニアとして働くこと、書籍執筆に際してのエピソードなどを話してもらいました。

Profile

  • 森下 壮一郎(モリシタ・ソウイチロウ)
    株式会社サイバーエージェント 技術本部 秋葉原ラボ 2016年入社。博士(工学)。自社サービスのデータ分析と情報倫理に関する研究に従事。

そもそも「データマイニングエンジニア」とは?

「データマイニングエンジニア」というのはあまり一般的な名称ではないかもしれません。データ分析をする人の職種としてよく使われるのは、データサイエンティストやデータアナリスト、データエンジニアのような名称です。おそらく「データサイエンティスト」が一番通りがいいのではないでしょうか。一方で、この呼び方は人によって解釈が違う曖昧な部分があると思っています。では、我々がやっているのは具体的に何だろうかと考えたところ「データマイニング」かな、と。ですので、秋葉原ラボでデータマイニングに携わる人は名刺に「データマイニングエンジニア」と書いていますね。

そもそも「データマイニング」で行うことは「理解可能なパターンを見極めること」「知られていない知識を発見すること」「意思決定を支援すること」、この3つであると一般的に定義されています。最近ではツールの進歩も手助けし、例えばExcelでもそれなりに大規模なデータを扱えるようになっていて、規模によってはエンジニアでなくてもデータマイニングはできてしまいます。ではそういった状況の中で「データマイニングエンジニア」とは一体どういう職種なのか。それはこの本でも紹介していますが、端的に言えばデータマイニングのタスクの中でも、特に「エンジニアリングが必要な課題」を解く人たちと言えると思います。

アカデミックの世界から、サイバーエージェントのデータマイニングエンジニアに

−大学で教鞭を執り、アカデミックの世界からサイバーエージェントに転職しましたが、アカデミアでの研究活動と企業のデータマイニングエンジニアとして働くこととの大きな違いをどこに感じますか。
 
そうですね、アカデミックでは人類にとって共通する問題に取り組むことが求められます。さらに工学だと「新規性・独創性・有用性」があるかという視点がとても大切です。ドメインスペシフィックすぎるような、要するに限られた人しか困っていないような課題の解決であったり、特定のサービスにしか役に立たないといった研究は評価されにくい傾向があります。しかし企業においては、まずは企業の顧客やビジネスパートナーに役に立つかという部分にフォーカスする必要があるという違いはあるかもしれません。

また、特に自然科学だと「対象を観察した結果のデータ」から、厳密な客観性を持って「何かが分かること」が重要視されます。しかし企業においては、ただ「何かが分かりました」では意味がない。有り体に申し上げればその先に「売上が上がること」であったり「指標を達成すること」が求められますから、その後ろには意思決定が控えています。そもそもアカデミックの世界では「指標を追いかける」といった言葉はあまり使われませんが、企業は自社の成長のために事業で売上を上げ利益を出す必要があるので、あらゆることに「指標」がつきものです。ですから企業のデータマイニングエンジニアには、企業経営や事業戦略における指標を達成するための「意思決定支援」が求められる点が大きな違いだなと感じます。このことに関しては、本の中でも「指標を考える」という章で取り上げています。

−企業のデータマイニングエンジニアとして働く面白味が感じられるのはどういったところでしょうか。

基本的にアカデミックの世界でも企業であっても、目の前にあることを地道にやるということに変わりはありません。その前提で、やはり企業に入ると「生のデータを扱える」という面白味は感じます。アカデミックだと、企業との共同研究などで提供されるデータはいわゆる綺麗なデータです。料理で例えると「材料が下処理された状態でくる」という感じでしょうか。魚料理を作りたいと思った時に、その材料がすり身だとできる料理は限られてしまいますよね。でもそれが素材そのままでくれば、刺身にもできるし焼き魚にもできるなといった風に、調理方法すら検討できる可能性がありますから。生のデータにはそういう良さがあります。

−わかりやすい例えですね(笑)本の中のコラムを読んで感じたのですが、森下さんは教鞭を執っていたこともあってか、たとえ話がわかりやすくてとても面白いです。

それは嬉しいです。コラムは基本的に私が書いているのですが、ぜひ読んでいただきたいところです(笑)

−今回の書籍出版のお話も、森下さんのアカデミア出身という経歴がきっかけだったと聞きました。
 
はい、私のインタビュー記事を読んだ出版社の方がアカデミア出身という私の経歴に興味を持ち、お話をいただいた次第です。

「データマイニングエンジニアの教科書」出版にあたっての想い

−そしてこの度、ついに書籍が出版されました。率直な今の気持ちは?

正直執筆中は休日も気が休まらず、現在出版まで漕ぎ着けたことでやっと心の安寧を得たというところでしょうか。いずれにしろこの本は共同著者の同僚をはじめとして、社内外の方々のご助力によってできあがったものです。この場を借りて改めて心からお礼を申し上げたいです。本当にありがとうございました。
また書籍出版のお話をいただいてから約2年、出版社の方々には辛抱強く待っていただきました。特に全面的に見直しをしたいという要望を受け入れてくださったC&R研究所社長の池田さんの言葉には救われました。

−どういう人に向けて、どのような部分を意識して書かれたのでしょうか。

まずは自分が教員だった頃に教えてきた中にいたような、「学部で勉強したけれども、ちゃんと身についていない気がする、もう一度やり直したい」といった思いをもつ学生のみなさんに読んでいただきたいですね。それ以外にも、既に他の分野でご活躍でその分野のドメイン知識を持ってはいるけれども、何らかの事情で「データマイニングに取り組むことになった方」なども想定して書いています。
この本は、データマイニングという業務を広く俯瞰できるように書いたつもりです。データマイニングエンジニアの業務における重要なポイントとなる知識や考えを押さえた上で、それらの有機的なつながりを意識しました。財務会計や技術者倫理についても言及している本は少ないと自負しています。実際に読んでみると、まるで庭園の飛び石を飛んでいるような気持ちになるかもしれません。飛び石の間にある必要な知識については、できるだけ参考文献を挙げるようにしましたので、別途ご自身で勉強していただきたいと思います。そして共同著者の和田の書いたあとがきにもありますが、「変化が激しい中でも本質は変わらない」というのも伝えたいポイントです。

−秋葉原ラボのエンジニアは「課題の本質は何なのか」を考えることをとても大切にしていますよね。共同著者の皆さんや、秋葉原ラボについて聞かせてください。

共同著者のメンバーはシャイなのか、今は私が代表して話していますが(笑)今回一緒に執筆をしたメンバーは数学、情報科学、経済学をそれぞれ修めていたり、前職で医療関係のデータ分析をしていたりと、バックグラウンドは様々です。各々に専門分野があり背景知識が違う中で、「データマイニングエンジニアの教科書」としてある程度一般化して書かなくてはならないわけです。共同著者のみなさんには、担当の分野において書くべきことを取捨選択してもらう必要がありました。また広い範囲の知識をカバーしようとしたので、著者が必ずしも専門ではないことにも言及せざるを得ない個所も多くありました。それぞれの専門分野に敬意と配慮をもって執筆したつもりですが、もしそう読めない箇所が残っていたら我々がいたらぬ故ですのでご容赦いただけるとありがたいです。

秋葉原ラボは大規模データ処理基盤を中心として機械学習システムや検索システムを持っている組織で、その一環としてデータ分析の業務を行っています。それぞれの業務で忙しい中でも、メンバーそれぞれの専門知識を持ってレビューをお願いでき、かつそれに応えてくれるという雰囲気が秋葉原ラボにはありますね。とてもありがたかったです。

データマイニングエンジニアを目指す人へのメッセージ

−最後に、データマイニングエンジニアを目指す人へのメッセージがあれば是非。

本書の「はじめに」で書いたとおり、データマイニングにおいて、今はエンジニアが必要とされる業務でも、そのうちエンジニアでなくてもできるようになります。したがって、その時代その時代で必要な最先端のスキルや知識を持つことがエンジニアには当然に求められます。それは大前提として、本書ではいつの時代でも変わらない考え方や知識が大事であるという立場を示しました。
「はじめに」で引用した『なるよりも続ける方が難しい』というのは、何事においても本当に真実で、ぜひ本書を「続ける」ための一助としていただきたいですし、著者である我々も実践していきたいと思います。


「データマイニングエンジニアの教科書」プレゼントキャンペーン(学生向け)
この度の発売を記念して、学生の方に抽選で10名に著書をプレゼントいたします。ご希望の方は、以下の応募フォームよりお申し込みください。(7月26日 23:59 応募締切)

応募フォーム

この記事をシェア

オフィシャルブログを見る

データ駆動開発がもたらす「ABEMA」開発現場の姿

技術・デザイン

潜在的ニーズを開拓する新しい形のレコメンド

「ABEMA」では、ユーザーとコンテンツの距離をより近づけるべく、データ活用の強化を進めてきました。快適な視聴体験を届けるために「ABEMA」の開発チームはいかにデータを駆使しているのか、またどんな構想を描いているのか、聞いてみました。

記事ランキング

Page Top