技術・デザイン

社会人ドクターは秋葉原でネット健全化の夢を見る

~スパム対策で見えてきた企業の社会的責任~

Profile

  • 數見 拓朗 (カズミ タクロウ)
    技術本部 秋葉原ラボ所属。2013年入社。博士(経済学)。自社メディアサービスのデータを活用した機能の開発や運用に従事。

経済学出身からネット業界の機械学習エンジニアに

ー 学生時代は経済学を専攻にしていると伺いました。なぜIT業界に興味をもったのですか?

アメリカの経済学者でハル・ヴァリアンという方がいます。経済学部生にとっては「Microeconomic Analysis」でお馴染みなのですが、彼はGoogleのチーフエコノミストとして、Googleの広告オークションの設計に関わっていました。

「IT企業には様々な経済学的なトピックがある」という話に面白さを感じてインターネットに興味をもちました。

ー 2013年にサイバーエージェントの研究開発部門に新卒入社していますが、何に魅力を感じて入社を決めたのですか?

Googleでのハル・ヴァリアンの活躍に影響を受け、日本のIT企業における経済学の活用事例について調べていました。偶然、秋葉原ラボが技術雑誌に連載している記事を見て、サイバーエージェントのことを知りました。

その記事は「Ameba」における大規模ログ解析基盤・機械学習・検索・データ分析について紹介していて、特に「一般化線形混合モデル」や「MCMC」などのキーワードが目に留まったことを覚えています。というのも、大学でこうした技術を利用していて実証分析をしていて、その経験や知識がビジネスの世界で役に立つのではないかと考えたからです。

WEB+DB PRESS サイバーエージェントを支える技術者たち 第31回 秋葉原に集結した技術者集団Ameba Technology Laboratoryの役割を探る

残念ながら経済学のトピックについて触れられてはいませんでしたが、これだけ多様な課題に取り組んでいるなら、課題解決に経済学的視点が役に立ちそうだと期待を抱いていました。

新卒1年目の仕事は、ガールフレンド(仮)やアメブロのデータ分析

ー 新卒で入社して最初の仕事はなんでしたか?

秋葉原ラボに配属された後、「ガールフレンド(仮)」や「天下統一クロニクル」などのデータ分析に関わりました。秋葉原ラボで開発したデータ解析基盤(Patriot)を活用し、ユーザーの行動ログを分析し、継続しやすいユーザーの推測などを行いました。

その後「アメーバブログ」を担当することになりました。投稿記事に含まれるキーワードで、流行になりそうな単語を早期に検出する手法の開発や、スパムブログを駆逐するプロジェクトにも関わりました。

他には、バンディットアルゴリズムのライブラリ開発や、行動ログからユーザー属性を推定するプロジェクトを担当しました。

ー 運用中のシステムのログに触れてみてどう感じましたか?

ユーザの行動ログだけでも、1日数テラバイト単位になり、研究では扱うことのないようなデータサイズに驚きました。

また、ストリーミング処理基盤の開発やHBaseを用いたグラフ構造の表現など、大規模なデータを取り扱う上で、必要な技術への投資と知見の蓄積がされていたことにも驚きました。

2013年当時としては珍しいことだったのではないでしょうか。

スパム対策とネット企業の社会的責任

ー 新卒の時に経験した仕事を通じて、大きく手応えを感じた経験はなんですか?

2013年当時「アメーバブログ」はスパムブログの温床となっていて、様々なスパムが投稿され、検索エンジンからの検索流入が減少する要因になっていました。

そのため秋葉原ラボは、SEOチームやカスタマーサポートチームとも協力をしてスパム対策に取り組むことになりました。

私の担当は、スパムを類型化してデータを整理したり、ルールベースや機械学習手法を利用して効率的に検出する方法を模索することでした。

カスタマーサポートと秋葉原ラボの協力体制で実現する、サイバーエージェントの安心、安全なメディアサービス運営とは?

また、2016年からは、Googleが主催する「Advanced Hosting Meetup」(以下、AHM)というプログラムに参加しています。AHMでは、各社のスパム事例を共有・調査をしながら、効果的な検出方法を議論しています。開発した手法は実サービスに適用し、対策の効果を検証しました。

Yahoo, Seesaa担当者と議論した時の写真
Yahoo, Seesaa担当者と議論した時の写真

ー ネット企業がスパムを放置すると何が起きるんですか?

スパムの中には間違った情報を掲載した記事もあれば、悪質な出会い系サイトへ誘導する記事もあります。こうしたスパムは時として、大きな社会問題として顕在化します。なぜならユーザーが、誤った情報から金銭・健康被害を受けたり、犯罪に巻き込まれたりする可能性があるからです。

このような被害を未然に防ぐことは、ネット企業の社会的責任だと私は感じています。

スパム対策がユーザを守ることにつながるというのは言うまでもありませんが、インターネットというプラットフォームでビジネスを円滑に展開する上でも、スパム対策は重要です。

私たちの提供するサービスでルール違反を行っているユーザーやスパムを放置したことで誰かが不利益を被ってしまうと、結果的にインターネット全体の信頼性や利便性を損なうことになりかねません。

業務で得た知見をもとに書かれた論文

ー 業務で得た知見で論文を書くことはありますか?

自分は2年前くらいに研究会で発表していましたが、今は開発のほうに集中しています。研究に100%集中しているメンバーもいます。またサービス開発に携わった後に、その過程で見出した新規性や技術の有用性を、論文にして発表するメンバーもいます。

例えば、秋葉原ラボの最近の研究成果として、高野雅典と東京大学大学院との共同研究である「楽曲聴取行動系列の階層化による聴取傾向変化の検出と行動分析」があります。本論文は情報処理学会の山下記念研究賞を受賞しました。

秋葉原ラボの高野雅典が情報処理学会にて2018年度山下記念研究賞を受賞

この論文は、音楽ストリーミングサービス 「AWA」 のユーザー音楽聴取データを対象にユーザーの楽曲聴取行動系列を階層的に分析する手法を提案しています。

サービスの課題に合わせて適切な手法を選ぶことは容易なことではありません。よく知られた分析手法でありますが、サービス改善につながる分析結果を提示していることが、この論文のすごいところだと思います。

社会人ドクターを目指すことについて

ー 2015年に社会人ドクターになっていますね。

アキバ系社会人ドクターのすすめ

ブログにも書いた通り、修士の時に携わっていた研究があって、共著者の人から「再開しないか」と声がかかったのがきっかけです。研究をさらに深化させようと考え、挑戦することにしました。

ー 業務と研究は両立はできますか?

両立というか、とにかくやらざるを得ない状況でした。苦労などは以前ブログに書きました(笑)。論文提出前は、業務終了後に家の近くの喫茶店に通い、執筆をしていました。

幸い、秋葉原ラボにはドクターも多いので、周りの理解はすごく得られました。論文の提出前とかは気にかけてくれましたし、何より応援する文化があったのには励まされました。

ー 社会人ドクターになると、どんな能力が身につくと感じましたか?

一言で答えるのが難しいですね。先輩はよく「本質を捉える能力」と話しています。

ー 「本質を捉える能力」とはなんですか?

研究では、限られた時間の中で「課題発見の分析」「課題解決手法の探索」「手法の実装と評価」を何度も繰り返し行います。指導教官や社内外の博士の方と話すと、このプロセスを繰り返しながら問題の本質に迫っている人が多いように思います。

また、このプロセスを実行する前に「これまで行われた研究や背景を交えながら、課題設定から解決までのストーリを描ける」人が多いことに気づきました。

仕事では具体的なビジネス成果に昇華させる必要がありますが、課題解決までのプロセスは研究と共通しています。

ー 例えば実際のサービスでどう役に立つのですか?

スパム対策を例にすると「アメーバブログ」では他サイトの内容をコピーしたものがいくつか投稿されています。ある記事がコピーかどうかを判定するには、オリジナルなサイトと比較する必要があります。

しかし、オリジナルサイトとアメブロの記事は大量にあるので、現実的な時間内ですべての記事の判定を行うためには工夫が必要です。

「どのようなコピー記事がアメーバブログに存在するのか」「効率的に検出するにはどうすればいいか」「どのように実装し評価するか」などの問いを立てて、一つ一つ検証と実装を繰り返しました。こうした課題解決を目指すプロセスは、どのような問題を取り扱っても同じであるように思います。

もし後輩が「社会人ドクターを目指したい」と言ったら?

ー 自分のチームメンバーがドクターになりたいと言ったらどうしますか?

もちろん応援したいです。

弊社は社員のチャレンジを応援する文化は強く根付いていると思います。どのようなテーマの研究か、社会人ドクターを受け入れている研究室か、業務と両立できるか、などを考慮する必要があるかなと思います。

博士課程で学ぶことは仕事でも役に立つことは間違いありません。会社として公式にサポートする仕組みはありませんが、博士号をすでに取得しているメンバーで、草の根的にサポートしていきたいと思います。

オフィシャルSNSアカウントで更新情報発信中
Page Top