産学連携で未成年者の
ネットリスクを軽減していく

技術・デザイン

~データ解析による社会貢献~

サイバーエージェントは大学や研究機関と連携し、研究・開発をすることで、様々な社会問題に向き合っています。FEATUReSでは産学連携のメリットを生かし、社会貢献につながる取り組みを連載形式でご紹介。第一回目なる今回は、ログ解析によって未成年者がネット上で巻き込まれるトラブルを未然に防ぐというもの。テクノロジーや計算社会学を通じて、誰もが安心・安全にインターネットを利用できる社会の実現を目指します。

Profile

  • 鳥海不二夫 (トリウミ フジオ)
    東京大学大学院工学系研究科 システム創成学専攻 准教授。博士(工学)。情報法制研究所理事。計算社会科学,人工知能技術の社会応用などの研究に従事。主な著書に「強いAI・弱いAI 研究者に聞く人工知能の実像」「人狼知能 だます・見破る・説得する人工知能」等

  • 高野雅典 (タカノ マサノリ)
    株式会社サイバーエージェント 技術本部 秋葉原ラボ 2011年入社。博士(情報科学)。自社サービスのデータ分析と計算社会科学研究に従事。

ネット利用が当たり前の時代だからこそ、子どもたち自身にネットリスクを気づかせることが必要。

東京大学とサイバーエージェントで「未成年者のネットリスク軽減」をテーマとした共同研究(※1)を行っています。鳥海先生がこのテーマを選んだ理由を教えてください。

※1:未成年女性のネットリスク分析Detection of Dangerous Interactions in Online Chat Services など

鳥海氏:未成年者のネット利用は当たり前になってきていて、中高生にとどまらず小学生でも日常的に使う時代になっています。それに伴い、ネットリテラシーを学校で学ぶようになっていますが(※2)、コミュニティサイトでの誘い出しに起因する児童買春や児童ポルノ被害など、未成年者がネット上のトラブルに巻き込まれるケースは増加する傾向にあります(※3)。

※2:平成29年度 青少年のインターネット利用環境実態調査 調査結果(概要) p.15
※3:平成28年上半期におけるコミュニティサイト等に起因する事犯の現状と対策について p.2


ネットリスクの回避方法を学校の先生に教えてもらえればベストなのですが、一般的なネットリテラシーならまだしも、現実的な対処法となると子供たちの間で流行っているゲームやチャットに詳しくなる必要があります。しかし先生たちも忙しいし、何より大人が子供たちと同じ目線でのサービス利用が難しく、実態を把握しにくいというのが現状です。

子供にネットを使わせないというアプローチもありますが。

鳥海氏:例えば「ネットにハマると成績が落ちる」という主張がメディアに出たとして、一部の親にとってはまるで福音のように響き「それなら、こどもにはネットを使わせないようにしよう」という対策をとりがちです。確かに、ネットを禁止するのは効果的に思えるし、手段としても楽なので選びたくなるのはわかります。ただ、現代の子どもたちは、コミュニケーションの1つとしてネット利用をしているというのが現実です。
※ 4:平成29年度 青少年のインターネット利用環境実態調査 調査結果(概要)内閣府

それを禁止するということは「休み時間にお友達と話をしてはいけません」あるいは「学校では良いけれど、放課後はお友達と話をしてはいけません」という決まりを作るようなものです。既に日常的に使われているものを、そういう形で禁止するのは効果的だとは思えません。

そこで、ネットの利点は残しつつ、未成年者のネットリスクのみを軽減できるような社会システムができれば、誰もが安心してネットを利用できると思ったのが、この研究の発端です。

そのために必要なことは何ですか。

鳥海氏:システムとリテラシーの向上が両軸で必要だと考えています。例えば誘い出しを未然に防ぐために、サービスをシステム的に制御する必要はありますが、誘い出しの手口も日々刷新されていくなか、システム的なシャットアウトはイタチごっこになりがちです。

仮にサイバーエージェントのコニュニティサービスから「誘い出しをするような悪い大人たち」をシステム的に排除したとしても、もっと誘い出しがしやすい別のサービスに移るだけです。そのため、子供たち自身が「この会話は危なそうだな」と気付くことができる仕組みづくりも重要になってきます。

我々のプロジェクトではシステム的にシャットアウトするだけでなく、子供たち自身にネットリスクを気付かせることにも主眼を置いています。

ログ解析から見えてきた「誘い出し」の膨大さ。
それを重点的に監視することでトラブルを未然に防ぐ。

この共同研究は、どんなプロセスで進んでいるのでしょうか。

高野:きっかけは、私がコミュニティサービス「755」の公開トークのデータにふれる機会があった事からです。当時、ソーシャルゲームのデータからユーザーの行動を理解しようという共同研究(※5)を鳥海先生としていまして、その時に「755」のNGワードのデータも参考にしたのですが、誹謗中傷や未成年者への誘い出し、それこそ「写真をちょうだい」とか「ID教えてよ」といった発言が削除データとして記録されていました。

※5:潜在状態ネットワークに基づくソーシャルゲームユーザの行動抽出Analytical method of web user behavior using Hidden Markov Model

誘い出しのリアルな手口を目の当たりにし、このデータを活用することで鳥海先生が提唱している「未成年者のネットリスク軽減」にアプローチできるのではないかと思いました。そこで「ぜひ一緒にやりましょう」という提案をして、この共同研究がスタートしました。

鳥海氏:当初我々は未成年者を誘い出すというのは特異な行為だと思っていました。よってノイズを発見するための、パターンの異常値検出のアルゴリズムを使うことで誘い出しをする人を見つけられると仮説を立てていました。

ところが異常値検出では出てこない。不思議に思っていたら、1つのクラスターとして「誘い出しをする人たち」が形成されていました。

つまりボリュームが大きすぎて異常値として検出されなかった。「主婦」や「サラリーマン」のクラスターと並んで、「誘い出しをする人たち」の典型的パターン行動という塊が出てきたんです。1日に何十人、何百人へ声をかけるというものなんですが。これは755だけではなく、他のサービスでも同じ傾向です。Twitterで「#家出」という言葉を書いた人全員に「うちにおいでよ」といったメッセージを送るケースもありました。(※6)

我々にとっても驚きの発見でしたが、この情報を紹介するとその多さに皆さん驚かれます。

※6 : 第32回人工知能学会全国大会で発表予定
[2C2-02] SNS上の一方的な選好をもとにしたコミュニケーションの解析
浅谷 公威、川畑 泰子、鳥海 不二夫、坂田 一郎

高野:ネットが発達したことで、簡単にアプローチできるようになってしまったという面はあると思います。加えて、今までは道端で行われていたことがネット上で行われるようになったため、可視化されたという面もあるかもしれません。

クラスターを形成するほど数が多いのであれば、データ分析の得意とするところですし、傾向を抽出することで、対策をとることが可能かもしれないということで、更に研究を進めました。

会話ログを分析することで、未成年者のネットリスクをどうやって軽減させることができるのですか?

高野:最近は、個人情報を登録しなくても気軽に始められるチャットアプリが流行っています。そうなると、そもそも未成年というユーザーの定義がありません。保護すべき未成年者を特定するために、まず検出方法を考える必要がありました。

会話ログを分析することで、「未成年で声をかけられる可能性のある人」というグループを検出することができます。そのグループに属する人をある程度特定することができれば、彼らに声をかけてくる人を重点的に監視するということもできます。

今までは事後監視だったのですが、1秒で返信するような早い会話のやり取りへの対策が取れなかったんですね。しかし「特に危ない可能性のある人たち」が予めわかっていれば、監視強化の濃淡もつけやすくなります。監視に際限なくコストをかけることはできないので、危ないところを特に重点的に見ることができるように、ということをまず最初にやろうとしています。

鳥海氏:分析が進めば、子供たちに対し「知らない人と話しても大丈夫ですか?」というような警告を出すという運用も可能になります。ただこれは非常にセンシティブな問題で、まだ何もしていないのに相手が悪い目的を持っていると決めつけるわけにはいきません。社会学系の研究者にも協力してもらいながら、社会的にどこまでなら実現可能か調べているところです。

子供たちへの過剰な監視になりませんか?

鳥海氏:そういう意見もありますが、未成年者に関しては、放置することで事件に巻き込まれる可能性もあるため、運営会社による対策が必須だと考えています。

高野:当社は独自の総合監視基盤システム「Orion」を活用(※7)し、ブラックリストの単語でフィルタリングした上で、広範囲にわたり監視をしています。しかし、売春や誘い出しを示唆する言葉はフィルターを避けるために新しい略語が次々と出てくるので、どうしても漏れてしまうことがある。だからこそ、最優先で監視すべき未成年者への対策を強化するなど、監視に濃淡をつけられることが重要になります。

※7:カスタマーサポートと秋葉原ラボの協力体制で実現する、サイバーエージェントの安心、安全なメディアサービス運営とは?

公的機関による監視が困難なネット社会において、技術やテクノロジーはどこまで犯罪やリスクを予防できるのでしょうか?

鳥海氏:サイバーエージェントのような体力のある企業の場合、例えば「Orion」のような監視システムを構築してサービスの健全化に向けて運用することができますが、予算や人手の問題でそういったところに着手できない事業会社はたくさんあります。しかし、そういった企業にもシステムを導入していかない限り、子供たちの安全は守れません。

そこで我々のような公的な機関がそういうシステムを開発して提供するというのも1つの手段です。

高野:不適切な画像などに関しては、最近ではAmazonのクラウドAPIのようなものもあります。APIを安価で提供したり、日本語や日本の環境に合わせたものを当社で提供するということも不可能ではないですよね。

鳥海:フィルタリングのデータをなんて、事業会社間で共有できれば凄く良いと思うんですけどね。もちろん簡単なことではないと思いますが。

産学連携のメリットは、
データの提供による研究の加速。

大学が企業と共同研究をすることで、どんなメリットが得られるのでしょうか。

鳥海氏:お金とデータがもらえる(笑)。もちろんどちらも重要ですが、一番はデータが提供してもらえることでしょうね。我々のようなデータを扱う研究者は常にデータが欲しいので、企業に協力を求めることになるのですが、快く受けていただけることは決して多くないんです。その点、サイバーエージェントさんは積極的に協力してくださるので、この姿勢は大変ありがたいです。

高野さんとの最初の共同研究(※8)のきっかけも「ゲームのこういうデータがあるんですよ」と聞いて「じゃあくださいよ」と気軽にお願いしてみたら、数日後には「データ提供できます」と返ってきた。学会の帰りに雑談で相談したことが、すぐに会社の了承を得て実行に移してくれる。逆に、準備が間に合わないので我々が慌てたぐらいです(笑)。

※8:潜在状態ネットワークに基づくソーシャルゲームユーザの行動抽出Analytical method of web user behavior using Hidden Markov Model

高野:企業側としては、我々だけではできない研究に携わってもらえる事がメリットになります。私自身、業務内でも研究にかなりの時間を割いていますが、それでもまだまだ時間が足りない。共同研究先を増やして、様々な分析結果を出して貰えることで、サービスの改善に役立てることができます。それは当社としても利点が多いと考えています。

「Orion」で削除した不適切な発言データを活用して、一般的な傾向を見出すことができれば、未成年者を含め多くのユーザーがより安全で、ストレスなくネットを使えるようになるかもしれない。インターネット企業であるサイバーエージェントにとっても利点になりますし、Web業界への貢献という意味でもこの研究を進めていきたいですね。

鳥海氏:今ソーシャルメディアのグローパルトップはFacebookですが、10年後に業界地図がどうなっているかはわかりませんよね。Facebookはネットリスクについてもちゃんと考えて色々取り組んでいますが、今後また誕生するであろう新しいメディアもちゃんとしている保証はない。そういうメディアが日本に入ってきた時のリスクを抑えられるような土壌を日本のWeb業界で作っておければと思います。

高野:FacebookにはFacebook Researchという研究所があって、社会学者や経済学者、心理学者が様々な研究を行っていますね。素晴らしい研究成果がどんどん出ています。彼らがフェイクニュースや社会の分断、選択的接触などに加え、ネットリスクについても様々な研究を行っている。様々なネットトラブルを未然に防ぐためにも社内でデータ解析をする人がインターネット上での社会科学を学ぶ必要があるのだろうと思います。

鳥海氏:「計算社会科学(※9)」ですね。

※9:計算社会科学(Computational Social Science)とは、「大規模社会データを情報技術によって取得・処理し、分析・モデル化して、人間行動や社会現象を定量的・理論的に理解しようとする学問」のこと。(計算社会科学研究会公式サイトより)

「計算社会科学」を用いてネットリスクを軽減。
産学連携の研究で社会貢献にも寄与。

鳥海氏:計算社会科学は世界的にも研究者が増えている分野です。計算社会科学に興味を持っている方は、大学の先生の中にもたくさんいますが、実際に研究テーマにとり組む際、データをどこから提供してもらうかが課題になります。

企業との産学連携といっても、膨大なデータを蓄積している企業は数限られますし、サービスのコアに関わるデータを提供するとなると、普通の企業はやっぱり出しづらいのが現状です。
目先の利益にとらわれるのではなく、長期的な取り組みでによる社会貢献の視点が必要です。

高野:企業で研究をする場合、例えば広告のクリック率を高めるとか、サービスの継続率を高めるといった、事業の売上を伸ばすことが研究開発の中心になりがちです。

ただ、それだけではなく、新しい課題や新しい価値を発見して、それに関する研究を進めることで、結果的にサービスの価値を高めていくこともできます。

鳥海氏:大きな会社だからこそできる社会貢献もあると思うので、サイバーエージェントさんのようなデータの提供に積極的な企業さんの存在はありがたいです。データを提供することに積極的な企業が増えれば、日本の社会科学も発展していくし、ネットリスクなどの研究も進んでいきます。

高野:そうですね。ネットリスクが減ることは当社も受ける恩恵が大きいので、こうした研究は産学連携の良いところです。これからも積極的に研究を進めていきたいですね。

(取材協力) 東京大学工学系研究科

この記事をシェア

オフィシャルブログを見る

対象者は1,000名以上、サイバーエージェントが日本一GitHub Copilotを活用している理由

技術・デザイン

当社ではAI時代においてもリーディングカンパニーであるために、技術力を駆使して会社の持続的な成長を創出することを目指しています。2006年より「技術のサイバーエージェント」ブランドを掲げていますが、それらを実現するため2023年を「生成AI徹底活用元年」とし、様々な取り組みを進めています(参照:「AI時代においてもリーディングカンパニーを目指す、サイバーエージェントの技術戦略」)。

AIによって、技術者を取り巻く環境は大きく変化しましたが、その最たる例がGitHubが提供するAIペアプログラマー「GitHub Copilot」ではないでしょうか。当社では2023年4月の全社導入以来、対象となる1,000名以上の技術者のうち約8割が開発業務に活用しており、アクティブユーザー数日本一、またGitHub Copilotへのコード送信行数、GitHub Copilotによって書かれたコード数も国内企業においてNo.1の実績です。

社内でGitHub Copilotの活用が大いに進んでいるのはなぜなのか、旗振り役を務めるDeveloper Productivity室 室長 小塚に話を聞きました。

Page Top