ポストコロナをみすえた、メディアにおける「個人データの利活用」のニューノーマル

技術・デザイン

~社会的受容性調査の人工知能学会発表にむけて~

2020年6月9日~12日にかけて2020年度 人工知能学会全国大会 (第34回) が開催されます。期間中はサイバーエージェントのメディア事業における研究開発組織「秋葉原ラボ」と人工知能(AI)を活用した広告配信技術の研究・開発組織「AI Lab」のメンバーが、13のセッション・4つのインタラクティブセッションに参加します。

今日は「個人データ利活用における利用主体と利用目的に応じた社会的受容性」の発表を行う、森下と高野に本研究内容について話を聞きました。

(※)2020年度人工知能学会全国大会 (第34回)は、新型コロナウイルス感染症拡大の影響を受けて,オンライン開催となりました。

Profile

  • 高野 雅典 (タカノ マサノリ)
    2009年 名古屋大学大学院情報科学研究科博士課程修了。博士 (情報科学)。専門は計算社会科学・複雑系科学。システムインテグレータを経て、株式会社サイバーエージェントに勤務。スマートフォンゲームの開発・運用に携わった後、現在はメディアサービスのデータ分析と計算社会科学研究に従事。

  • 森下 壮一郎 (モリシタ ソウイチロウ)
    株式会社サイバーエージェント 技術本部 秋葉原ラボ 2016年入社。博士(工学)。自社サービスのデータ分析と情報倫理に関する研究に従事。

「個人データの利活用」に倫理観が求められる時代

氏名

編集部

「個人データの利活用とプライバシーの両立」について研究を行うようになったきっかけは何ですか?

氏名

森下

私は、東京大学や電気通信大学、理化学研究所と研究畑を歩んできまして、数理工学とその応用を専門に研究してきました。その一方、技術者倫理や情報倫理に取り組むなど倫理の話に以前から興味を持っていました。2016年10月にサイバーエージェントへ入社し、ユーザデータの分析業務に携わる中で「ABEMA」をきっかけに「個人データの利活用」に注目するようになりました。

入社した2016年はちょうど「改正個人情報保護法(※)」が施行前で、個人情報保護委員会と関連省庁が各特定分野のガイドラインを作っている段階でした。このとき電気通信事業分野と放送分野で別々のガイドラインが出来上がっているのを見かけ「新しいマスメディアを目指している「ABEMA」はどちらになるのだろう」という疑問をまず抱きました。

※:個人情報の保護に関する法律(個人情報保護法)は2005年施行。その後、技術の進歩や社会情勢の変化に対応するため、2017年5月に改正個人情報保護法が施行され、3年ごとに見直しを行うことも決まった。2020年は見直しの年にあたる。

 
氏名

高野

「ABEMA」については、電気通信事業と放送のどちらのガイドラインが適用されるのか当時は未定で、そのどちらになるかによって個人データの扱いも変わりますよね。結果的に「ABEMA」においては、放送分野でなく、電気通信事業としてのガイドラインが適用されることになりました。(※)。

氏名

森下

ユーザの受け取り方は放送分野であるのに、法律が関係すると電気通信事業になる。法律ひとつとっても特有の問題が出てくる事に関心が湧き、「適切な個人データの利活用」の必要性について興味を持つようになりました。

※:放送を巡る諸課題に関する検討会 視聴環境分科会 視聴者プライバシー保護ワーキンググループ(第4回) 資料4-4 放送分野ガイドライン改正案に係る前回からの主な修正点 「解説について、本ガイドラインの適用関係を明確にするため、「※受信者情報取扱事業者が、 電気通信事業等において取得し、放送受信者等の個人情報として取得した情報ではない個人情報であって、放送受信者等の個人情報と同じIDで紐付けを行わない場合や異なるデータベースで管理を行うものについては、本ガイドラインの対象にならない。」旨の記載を追記。」

 
氏名

編集部

計算社会科学研究の観点からはいかがですか?

氏名

高野

私は「計算社会科学」という分野の研究をしてきました。所属する「秋葉原ラボ」の業務を通じて得た研究成果(※) を、事業に貢献することはもちろん、研究で得た知見を論文として発表することで、社会全体に還元していくことも重要だと思っています。

 サイバーエージェント プロフィール 高野 雅典
サイバーエージェント プロフィール 高野 雅典

氏名

高野

「計算社会科学」は、アンケートやサービスの行動ログ等の個人データを活用しながら研究を深める分野です。だからこそ、プライバシーの侵害やデータの不適切な利活用は避けなければなりません。

計算社会科学研究についてはインダストリアルセッション「サイバーエージェントにおける計算社会科学」でもご紹介予定です

 
氏名

編集部

計算社会科学は「個人データの利活用」について具体的にどう関わっているのですか?

氏名

高野

例えば私の研究テーマの1つに「仮想社会におけるソーシャルサポート効果の検証」(※) があります。「ピグパーティ」というアバターチャットサービス内で、現実社会でのいじめといった生活の悩みを相談をするユーザーもいる中、そのソーシャルサポート効果を検証し、ユーザーのウェルビーイングに寄与できているのかについて検証しています。

正しく適切に研究できれば、社会の課題解決に有用です。適切な手法で研究し論文を発表することで社会に還元することができ、他のサービスがそれを参考にソーシャルサポート効果を得られるような仕組みを導入することも可能です。そのためにもアンケートの取り方やログの取得範囲等、ユーザーの同意を得た上で、ユーザーに最大限配慮し適切な手法をしっかり考える必要があります。

そこを間違えると、法的には問題がなくてもユーザーの反感を買ってしまい、サービスや運営会社が信頼を損なう結果になってしまいます。

オンラインでの悩み相談におけるアバターを使った非言語コミュニケーションの重要性を明らかに。秋葉原ラボ所属エンジニアの論文が、Webとソーシャルメディアの国際会議「ICWSM」にて採択

 
氏名

森下

一過性の利益追求のために個人データを不適切に利用すると、そういった可能性を潰してしまうだけでなく、ニュースで報じられることで社会的な問題として大きくとりあげられる可能性すらありますよね。

計算社会科学の研究していく上で「個人データの適切な扱い方」への取り組みはとても重要だと思います。

人工知能学会で「個人データ利活用に関する発表」行う意義

氏名

編集部

今回人工知能学会(JSAI2020)で行う発表について見どころを教えて下さい。

氏名

森下

個人データ利活用における利用主体と利用目的に応じた社会的受容性」という発表を行います。個人データの利活用に関して、どういうパターンであればユーザーが受け入れられるのか。逆にどういうパターンであれば受け入れられないのかを調査するにあたって、まずは予備調査としてサイバーエージェントの従業員を対象にアンケート調査し、その結果に分析・考察を加えたものとなります。ただし、私企業の一員としての立場ではなく、一市民として答えてもらいました。

氏名

高野

公共機関や私企業といった「データを利活用する主体」。容姿や収支、行動履歴などの「データ種別」。個人の同定や趣味・嗜好のような「データ処理をした結果得られる情報」。そして統制や与信、福祉など「データを利活用する目的」。

氏名

高野

「主体」「データ種別」「処理結果」「目的」というこの4つの要素の組み合わせについて、どういうパターンであれば受容できて、どういうパターンならば受容できないのかについて、アンケートを実施しました。これによって「受容性※」という観点からどのファクターが特に重視されやすいのかを調べました

※:物事が誰かに受け入れられる程度。特に新しい技術がその時代の国民や住民に受け入れられる程度を「社会的受容性」と呼ぶ。
 
氏名

森下

その結果「受容性」を下げる3つの要素が判明しました。それは、データ種別に「容姿」を使うこと、処理の結果として「個人の同定」を行うこと、そして目的が「統制」であることです。

例えば、フランスの公立高校で入校者の管理のために顔認証システムによるセキュリティ実験を実施しようとして、裁判所に差し止められたという事例があったのですが、ここまでの拒否反応は過剰なように見えて、これはまさに「容姿」「個人の同定」「統制」という3つの要素が揃っていました。

1つ1つの要素だけならそこまで問題にならなかったのかもしれませんが、3つの要件全てを満たしたことで大きな反発を招いたのだと思います。

 サイバーエージェント プロフィール 森下 壮一郎
サイバーエージェント プロフィール 森下 壮一郎

氏名

高野

ただ、あくまで3つの要素が揃うと特に受容性が下がりやすい傾向があるというだけで、3要素が揃っていない場合でも問題になることは当然あります。

国内の事例でも、違法ではないしサービス利用規約に沿ってはいるけど「個人データの利活用」という点では不適切なために、社会の反発を買うケースもいくつか出始めていますよね。

氏名

森下

昨年末、デジタルプラットフォーム事業者の優越的地位の濫用という観点で公正取引委員会が考え方を示したのは記憶に新しいところです

サイバーエージェントは様々な事業を展開していますが、そのいくつかはデジタルプラットフォーム事業です。「個人データの利活用」をする際に「倫理感」は決して無視して通れません。

氏名

編集部

「倫理観」とありますが、個人の主観や思想に依存する面があります。会社やそこで働く人が「個人データの利活用」に携わる際、なにをガイドラインに気をつければ良いのでしょうか。

氏名

森下

先行研究を見ると、進学・就職・結婚といった「ライフチャンスイベント」と呼ばれるものに関わる場合は特に注意すべきだという論文が発表されています。またその論文ではセキュリティはとても重要であると認識される一方で、医療や治安維持のためであればやむを得ない、つまり社会的に受容されるということも報告されています。

氏名

高野

これらの情報も踏まえた上で、アンケートでは少し質問に工夫を加えました。1つは社会通念との兼ね合いと個人的な考えとの兼ね合いをそれぞれ尋ねたことです。「データを利活用しても構わないが自分には関係がない」とか「社会的には良くないが自分は便利だから使う」というケースもあるので、それを軸にアンケートをとりました。

具体的には、「実施されてよいが、自分は利用しない」とか「実施されてはいけないと思うが、自分はやむを得ず利用する」という選択肢も用意しました。

氏名

編集部

「個人データ」を自治体や企業に活用されることへの心理的なハードルもまた、個人の主観や社会の捉え方に依存すると思いますが。

氏名

高野

もう一点工夫したことがあって、データを利用する主体(自治体や企業)が信頼できるかどうかを聞くと同時に、個人的な政治的立場も聞いてみました。これは「保守寄りを自認している人であれば、行政機関等をより信頼する傾向があるかもしれない」という推測からです。

氏名

森下

興味深かったのは、データの利用主体としての公共機関を信頼する度合いについては政治的立場による違いはあまりなかったことです。公共機関にしろ研究機関にしろ私企業にしろ、政治的立場にかかわらず全体的には皆あまり信用していないという結果で……。

結局、受容できるか否かはデータの利用主体が公共機関か私企業かということより、個人的な信条に左右される部分が大きいという結果でした。社会的受容性と言いつつも、実は個人的な考えで決まるというのは難しいところでもあり面白いところでもあると思います。

メディア事業における「個人データの利活用」のありかた

氏名

編集部

アンケート調査の結果も踏まえた上で、個人データを活用する際に今後はどういったことに気を付けていくべきでしょうか。

氏名

高野

調査結果から分かったのは説明の重要性です。個人データをどういう目的で使うのか、誠実に説明した上で同意を取るという形を取れば、センシティブなデータであってもある程度受け入れてもらえるということが示唆される結果が出ました。

氏名

森下

個人情報の扱いにおいて非常に重要なのが利用目的の説明と同意です。ただ統制や管理・監視という目的だけでは嫌がられてしまいますが、それが例えば福祉などにプラスになる場合は受け入れられる可能性も高くなります。

そして同意するか否かの判断材料として、アンケートで考慮に入れた4つの要素をきちんとユーザーに提示することが重要です。我々の場合は「主体」は私企業なので、残りの「データ種別」「処理結果」「目的」を明示し、その上で同意してもらうというプロセスを明確にする必要があります。

今まではそこがあまり明確になっていなかったため、ユーザ側も釈然としなかった部分があったのではないかと思います。

氏名

高野

また、今は新型コロナウイルスに関連して、GPSデータの活用が話題になっています。北海道大学の西浦博教授が「人と人との接触機会8割削減」を提案し、5月1日には接触頻度の試算結果を発表しました。

その試算に対し、国立情報学研究所(NII)の水野貴之准教授が独自の接触頻度モデルを発表して新たな提言を行いましたが、その提言は西浦教授らの試算結果発表からわずか7日後の5月8日というかなりのスピード感でした。

個人データの取扱いに関して明確な決まりがあれば、データを購入して分析してパブリッシュをするという一連の作業をそのようなスピード感で行うことも可能になる。非常に有用なことだと思うので、その建て付けはしっかりやって行きたいと思います。

サイバーエージェントでも、個人情報の取り扱いについて明確化していますね。

氏名

森下

コーポレートサイトに「個人情報保護の取り組み」という項目がありますが、当社セキュリティチームが主導で取得目的などを明記するにあたって、私は研究開発組織の立場から関わらせていただきました。

氏名

編集部

秋葉原ラボのように、複数の人が個人データを扱う組織において、皆が同じ姿勢で技術者倫理観を持つには何が必要なのでしょうか?

氏名

森下

そのために「秋葉原ラボ」では「データ利用基準」を策定するためのワーキンググループを立ち上げました。

背景には、同じデータエンジニアでもデータの利用基準が僅かにずれていたり、「このようなケーススタディでは、どこまで利用OKなのか」と頻繁に相談を受けたり議論をする機会が続き、組織の知見としてきちんと蓄積したいと思うようになりました。

データには、それぞれ様々な権利があるので、その権利関係をデータごとに整理して、使っていいパターン、使える使い方のパターンを列挙していくのがこのワーキンググループの目的です。

今はケーススタディを集めて、そこから共通するパターンを見出して改めて文書にまとめている途中です。まずは社内で共有して、ゆくゆくは外部に向けても公開できると良いと思っています。

データの利活用は研究開発組織にとっては技術的な問題ですが、当然法務の知識や見解も必要になります。技術者にとっては法的な検討は難しいし、法務担当者にとっては技術的な検討が難しいので、両方の観点からいま整理している知見は、データ活用に携わる人にとって参考になるものだと思います。

ワーキンググループ発足時に起草した趣意書。当初は第三者に権利があるデータを対象とするものだったが、議論の末に個人情報についても整理することになった。
ワーキンググループ発足時に起草した趣意書。当初は第三者に権利があるデータを対象とするものだったが、議論の末に個人情報についても整理することになった。

ポストコロナ時代において個人データの取り扱いは変化するのか?

氏名

編集部

今回の研究で得られたものを、今後どのように活かしていくのでしょうか。

氏名

森下

私が所属している秋葉原ラボはサイバーエージェントのメディア事業における研究開発組織です。大規模データ処理基盤を運用していることと、コーディネーター職をおいていてビジネスの課題のヒアリングなどしていることから、何かデータの活用をしたいというような件は、秋葉原ラボに集まってくる体制になっています。

そこで秋葉原ラボは、例えるならチェックポイントのような役割を果たせたらよいと考えています。つまりデータ利活用の課題について、技術的には可能だけれども、こういう調査結果を踏まえると反発を受ける可能性があるということが、もしあれば指摘してトラブルを未然に防ぐという。横断的な研究開発組織としてそういう役割も担っていければいいなと思っています。

氏名

高野

私の場合は、計算社会科学の研究を通じて会社に貢献し、そして社会にとっても意義のある研究や発表をしたいという思いがあります。

今回の研究もその思いに由来したものではあるわけですが、誤解を恐れずに言うならばおもしろい・重要だと思ったことを柔軟に研究したいんです(笑)。やりたい研究を自由にやるためには、レッドラインを把握しておく必要があるというところです。

氏名

森下

個人データの取り扱いについては今後も大きく変化していくと思います。

GoogleはサードパーティCookieの廃止を決めるとともに、広告配信とユーザーのプライバシー保護を両立させるための取り組み「Privacy Sandbox」を発表しました。Appleも収集するデータは必要最低限の情報にとどめ、端末の中で完結するような仕組みを整備していくと主張しています。

氏名

高野

例の新型コロナ対策のための濃厚接触通知アプリもかなりプライバシーに配慮したものになっていますよね。

氏名

森下

そうなんです。GoogleとAppleには接触情報が送られない仕組みになっています。日本で開発が進められているアプリもGoogleとAppleのAPI利用を前提としていて、当局のサーバーにも接触情報は送られません。

ただこの辺りは先ほど述べた「説明と同意」が絡んでくる話です。接触情報が送られないことについてはAPIの仕様を見れば明らかなのですが、そういう風に説明したところで理解できる人は限られますし、国民の理解が得られるかという部分について省庁が慎重になるのも分かります。

氏名

高野

説明することがとても難しいですからね。

氏名

森下

とはいえ、公衆衛生が目的であれば受容されやすいというのは既に述べたとおりです。ポストコロナ時代を考えたときに、社会的通念に応じた受容というところが大きく変わっていく可能性は高いと思います。一方で個人の観念に応じた受容の部分は、「統制」に対する忌避感を考えると、よほど大きな個人的な利便性などがない限りはあまり変わらないのではないかと思いますね。

2020年度人工知能学会全国大会 (第34回)
サイバーエージェントグループからの発表一覧

招待講演

6月9日(火) 16:40 ~ 17:00
広告とAI
WWW2020の参加報告と研究紹介
藤田光明(AI事業本部 Dynalyst)

セッション

6月9日(火) 13:40 ~ 14:00  共著
広告とAI
深層学習のハイパパラメータ最適化手法に求められる性質
渡邊 修平1、野村 将寛2、大西 正輝1 (1. 産業技術総合研究所、2.AI Lab)
 



6月9日(火) 14:20 ~ 14:40
広告とAI
広告素材感情スコア予測のためのドメイン適応
大田 和寛(AI Lab)
 

6月9日(火) 16:00 ~ 16:20  共著
ダイナミックトピックメモリネットワーク:心的内部状態の変化を捉えた時系列行動予測
中村 凌子1、稲垣 青空1、大澤 僚1、深見 俊和2、宗政 一舟2、高木 友博1 (1. 明治大学大学院、2. AI事業本部 AIR TRACK)
 

6月9日(火) 16:20 ~ 16:40
ランク学習を用いた広告クリエイティブの配信優先度の推定
岩崎 祐貴1、谷口 和輝 (1.AI Lab)
 

6月9日(火) 17:20 ~ 17:40   共著
単語の対応関係を利用したスパン候補の絞り込みによるキャッチコピーの対句構造解析
丹羽 彩奈1、脇本 宏平2、西口 佳佑2、毛利 真崇2、岡崎 直観1 (1. 東京工業大学、2. AI事業本部 極予測AI )
 

6月9日(火) 18:20 ~ 18:40  共著
インターネットテレビ局におけるニュースチャンネルのユーザ体験が政治関心・ニュース知識に与える影響
高野 雅典1、小川 祐樹2、高 史明3、森下 壮一郎1(1. 秋葉原ラボ、2. 立命館大学情報理工学部、3. 神奈川大学)
 

6月10日(水) 18:30 ~ 18:50 共著
行動グラフの畳み込みによるユーザー埋め込み表現を用いた行動予測
稲垣 青空1、中村 凌子1、大澤 僚1、深見 俊和2、宗政 一舟2、高木 友博1 (1. 明治大学大学院、2. AI事業本部 AIR TRACK)
 

6月10日(水) 19:10 ~ 19:30  
感染症モデルを用いた音楽拡散現象の分析
武内慎(秋葉原ラボ)
 

6月11日(木) 15:40 ~ 16:00    
個人データ利活用における利用主体と利用目的に応じた社会的受容性
森下壮一郎、高野雅典 (秋葉原ラボ)
 

6月11日(木) 15:40 ~ 16:00 共著
GRUとAttentionによる意識遷移と地域特徴との一致性を考慮したPOI訪問予測
大澤 僚1、中村 凌子1、稲垣 青空1、深見 俊和2、宗政 一舟2、高木 友博1 (1. 明治大学大学院、2. AI事業本部 AIR TRACK)
 

6月11日(木) 16:20 ~ 16:40
GPSの位置情報により計測された店舗への来店者数と気象との関連性に関する一考察
深見俊和1、森脇大輔2 (1.AI事業本部 AIR TRACK、2.AI Lab)

インタラクティブセッション

6月11日(木) 13:40 ~ 15:20 
自動生成された広告文の人手評価における評価指標と支援ツールの提案
澤井 悠1、張 培楠2、吉本 暁文1(1.AI事業本部極予測TD、 2.AI Lab)

バナー制作のための背景を考慮した自動テキスト配置
大峠和基1、大谷まゆ2(1.筑波大学・ AI Labリサーチインターン、2.AI Lab)
 



6月12日(金) 09:00 ~ 10:40 
インターネット広告におけるキーワードに基づく広告文の自動生成
脇本宏平1、川本峻頌1、 張培楠2 (1.AI事業本部極予測TD、 2.AI Lab)

チャットボット運用効率化のための新規問い合わせ候補抽出システム
戸田隆道、杉山雅和、友松祐太 (AI Shift)
 

インダストリアルセッション

6月11日(木) 15:40 ~ 17:20 
サイバーエージェントにおける計算社会科学研究
高野雅典(秋葉原ラボ)

この記事をシェア

オフィシャルブログを見る

「データサイエンスを通して事業をスケールさせたい」
経済学を活かしたビジネス価値創出への挑戦

技術・デザイン

昨今のAIブームに対して「一過性のブームでなく持続的な価値をもたらすために、『データサイエンスでビジネス貢献すること』を意識しています」そう話すのは、新卒2年目から広告配信プロダクト「Dynalyst」でデータサイエンスチームのリーダーを務める藤田。
経済学を研究後、サイバーエージェントに入社し多方面で活躍をする彼に、ビジネス貢献するためのデータサイエンスチーム作りの工夫や、プロダクトへの向き合い方について、聞いてみました。

Page Top