プレスリリース
自然言語処理分野のトップカンファレンス「EMNLP 2021」の System Demonstration Track にて論文採択 ー モバイル端末用の効率的なアノテーションツールを提案 ー
CAゼミ制度発の論文採択、「極予測AI」・「極予測LP」のデータサイエンティスト、「AI Lab」の研究者が研究に参加
株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証一部上場:証券コード4751)は、効果予測AIで広告効果を最大化する「極予測AI」に所属するデータサイエンティストの川本峻頌、脇本宏平および、広告効果の高いLPの効果予測・制作を行う「極予測LP」に所属するデータサイエンティストの澤井悠ならびに、人工知能技術の研究開発組織「AI Lab」に所属する研究員の張培楠による共著論文が自然言語処理分野の国際会議「EMNLP 2021」※1の「System Demonstration Track」に採択されたことをお知らせいたします。
「EMNLP」は世界中の研究者によって定期開催される国際会議で、「ACL」「NAACL」※2と並び、自然言語処理分野(NLP)でもっとも権威ある国際会議のひとつです。EMNLP の「System Demonstration Track」は、NLPの理論や応用研究を踏まえた、技術面で革新的なシステムのデモンストレーションを行うセッションです。本セッションでは、NLP・AI 分野をリードする世界中のトップ企業や大学に所属する研究員や開発者が多数参加・発表を行い、今年の採択率は31% と、本会議と同様に難易度が非常に高いことで知られています。
本論文は、2021年11月にオンラインと現地で開催される「EMNLP 2021」での発表を予定しています。
■研究背景
近年、機械学習を活用したプロダクトの広がりとともにアノテーションの需要は高まりつつあります。
アノテーションとは、機械学習に用いるデータに対して人の手によって関連する情報を付与する作業のことです。アノテーションは、自動で正解が紐付かないタスクや、自然言語生成のような定量的な評価が難しいタスクに対して、人手によって一定の基準で擬似的な正解として定性的に評価することができるため、機械学習モデルの研究開発において非常に重要です。
さらに機械学習の精度向上には多くのデータを使用するため、大量のデータに対して継続的かつ効率的にアノテーション作業を行うことが必要とされており、それを実現する手段として「アノテーションツール」が広く活用されています。
こうした背景から、当社ではこの領域に対して研究に取り組んでおり、技術者のスキルアップ支援を目的に一定の業務時間を使い技術の研究活動ができる CAゼミ制度において「自然言語処理を支えるツールをつくるゼミ」※3 を発足し、社内プロダクトでの導入および、OSS 化、人工知能学会での論文発表、ブログ執筆を行うなど、積極的な社会実装および学術貢献を行ってまいりました。
■研究概要
アノテーションツールの UI (User Interface) や UX (User Experience) は作業速度や品質に大きく寄与すると知られている一方、これまでスマートフォンなどのモバイル端末に特化したUI/UXは注目されていませんでした。
このような背景のもと本ゼミでは、「モバイル端末におけるUI/UXを重視した、応用タスク向けのアノテーションツールの開発・提案(開発アプリ:Fast Annotation tool for SmarT devices)」をおこないました。
今回採択された論文「FAST: Fast Annotation tool for SmarT devices」では、モバイルアプリケーションで親しみあるカード式の UI や、複数の選択肢をタップで簡単にアノテーションできる UI を実装し、評価実験を通して複数デバイスや UI 、既存ツールとの比較を行いました。
その結果、提案手法のモバイル操作では PC 端末と同等の速度と品質を維持しながらより使いやすい体験が提供可能なことを確認するとともに、既存のモバイル版アノテーションツールと比較して作業時間を約 43% 短縮するなど、作業効率の向上を可能にしました。
▼FASTの使用例
「EMNLP」は世界中の研究者によって定期開催される国際会議で、「ACL」「NAACL」※2と並び、自然言語処理分野(NLP)でもっとも権威ある国際会議のひとつです。EMNLP の「System Demonstration Track」は、NLPの理論や応用研究を踏まえた、技術面で革新的なシステムのデモンストレーションを行うセッションです。本セッションでは、NLP・AI 分野をリードする世界中のトップ企業や大学に所属する研究員や開発者が多数参加・発表を行い、今年の採択率は31% と、本会議と同様に難易度が非常に高いことで知られています。
本論文は、2021年11月にオンラインと現地で開催される「EMNLP 2021」での発表を予定しています。
■研究背景
近年、機械学習を活用したプロダクトの広がりとともにアノテーションの需要は高まりつつあります。
アノテーションとは、機械学習に用いるデータに対して人の手によって関連する情報を付与する作業のことです。アノテーションは、自動で正解が紐付かないタスクや、自然言語生成のような定量的な評価が難しいタスクに対して、人手によって一定の基準で擬似的な正解として定性的に評価することができるため、機械学習モデルの研究開発において非常に重要です。
さらに機械学習の精度向上には多くのデータを使用するため、大量のデータに対して継続的かつ効率的にアノテーション作業を行うことが必要とされており、それを実現する手段として「アノテーションツール」が広く活用されています。
こうした背景から、当社ではこの領域に対して研究に取り組んでおり、技術者のスキルアップ支援を目的に一定の業務時間を使い技術の研究活動ができる CAゼミ制度において「自然言語処理を支えるツールをつくるゼミ」※3 を発足し、社内プロダクトでの導入および、OSS 化、人工知能学会での論文発表、ブログ執筆を行うなど、積極的な社会実装および学術貢献を行ってまいりました。
■研究概要
アノテーションツールの UI (User Interface) や UX (User Experience) は作業速度や品質に大きく寄与すると知られている一方、これまでスマートフォンなどのモバイル端末に特化したUI/UXは注目されていませんでした。
このような背景のもと本ゼミでは、「モバイル端末におけるUI/UXを重視した、応用タスク向けのアノテーションツールの開発・提案(開発アプリ:Fast Annotation tool for SmarT devices)」をおこないました。
今回採択された論文「FAST: Fast Annotation tool for SmarT devices」では、モバイルアプリケーションで親しみあるカード式の UI や、複数の選択肢をタップで簡単にアノテーションできる UI を実装し、評価実験を通して複数デバイスや UI 、既存ツールとの比較を行いました。
その結果、提案手法のモバイル操作では PC 端末と同等の速度と品質を維持しながらより使いやすい体験が提供可能なことを確認するとともに、既存のモバイル版アノテーションツールと比較して作業時間を約 43% 短縮するなど、作業効率の向上を可能にしました。
▼FASTの使用例
■ 今後
今回開発したツールは社内導入・OSS 化を進めることで、機械学習技術の更なる精度向上につながることが期待できます。本ゼミは「自然言語処理を支えるツール」をこれからも開発し、より多くのサービスへの導入を推進するとともに、より高速で高品質なアノテーションの実現を目指してまいります。
当社は今後も、AI Labによる研究活動に加え、CAゼミ制度において技術者のスキルアップや好奇心を支援することで事業成長および、学術貢献と社会実装に努めてまいります。
※1「EMNLP」The Conference on Empirical Methods in Natural Language Processing
※2「NAACL」The Annual Conference of the North American Chapter of the Association for Computational Linguistics
「ACL」The Annual Meeting of the Association for Computational Linguistics
※3 ゼミ制度:業務時間の一部を使い技術の研究活動を行うことができるサイバーエージェントの制度
自然言語処理を支えるツールをつくるゼミ:自然言語処理に役立つツールを開発し、社会実装/学術貢献を目指すゼミ(川本峻頌、澤井悠、脇本宏平、張培楠が所属)
今回開発したツールは社内導入・OSS 化を進めることで、機械学習技術の更なる精度向上につながることが期待できます。本ゼミは「自然言語処理を支えるツール」をこれからも開発し、より多くのサービスへの導入を推進するとともに、より高速で高品質なアノテーションの実現を目指してまいります。
当社は今後も、AI Labによる研究活動に加え、CAゼミ制度において技術者のスキルアップや好奇心を支援することで事業成長および、学術貢献と社会実装に努めてまいります。
※1「EMNLP」The Conference on Empirical Methods in Natural Language Processing
※2「NAACL」The Annual Conference of the North American Chapter of the Association for Computational Linguistics
「ACL」The Annual Meeting of the Association for Computational Linguistics
※3 ゼミ制度:業務時間の一部を使い技術の研究活動を行うことができるサイバーエージェントの制度
自然言語処理を支えるツールをつくるゼミ:自然言語処理に役立つツールを開発し、社会実装/学術貢献を目指すゼミ(川本峻頌、澤井悠、脇本宏平、張培楠が所属)