「ABEMA」開発局 × 報道局が模索する、生成AIとニュース記事の可能性

技術・デザイン

サイバーエージェントでは、全社員向けに生成AIリスキリングを実施したり、業務効率化や既存サービス改善等を目的とした「生成AI徹底活用コンテスト」を開催する等、業務における生成AIの活用を推進しています。本インタビューでは、情報ニュースサイト「ABEMA TIMES」における生成AIを利用した編集業務の事例を紹介します。総合編成本部 報道局と開発局 MLエンジニアに、プロトタイプ開発における技術的なポイント、編集業務へ導入した結果と感じられる可能性について話をしました。

Profile

  • 大谷 広太 (株式会社AbemaTV 総合編成本部 報道局)
    2016年入社。ABEMA TIMES編集部とともにABEMA NEWSチャンネルで放送された番組の記事化業務を担う。

  • 加藤 諒 (株式会社AbemaTV 開発本部 開発局)
    2022年新卒入社。機械学習エンジニアとしてAmebaブログに用いられる機械学習モデルの開発を経て、現在は「ABEMA」で生成AIを活用したプロジェクトに従事。

ニュース記事 × 生成AIによる課題解決の可能性

── お二人の編集者 / MLエンジニアとしてのバックグラウンドを教えてください

大谷:私は前職含めて10年以上、Webメディアに関わってきた編集者で、2016年11月に株式会社AbemaTVに中途入社しました。入社後の配属先はニュース番組「ABEMA NEWS」のコンテンツを記事として発信するオウンドメディア「ABEMA TIMES」の編集部でした。2022年からは、総合編成本部 報道局の局長を務めています。

我々報道局のミッションは、報道チームが制作する番組を「ABEMA」のサービス内外でのマーケティング、「ABEMA TIMES」やYouTubeチャンネルなど様々な媒体を通して視聴者に届ける事です。

加藤:私は学生時代に、画像処理やコンピュータビジョンの研究をしていて、2022年にMLエンジニアとしてサイバーエージェントに入社しました。入社後「Amebaブログ」に配属され、画像を用いた広告のコンテキシャルターゲティングモデルの開発などMLエンジニアとして業務経験を積みました。2023年5月に株式会社AbemaTV開発局に異動しました。

現在はDX-AIチームで、主に生成AIを活用した「ABEMA」の業務改善やDX推進のための技術検証に携わっています。

── 異なるバックグラウンドを持つ二人が、「ABEMA TIMES」で関わることになった経緯を教えてください。

大谷:2023年頃から、生成AIがビジネス領域でも話題に上がることが増え、「ABEMA NEWS」でも、数々の専門家やゲストを招いて視聴者にお伝えしてきました。

同時に「ABEMA」における番組やコンテンツ制作において「生成AIを業務に活用する事で、制作スピードの向上やコスト削減などが実現できないか?」という議論が活発になってきました。

加藤:大谷たち制作サイドからのアイデアや、我々 開発局での技術検証に加え、専務執行役員の長瀬が生成AIの活用に前向きで「まずは企画やアイデアレベルで良いから、業務改善を目的としたPoC(Proof of Concept)を作ってみよう」と声をかけてくれました。

大谷:開発局のMLエンジニアからボトムアップなディスカッションや、長瀬自らの提案もあり、会社全体の「生成AIを最大限活用して、イノベーションを起こしていこう」という意気込みが感じられて心強かったです。

ビジネスや制作の現場において発生する課題に対して、社内のMLエンジニアやデータサイエンティストとすぐに連携ができるのは、サイバーエージェントの開発組織の強みだと思います。

生成AIを活用した記事。そのクオリティ担保と量産の模索

── 大谷さんが編集者の目線で見る「メディア運営や番組制作における課題点」とは何ですか?

大谷:長くメディア運営や編集に関わってきましたが、共通する課題の1つが「記事のクオリティを担保しつつも、記事のコンテンツ量と露出を増やし、メディアの認知度とブランディングを向上させる」という点です。

現代は、先行きが不透明な時代と言われます。そんな社会を駆け巡るニュースの量は膨大で、「ABEMA TIMES」を通して読者に伝えたい情報がたくさんあります。その一方、取材やライティングに割けるリソースや時間には限りがあります。そのため「一定以上のクオリティを担保した記事の量産」は、メディア運営にとっては至上命題とも言えます。

この課題に対して「生成AIの登場は大きな転換点になるかもしれない」と感じました。

── 「クオリティと量産」を担保するために、技術的にどんなアプローチから始めましたか?

加藤:まずMicrosoft Azureプラットフォーム内で提供されているAzure OpenAI Service等を活用して、「ABEMA NEWS」で配信された動画の記事生成を行える、PoCの開発から着手しました。このフェーズでは、音声文字起こしモデル「Whisper」や言語モデル「GPT-4」などの技術が「ABEMA TIMES」の編集業務においてどの程度実用に耐えうるかの調査、検証をする事を目的としました。

その際、「ABEMA TIMES」の表現スタイルや文脈の再現性を追求するために、in-context learningと呼ばれる、大規模言語モデルを少数のサンプルを活用してタスク実行を可能とする手法をとっています。通常の機械学習と違って、大量の整形済みデータを必要としないので「ABEMA TIMES」のような特定メディアのコンテンツ量産の迅速な実現に向いていると言えます。

また、プロトタイプの開発の際は、仮の試作品を編集のプロである「ABEMA TIMES」編集チームにレビューしてもらい、そのレビューを受けて改善した試作品を作り...といったチームを跨いだサイクルを回すことでブラッシュアップを図りました。

大谷:開発局より最終的に提案があったプロトタイプのクオリティは高く、短いニュース動画の記事生成であれば、原稿の初稿としては十分活用可能でした。それだけでなく、「ABEMA」で配信している動画の番組概要やタグを解析し、自動でカテゴリー分けを行うなどメタデータの拡充にも転用できる可能性も感じられました。

「『ABEMA TIMES』の編集業務に生成AIを活かせないか?」をきっかけに始まったプロジェクトですが、「ABEMA TIMES」における記事生成は、業務改善の可能性の一つに過ぎないと感じました。

── 「ABEMA TIMES」では、世の中で起きたニュースや社会問題に、読者が関心をもってもらうための「編集」という要素が重要かと思います。読者の感情に訴えかけたり、興味をもってもらうために、生成AIと人の手による編集のバランスをどう考えていますか?

大谷:興味を引くようなタイトルや、読み手の感情に訴えかけるような編集や文体は、編集者やライターならではの経験やセンスが重要になってきます。もちろん「ABEMA TIMES」でも、編集者が記事タイトルや見出しの選定や記事編集を担っています。

例えば、ある記者会見の中継があったとします。その記者会見において、どんなポイントに注目し、ニュースとして伝えていくかは、報道機関やテレビ局、ニュース媒体によって異なります。「ABEMA TIMES」が、「記者会見」という事象に対してどんな切り口で編集し読者に伝えていくか?そこに「ABEMA TIMES」ならではの読み応えや特徴があり、読者はその着眼点や切り口に魅力を感じてくれていると言えます。

加藤:人の手による編集と、生成AIによる効率化のバランスは、チーム内でも活発に議論しています。現在の生成AIでは、事実や情報をまとめて、簡潔に要約するという作業が向いています。その利点を活かして、天気予報やマーケットレポートなどソースとなる情報が存在し、それを記事の文体に変換するような活用が考えられます。その一方、長時間の記者会見や野球やサッカーの試合などを元にした「ライターとしての視点や編集が求められる記事は、編集者やライターの手による執筆が適していると言えます。

大谷:例えば「ABEMA TIMES」では、野球やサッカーなどの記事は専門のスポーツライターが執筆しています。この分野は、生成AIに代替するのが難しいと思います。なぜなら、スポーツは、試合結果や試合推移を事実として伝えるだけでは、読者が求める記事にはならないからです。野球であれば、今シーズンのペナントレース全体の流れや文脈、今日のナイターの意義やドラマなどは、何年もプロ野球を追ってきたライターにしか書けないコンテキストが必要だからです。

あくまで、視聴者や読み手はAIではなく人間なので、感情という要素は抜きにはできません。生成AIを業務に活用する際も、手段が目的にならないよう「誰のためにどんな記事を書き、読者に何を伝えたいか」は、常に意識しています。

加藤:これはまた別の視点ですが、生成AIの特徴として、学習データに含まれている過去のネットのアーカイブされた情報より未来の情報は考慮できないという点があります。また、仮にAPIを拡張して、今現在のネットの情報を動的に取得したとしても、たった今リアルタイムでライブ配信している記者会見の情報はキャッチアップできません。

今起きている事を、記者の目を通じてどう伝えるかは、人間に求められる仕事だと思います。

生成AIを活用したニュース記事制作の実績と今後の可能性

── 生成AIを記事制作に活用した結果、本プロジェクトではどんな成果を得られましたか?

加藤:本プロジェクトで開発した生成AIツールを試験的に導入した際は、記事の数を従来の約1.6倍に増加する事ができました。また「ABEMA TIMES」の記事から「ABEMA」の視聴への流入も、従来の約1.7倍に増加しました。

本プロジェクトの生成AIツール導入により、現時点で200本近くの記事に活用、一定のクオリティを維持する事ができ、結果的に「ABEMA」の視聴や業務改善へつなげる効果を果たしている事がわかりました。

大谷:生成AIに指示を出す「フォーマット」を作ったことで、元原稿を編集するような記事については、外部のライターに依頼していた作業を内製化できるコスト削減の成果がありました。文字起こしも同様に、外部依頼のコスト削減と、人の執筆を減らして編集に充てる時間を生み出すことに寄与しています。

── 今後、「ABEMA」のAI/DXを推進していくにあたって、将来的にどんな活用方法がイメージできそうでしょうか?

加藤:例えば、インフルエンザが流行する時期に、厚生労働省が発表している「インフルエンザの発生状況」等の統計データを参照し、現在の状況をわかりやすく伝える。といった記事の生成は現実性が高いと言えます。

また、記者会見等のライブ配信で「ABEMA」に寄せられるコメントが集中するシーンがあれば、それは視聴者がその発言に強い関心をもっていると言えます。そのシーンを抜粋し、コメントの内容を分析・要約し「ABEMA TIMES」の編集や見出しのヒントにする事といった事も考えられます。シーンの取捨選択を生成AIに任せるのではなく、データを根拠に決定するイメージですね。

大谷:コメントの書き込みが活発になっているシーンを即座に検知し、寄せられた意見の総意を把握する事により、そのシーンに関して速報として記事化するといった運用も可能になるかもしれません。こういった活用方法は、自社でニュースを配信をしている「ABEMA」ならではの強みだと思います。

── 生成AIを活用した記事制作に関して、メリットだけでなくデメリットの懸念もあります。例えば「検証されていない情報源」や「複数のウェブサイトや報道機関のサイトなどを参照する事による著作権侵害」といったリスクについてはどのように考えていますか?

加藤:リスクヘッジに関しては、取材を元に執筆された原稿や放送を元にした書き起こし原稿を、記事の文体に変換/要約するモデルとしてGPT4を用いています。質問にあったようなリスクについて、その情報源はGPT内部のデータではなくこれらがソースになっているので、信頼性がある程度担保されている状態です。

合わせて、記事に関しては必ず人のチェックとリライトが必ず入るような運用になっています。

生成AI時代における編集者とMLエンジニアのありかた

── 制作現場に生成AIツールが浸透していくと、編集者の仕事にも変化が現れると思います。具体的にはどのように変わると予想しますか?

大谷:生成AIを活用した制作により、一定のクオリティまでの水準には差分が生じにくくなります。クオリティが担保された上での均質化は、編集に限らず多くの制作において起きていく事かと思われます。

我々の業務においては、音声からの文字起こしの作業や、取材メモの整形・整理といった業務が、生成AIを活用することによって、より速く簡単に仕上がるようになっていくでしょう。

制作現場で今後求められるのは、AIに的確に指示をするための言語化能力や、ディレクション能力になります。AIツールをアシスタントのように活用する働き方が求められていくと思います。

それはかつて、紙に原稿を書いていた時代から、パソコンを使って原稿をタイピングする時代に変わったように、時代に合わせた適応能力が編集者にも求められているとも言えます。

サイバーエージェントでは全社員向けの生成AIリスキリング講座を実施していて、誰でも生成AIを学ぶことができる環境にあります。我々、報道局のメンバーも受講しましたが、6300名の社員が受講し、講義完了率99.6%とのことでした

生成AIリスキリング講座を受講してあらためて実感したのは「編集者だからこそ、生成AIについて正しく理解する必要がある」という点です。今回の「ABEMA TIMES」の生成AIプロジェクトを経て実感したのは、編集者がMLエンジニアと一緒に仕事をするのが、いずれは当たり前の時代になっていくかもしれないという点です。

技術的なトレンドや、生成AIのメリット・デメリットを把握した上で、編集者の立場から加藤のようなMLエンジニアに「こうしたい、こんなことはできないか?」という議論が求められます。

加藤:編集者が生成AIについて正しく理解する事で、要望や仕様の精度はグッとあがりますし、開発チームとの完成形の認識の齟齬がなくなって解決したい課題や実現したい未来の粒度があがります。

生成AIは世の中的なインパクトの大きさから、ともすると何でもできる魔法のツールに思われがちですが、使いこなすには正しい知識と理解が必要です。生成AIの利活用にあたってのメリット・デメリットまでを把握した上で、プロンプトを含めてどう指示を出すかが求められる技術と言えます。

── MLエンジニアの仕事のありかたはどのように変わると考えていますか?

加藤:MLエンジニアとしては、生成AIのことは単純に問題解決のために使える手札が増えたと捉えています。逆に言えば、生成AIは問題解決のための一手段に過ぎません。

手札が増えたということは、できることが増えたということ。より難しかったり時間がかかるようなことも以前よりも迅速にできるようになっているはずです。

生成AIを含めた手札たちをいかに組み合わせて問題解決を実現させるかが重要で、それを意識しながら仕事をしていくことになるのかなと考えています。

この記事をシェア

オフィシャルブログを見る

記事ランキング

サイバーエージェントのプロダクトリリースを支える「PipeCD」が、世界に通じるOSSになるまで。

技術・デザイン

サイバーエージェントが開発したOSS「PipeCD」は、KubernetesやGoogle Cloud Run、Amazon ECS、AWS Lambdaといった様々なプラットフォームで統一的なGitOpsスタイルのプログレッシブデリバリーを実現します。本プロダクトは、開発生産性を向上させるための専門組織「Developer Productivity室」によって開発・運用されており、社内では3,500以上のアプリケーションに利用されています。現在、社内外の多くのコントリビューターによる開発参加が進み、スター数の増加と共に成長を続けています。
2023年5月には、「PipeCD」がCloud Native Computing Foundation(CNCF)のSandboxプロジェクトに選定されました。Sandboxプロジェクトの選定基準には、成熟度・将来性・信頼性などがあり、全世界から96プロジェクトが選ばれています。日本発のプロジェクトが選ばれることは稀であり、継続的デリバリーシステムに特化した製品としては国内初の採択例です。
「PipeCD」の開発責任者であるTran Cong Khanhに、サイバーエージェントにおける導入事例や、開発エピソードを語ってもらいました。

Page Top